【技术实现步骤摘要】
一种基于图像的病态声带智能辅助分析优化方法和装置
[0001]本专利技术属于计算流体力学、人工智能以及生物医学工程交叉的领域,尤其涉及一种基于图像的病态声带智能辅助分析优化方法和装置。
技术介绍
[0002]语音是人类进行交流最基本、最有效、最重要的手段。在语音的产生过程中,声带是最重要的发音器官,但同时也是最易受损伤和发生病变的部位,全世界有至少20%的人口被不同程度的发声障碍所困扰。针对发声过程的研究可以为患有发声障碍的人群带来更好的保障和福利,因此具有重要的理论研究意义和社会应用价值。
[0003]人体声带的发声过程涉及复杂的流固耦合(Fluid
‑
Structure Interaction,FSI)现象,来自肺部的气流与声带软组织之间相互作用,引发声带的持续振动,从而调节通过声门气流的大小。发声障碍通常与声带病理相关,例如结节,囊肿,疤痕,麻痹等。这些病理改变了声带组织的几何形状和材料特性,导致产生不规则的黏膜波。目前临床针对病态声带的检查主要依赖电子喉镜,属于有创检查,虽然检查前会进行局部麻醉,但喉咽反射敏感的患者会存在不适。此外,目前常用的电子/频闪喉镜只能进行二维评估,缺乏立体视角,且相对主观,只适用于周期性的声带振动。喉部CT扫描能够对声带进行三维动态评估,检查出喉镜所看不到的黏膜下病变,且属于无创检查,患者不会出现不适感。此外,用于模拟声带振动的FSI数值模型在理解、诊断和治疗发声障碍中也一直发挥着重要作用,已经发展出了不少复杂程度各异的FSI模型。然而目前国内外所发展的声 ...
【技术保护点】
【技术特征摘要】
1.一种基于图像的病态声带智能辅助分析优化方法和装置,其特征在于,具体包括以下步骤:步骤1,根据声带的振动模态方程生成病态声带三维几何外形,得到声带三维模型库;步骤2,对声带三维模型库中的声带模型进行二维切片,得到三维输入矩阵;步骤3,采用高保真浸没边界求解器获得真实物理数据;步骤4,采用随机分割算法对声带三维模型库中的数据进行划分,得到训练集、验证集和测试集;步骤5,基于训练集和验证集,构建并训练三维卷积神经网络,保存训练得到的最优模型的权重;步骤6,通过测试集评估三维卷积神经网络预测性能。2.根据权利要求1所述的方法,其特征在于,步骤1包括:声带的振型g看成声带初始形状ξ0与振动模态得到形状ξ的叠加,表达式如式(1)所示,ξ0和ξ的表达式分别如式(2)和(3)所示:g(y,z,t)=ξ0(y,z)+ξ(y,z,t)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)ξ0(y,z)=(1
‑
z/L)[ξ
02
+(ξ
01
‑
ξ
02
‑
4ξ
B
y/T)(1
‑
y/T)]
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)ξ(y,z,t)=ξ
m
sin(mπz/L)[sinωt
‑
n(ω/c)(y
‑
y
m
)cosωt]
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)其中,g(y,z,t)表示声带的振型函数,y和z分别代表声带振动的上下方向和前后方向,上下、前后分别代表声带三维几何在y轴的端点和z轴的端点,上代表y_max,下代表y_min,前代表z_max,后代表z_min,t表示时间;ξ
01
、ξ
02
、ξ
B
分别对应声门入口半宽、声门出口半宽和表面凸起系数,T和L分别代表声门的厚度和长度,ξ
m
表示模态位移幅值,y
m
表示垂直半波长的拐点,ω表示角频率,c表示黏膜波的传播速度,m和n分别表示沿z和y方向振动的模态数;通过改变公式(1)、(2)、(3)中的参数,包括ξ
01
、ξ
02
、ξ
B
、y
m
、ω,合成各种形状的声带,构成声带三维模型库。3.根据权利要求2所述的方法,其特征在于,步骤2包括:对声带三维模型库中的各种三维病态声带沿黏膜波传播方向进行二维切片,提取出一系列灰度断层图像,将每个灰度断层图像切片转换为二值矩阵并沿黏膜波传播方向进行堆叠,得到能够完整反映声带几何信息的三维输入矩阵X;对三维输入矩阵X进行归一化操作。4.根据权利要求3所述的方法,其特征在于,步骤3包括:建立如下声门流动的控制方程:其中u
i
,ρ,p,ν分别表示流体的速度、密度、压强和运动粘性系数,表示偏导数;采用适合复杂声带外形的尖锐界面浸没边界方法离散求解控制方...
【专利技术属性】
技术研发人员:张扬,濮天梅,徐笳森,郭睿康,
申请(专利权)人:南京航空航天大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。