一种基于图像的病态声带智能辅助分析优化方法和装置制造方法及图纸

技术编号:35510979 阅读:19 留言:0更新日期:2022-11-09 14:25
本发明专利技术提供了一种基于图像的病态声带智能辅助分析优化方法和装置,所述方法包括:步骤1,提取输入特征;步骤2,获得作为真实输出数据的物理量;步骤3,划分数据集,得到训练集、验证集和测试集;步骤4,基于训练集和验证集,构建和训练神经网络;步骤5,用测试集评估神经网络预测性能。采用本发明专利技术方法可以快速准确地预测各种病态声带对应的流量和压力分布,能够应用于临床上针对病态声带的实时无创辅助诊疗。用于临床上针对病态声带的实时无创辅助诊疗。用于临床上针对病态声带的实时无创辅助诊疗。

【技术实现步骤摘要】
一种基于图像的病态声带智能辅助分析优化方法和装置


[0001]本专利技术属于计算流体力学、人工智能以及生物医学工程交叉的领域,尤其涉及一种基于图像的病态声带智能辅助分析优化方法和装置。

技术介绍

[0002]语音是人类进行交流最基本、最有效、最重要的手段。在语音的产生过程中,声带是最重要的发音器官,但同时也是最易受损伤和发生病变的部位,全世界有至少20%的人口被不同程度的发声障碍所困扰。针对发声过程的研究可以为患有发声障碍的人群带来更好的保障和福利,因此具有重要的理论研究意义和社会应用价值。
[0003]人体声带的发声过程涉及复杂的流固耦合(Fluid

Structure Interaction,FSI)现象,来自肺部的气流与声带软组织之间相互作用,引发声带的持续振动,从而调节通过声门气流的大小。发声障碍通常与声带病理相关,例如结节,囊肿,疤痕,麻痹等。这些病理改变了声带组织的几何形状和材料特性,导致产生不规则的黏膜波。目前临床针对病态声带的检查主要依赖电子喉镜,属于有创检查,虽然检查前会进行局部麻醉,但喉咽反射敏感的患者会存在不适。此外,目前常用的电子/频闪喉镜只能进行二维评估,缺乏立体视角,且相对主观,只适用于周期性的声带振动。喉部CT扫描能够对声带进行三维动态评估,检查出喉镜所看不到的黏膜下病变,且属于无创检查,患者不会出现不适感。此外,用于模拟声带振动的FSI数值模型在理解、诊断和治疗发声障碍中也一直发挥着重要作用,已经发展出了不少复杂程度各异的FSI模型。然而目前国内外所发展的声带振动FSI模型不是因为模型简化而无法保证计算结果的准确性,就是因为计算成本太高而无法付诸临床应用。这里的临床应用主要是指基于数值模拟的手术管理,如预测手术干预的结果、优化手术调整方案以及根据特定患者的解剖结构和需求提供个性化的诊疗方案。
[0004]近年来得益于人工智能和机器学习技术的快速发展,逐步发展出了数据驱动的流动预测模型。这类模型可以在保证计算准确性的同时显著减少计算时间,因此可用于替代耗时的基于第一性原理的流动模型,大大拓宽了应用的场景。比如,基于CFD技术的冠状动脉CT血流储备分数(CT

FFR)算法,在评估心肌缺血、指导治疗策略以及提供预后信息方面都具有显著的潜力。但由于CFD算法基于Navier

Stokes方程,需要使用超级计算机进行离散求解,耗时长且费用昂贵,限制了其在临床上的广泛应用。为此,研究人员提出了一种基于深度学习的模型,可以实时地从CT扫描图像中无创地预测出冠状动脉FFR,与有创的FFR相比,模型表现出较高的诊断准确性。
[0005]临床上针对病态声带的无创辅助诊疗也可以通过建立相应的数据驱动模型来实现。然而,目前国内外针对这方面的研究还很少。本专利技术基于合成的病态声带模型库提取得到的断层图像,构建一种三维卷积神经网络(3D

CNN)模型,快速准确地预测各种病态声带对应的流量和压力分布,实现实时无创的辅助诊疗,具有一定的理论研究意义和实际应用价值

技术实现思路

[0006]专利技术目的:本专利技术的目的在于克服传统CFD方法在病态声带的无创辅助诊疗中存在效率低下的缺点,基于合成的病态声带模型库提取得到的断层图像,提出了一种三维卷积神经网络(3D

CNN)模型,建立声带断层图像与对应的流量和压力分布之间的映射关系。病态声带的真实流量和压力分布通过高保真的尖锐界面浸没边界求解器得到。利用训练好的模型,可以快速准确地预测各种病态声带对应的流量和压力分布,有望应用于临床上针对病态声带的实时无创辅助诊疗。
[0007]本专利技术具体提供一种基于图像的病态声带智能辅助分析优化方法,包括:
[0008]首先基于声带振动的模态方程生成由若干合成病态声带形状构成的三维模型库,对模型库中的各种三维病态声带沿黏膜波传播方向进行二维切片,得到一系列灰度断层图像。接着,利用适合处理复杂外形的高保真尖锐界面浸没边界求解器获得各种病态声带的流量和压力分布。然后,通过三维卷积神经网络(3D

CNN)模型,建立声带断层图像与对应的流量和压力分布之间的映射关系。对神经网络进行训练并通过梯度下降算法调整优化超参数以最小化损失函数。最后,针对任一病态声带的断层图像,使用训练好的模型,快速准确地预测和重构对应的流量和压力分布,并对模型的预测性能进行评估。具体以下步骤:
[0009]步骤1,根据声带的振动模态方程生成病态声带三维几何外形,得到声带三维模型库;
[0010]步骤2,对声带三维模型库中的声带模型进行二维切片,得到三维输入矩阵;
[0011]步骤3,采用高保真浸没边界求解器获得真实物理数据;所述求解器基于有限差分离散、能够捕捉尖锐界面、采用高效的MPI(消息传递接口,Message Passing Interface)并行策略,此前已经过大量的数值算例验证其准确性和可靠性,因此求解得到的物理量可以作为真实的输出数据。
[0012]步骤4,采用随机分割算法对对声带三维模型库中的数据进行划分,得到训练集(128个)、验证集(32个)和测试集(20个);三维模型库中的数据由180个形状各异的合成声带对应的输入和输出矩阵构成,采用随机数据分割算法将其中的20组数据作为测试集,用于评估训练好的三维卷积神经网络的预测性能,剩下的160组数据按照80%和20%的比例划分成训练集和验证集,参与三维卷积神经网络的训练。
[0013]步骤5,基于训练集和验证集,构建并训练三维卷积神经网络(Convolutional Neural Network,CNN),保存训练得到的最优模型的权重;
[0014]步骤6,用测试集评估三维卷积神经网络预测性能。
[0015]步骤1包括:声带的振型g可看成声带初始形状ξ0与振动模态得到形状ξ的叠加,其表达式如式(1)所示,ξ0和ξ的表达式分别如式(2)和(3)所示:
[0016]g(y,z,t)=ξ0(y,z)+ξ(y,z,t)
ꢀꢀꢀ
(1)
[0017]ξ0(y,z)=(1

z/L)[ξ
02
+(ξ
01

ξ
02


B
y/T)(1

y/T)]ꢀꢀꢀꢀꢀꢀ
(2)
[0018]ξ(y,z,t)=ξ
m sin(mπz/L)[sinωt

n(ω/c)(y

y
m
)cosωt]ꢀꢀꢀꢀꢀ
(3)
[0019]其中,g(y,z,t)表示声带的振型函数,y和z分别代表声带振动的上下(inferior

superior)方向和前后(anterior

posterior)方向,上下、前后分别代表声带三维几何在y轴的端点和z轴的端点,上代表y_max,下本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图像的病态声带智能辅助分析优化方法和装置,其特征在于,具体包括以下步骤:步骤1,根据声带的振动模态方程生成病态声带三维几何外形,得到声带三维模型库;步骤2,对声带三维模型库中的声带模型进行二维切片,得到三维输入矩阵;步骤3,采用高保真浸没边界求解器获得真实物理数据;步骤4,采用随机分割算法对声带三维模型库中的数据进行划分,得到训练集、验证集和测试集;步骤5,基于训练集和验证集,构建并训练三维卷积神经网络,保存训练得到的最优模型的权重;步骤6,通过测试集评估三维卷积神经网络预测性能。2.根据权利要求1所述的方法,其特征在于,步骤1包括:声带的振型g看成声带初始形状ξ0与振动模态得到形状ξ的叠加,表达式如式(1)所示,ξ0和ξ的表达式分别如式(2)和(3)所示:g(y,z,t)=ξ0(y,z)+ξ(y,z,t)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)ξ0(y,z)=(1

z/L)[ξ
02
+(ξ
01

ξ
02


B
y/T)(1

y/T)]
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)ξ(y,z,t)=ξ
m
sin(mπz/L)[sinωt

n(ω/c)(y

y
m
)cosωt]
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)其中,g(y,z,t)表示声带的振型函数,y和z分别代表声带振动的上下方向和前后方向,上下、前后分别代表声带三维几何在y轴的端点和z轴的端点,上代表y_max,下代表y_min,前代表z_max,后代表z_min,t表示时间;ξ
01
、ξ
02
、ξ
B
分别对应声门入口半宽、声门出口半宽和表面凸起系数,T和L分别代表声门的厚度和长度,ξ
m
表示模态位移幅值,y
m
表示垂直半波长的拐点,ω表示角频率,c表示黏膜波的传播速度,m和n分别表示沿z和y方向振动的模态数;通过改变公式(1)、(2)、(3)中的参数,包括ξ
01
、ξ
02
、ξ
B
、y
m
、ω,合成各种形状的声带,构成声带三维模型库。3.根据权利要求2所述的方法,其特征在于,步骤2包括:对声带三维模型库中的各种三维病态声带沿黏膜波传播方向进行二维切片,提取出一系列灰度断层图像,将每个灰度断层图像切片转换为二值矩阵并沿黏膜波传播方向进行堆叠,得到能够完整反映声带几何信息的三维输入矩阵X;对三维输入矩阵X进行归一化操作。4.根据权利要求3所述的方法,其特征在于,步骤3包括:建立如下声门流动的控制方程:其中u
i
,ρ,p,ν分别表示流体的速度、密度、压强和运动粘性系数,表示偏导数;采用适合复杂声带外形的尖锐界面浸没边界方法离散求解控制方...

【专利技术属性】
技术研发人员:张扬濮天梅徐笳森郭睿康
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1