一种超声图像降噪的各向异性扩散算法,在MSE(均值方差)、PSNR(峰值信噪比)和边缘保护三个方面的评价都要优于传统的超声图像降噪算法,也同时提高了语音识别的准确率,推动了AVSR项目的发展。
An anisotropic diffusion algorithm for ultrasonic image denoising
【技术实现步骤摘要】
一种超声图像降噪的各向异性扩散算法
本专利技术属于人工智能、医学超声影像领域,具体涉及一种超声图像降噪的各向异性扩散算法。
技术介绍
超声波成像会在超声图像中形成信号相关的光斑,对于光斑噪声的降噪工作,传统方法多为空间域滤波方法,如均值滤波、中值滤波、Sigma滤波、Lee滤波等。如果想要增强降噪效果,就需要选取较大的滤波窗口,如果想要保持图像的边缘信息,就需要选取的较小的窗口,因此空间域滤波自身存在着矛盾,这也是空间域滤波的典型缺陷。基于各向异性扩散滤波的方法作为非线性滤波方法,改进了传统的超声图像降噪方法,利用归一化局部方差和梯度设计合理的扩散系数,增强了模型的局部自适应能力,在抑制斑点噪声的同时能够保持较好的边缘信息,获得较好的降噪效果。
技术实现思路
针对现有技术中存在的技术问题,本专利技术一种超声图像降噪的各向异性扩散算法,基于超声图像与音频流的双模态语音项目(AVSR)的研究,对超声图像进行降噪等预处理,有利于提高语音识别的准确率,推动AVSR项目的发展。一种超声图像降噪的各向异性扩散算法,其步骤如下:步骤一:使用超声仪、摄像头、麦克风等设备组成多模态发声数据采集系统采集并获取嘴唇的超声图像和人的语音信息。多模态发声数据采集系统由超声数据采集系统、唇部数据采集系统以及音频数据采集系统三个子系统组成。超声数据采集系统使用TerasonT3000便携式超声仪(超声探头型号为8MC3)、AppleMac控制机、超声系统软件和配套的SDK开发包。在录制数据过程中,需要将这些设备连接到一起,获取超声图像。唇部数据采集系统使用两台IOIndustries公司的工业高速CMOS场扫描相机FlareCL,2M360CCL型号分别获得说话人的正面图像和侧面图像。音频数据采集系统使用Roland公司的OCTA-CAPTUREUA-1010的外置声卡采集声音信息,可以将单路声学信号分成两路信号,并且通过信号增益控制噪声影响。步骤二:从理论上分析最近邻插值算法、双线性插值算法和立方卷积插值算法三种图像缩放的方法,并且进行了相关系数的计算,比较各种算法的优缺点。最近邻插值算法计算简单,运算量小,运行时间非常快,对于图像质量要求不高的情况下,可以采用最近邻插值算法。最近邻插值算法单纯以缩放比例进行插值,不考虑周围其他像素点的值,目标图像中会出现较为明显的锯齿现象。双线性插值算法考虑四个邻近像素点的特征,在两个方向上进行插值后得到目标像素值。双线性插值方法改善了最近邻插值算法图像不连续的情况,图像质量较好,然而该算法只考虑四个临近像素点的像素值,没有考虑邻接点的变化率,因此具有低通滤波的性质,缩放后图像高频分量损失过多。立方卷积插值算法由于立方卷积插值函数的性质,立方卷积插值算法可以得到连续的插值函数,其一阶偏导数是连续的,且交叉导数处处连续。因为考虑到像素邻接点变化率的影响,立方卷积插值算法的效果要优于双线性插值算法,图像缩放后几乎没有锯齿现象,且能量损失很少。但是立方卷积插值算法需要解十六个方程,因此其时间消耗略大。步骤三:从理论上分析基于扩散的超声图像降噪方法,建立正确的降噪模型,并分析边缘强度与扩散门限的关系,设计扩散系数模型,并且对SRAD算法模型进行改进。步骤四:根据去相关最优停止准则控制迭代次数,对降噪效果进行评估,然后调节扩散系数与迭代次数,修正降噪模型,通过实验提高降噪效果。步骤五:对比其他降噪方法,从图像缩放对比图、MSE、PSNR、边缘保护等方面对各种算法进行评估,然后对改进的算法进行优化。一种超声图像降噪的各向异性扩散算法,提供的各向异性扩散算法在实验中在MSE(均方误差)、PSNR(峰值信噪比)、边缘保护三个方面的降噪表现都要优于传统算法和SRAD算法,提取的轮廓也更加准确和完整。附图说明图1是图像处理过程流程图;图2是算法效果图;图3算法表现对比图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面对本专利技术实施方式作进一步地详细描述。多模态数据采集系统主要由三个子系统组成:超声数据采集系统、唇部数据采集系统以及音频数据采集系统。主要的实验设备有:超声仪*1,工业高速摄像头*2,麦克风*1,柔光灯*3,声卡*1等。设备数据采集参数如下:唇部信息:两台高速工业摄像头记录唇部运动,采样频率为每秒60fps(framepersecond)超声信息:TerasonT3000超声仪记录舌头运动的超声图像,采样频率为94.7fps。语音信息:由Mic记录说话人的语音信息,采样频率为44100Hz。实验中,我们通过一体机远程连接视频采集工作站,控制软件录制实时图像,通过调整三台柔光灯的距离、角度等保证图像不存在暗影。已经具备的超声仪能够自主采集超声数据,采集到的超声数据可以直接用于降噪过程及后期测试分析。实验使用matlab和Python的混合编程来实现,结合已有基于扩散的降噪算法,对其进行扩展改进。采集到带噪的超声图像以后我们首先对其进行图像缩放处理,然后在缩放基础上进行图像降噪。得到降噪后的图像我们会对其进行特征提取,将提取后的特征写成矩阵格式,类似地,我们对唇部图像进行特征提取,将两个模态的数据通过一定的融合方法,如特征融合、决策融合等,将融合后的特征作为HTK的输入,使用HTK进行连续语音识别。超声图像所特有的斑点噪声对于图像特征提取等后续处理过程存在较严重的影响,为了获得质量较好的超声图像,我们实现了传统的均值滤波算法、中值滤波算法、Lee滤波器、Frost滤波器、Kuan滤波器、经典的PM模型滤波、SRAD模型滤波以及我们改进后的SRAD滤波等多种算法进行超声降噪。图1为图像处理过程流程图,降噪后的图像我们会对其进行特征提取,将提取后的特征写成矩阵格式,类似地,我们对唇部图像进行特征提取,将两个模态的数据通过一定的融合方法,如特征融合、决策融合等,将融合后的特征作为HTK的输入,使用HTK进行连续语音识别。通过边缘检测算子的效果来看,KAD能够使得降噪和边缘检测同时达到最有效地效果。PM算法不能抑制由于乘法所产生的变化大的高斯噪声,并且经过PM算法处理后的图像峰值处于边缘地带。Catte_PM算法一定程度上降低了PM算法的尖峰现象,但是图像的边缘也是相当模糊的。AMD算法能够增强图像的边缘信息,但是会产生块状效果,不利于后续处理过程,并且,AMD的边缘图像中存在一些伪边缘的现象。NCD算法有效地降低了噪声水平,但是其产生的伪边缘在后期处理过程中需要额外的处理。图2总结了各种算法在均方误差和结构相似性上的表现。在每个实验中,我们通过设置不同的高斯噪声方差来控制乘性噪声的级别。图3给出了PM,Catte_PM,AMD和KAD四种算法在被高斯噪声污染的合成图像上的表现。本文档来自技高网...
【技术保护点】
1.一种超声图像降噪的各向异性扩散算法,其特征在于,该方法包括以下步骤:/n步骤一:使用超声仪、摄像头、麦克风等设备组成多模态发声数据采集系统采集并获取嘴唇的超声图像和人的语音信息;/n步骤二:从理论上分析最近邻插值算法、双线性插值算法和立方卷积插值算法三种图像缩放的方法,并且进行了相关系数的计算,比较各种算法的优缺点;/n步骤三:从理论上分析基于扩散的超声图像降噪方法,建立正确的降噪模型,并分析边缘强度与扩散门限的关系,设计扩散系数模型,并且对SRAD算法模型进行改进,引入核方法,解决了多种非线性可分问题,能够进更好的进行信噪分离,能够进行更好的降噪和边缘检测;/n步骤四:根据去相关最优停止准则控制迭代次数,对降噪效果进行评估,然后调节扩散系数与迭代次数,修正降噪模型,通过实验提高降噪效果;/n步骤五:对比其他降噪方法,从图像缩放对比图、MSE、PSNR、边缘保护方面对各种算法进行评估,然后对改进的算法进行优化。/n
【技术特征摘要】
1.一种超声图像降噪的各向异性扩散算法,其特征在于,该方法包括以下步骤:
步骤一:使用超声仪、摄像头、麦克风等设备组成多模态发声数据采集系统采集并获取嘴唇的超声图像和人的语音信息;
步骤二:从理论上分析最近邻插值算法、双线性插值算法和立方卷积插值算法三种图像缩放的方法,并且进行了相关系数的计算,比较各种算法的优缺点;
步骤三:从理论上分析基于扩散的超声图像降噪方法,建立正确的降噪模型,并分析边缘强度与...
【专利技术属性】
技术研发人员:王建荣,龚一航,于健,喻梅,于瑞国,徐天一,赵满坤,高洁,高晓妮,
申请(专利权)人:天津大学青岛海洋技术研究院,
类型:发明
国别省市:山东;37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。