多模态言语评估系统技术方案

技术编号：38563102 阅读：7 留言：0更新日期：2023-08-22 21:02

本发明专利技术公开了多模态语音评估系统。包括采集数据的设备方法，言语诊断算法的构建，诊断交互系统的界面及使用。采集数据使用相机，超声探头，麦克风并设计承载相机的机构，并使用串口的方法适时提取数据后进行对齐。数据进入后由KALDI的GOP特征提取方法，Block WHT

全部详细技术资料下载

【技术实现步骤摘要】
多模态言语评估系统

[0001]本专利技术涉及语音信号处理领域，具体为一种采集数据后进行运算并输出可视化结果的多模态言语评估系统。

技术介绍

[0002]目前，在言语评估领域，市面上存在一些产品，如“健朗医疗”的言语训练康复系统，“COGNI”的言语认知训练评估系统，“人来康复”的言语认知康复评定和训练系统，这些系统都能对病人的言语进行评估。
[0003]但是就具体的内容来看，这种诊断系统或是依赖医生诊断，系统仅仅提供展示页面以及记录处理数据，匹配训练语句，或是只对患者的语音信号进行诊断，仅仅依靠患者的语音来判断患者言语障碍等级，而对于形成语音这一言语过程无法进行涉及。
[0004]由于发声是一个综合性的结果，发音除了产生语音这一实际结果之外，其伴随的唇的运动，舌的运动也是言语障碍患者可能区别于正常人的言语特征，同时舌的运动与唇的运动与形成言语这一过程有关，也可以作为言语患者与正常人的重要区分特征来判断言语障碍级别，而随着信号提取和处理技术的发展，提取处理后的唇和超声舌图像已有足够的可靠用于人工智能医疗诊断用途。
[0005]为解决上述问题，我们开发出一种新型多模态言语评估系统用于言语的诊断。

技术实现思路

[0006]为解决上述技术问题，本专利技术采用如下技术方案：本专利技术提供一种多模态言语评估系统，其特征在于，包括语音信号提取模块、唇部图像捕捉模块、超声舌图像采集模块和上位机电脑；所述语音信号提取模块为上位机电脑自带麦克风，用于对语音信号进行提取；所述唇部图像捕捉模块为佩...

【技术保护点】

【技术特征摘要】
1.多模态言语评估系统，其特征在于，包括语音信号提取模块、唇部图像捕捉模块、超声舌图像采集模块和上位机电脑；所述语音信号提取模块为上位机电脑自带麦克风，用于对语音信号进行提取；所述唇部图像捕捉模块为佩戴固定机架的摄像头，用于对患者说话时的唇部图像进行捕捉采集；所述超声舌图像采集模块为超声探头，用于对患者说话时的舌图像进行采集；所述上位机电脑用于接收语音信号提取模块、唇部图像捕捉模块以及超声舌图像采集模块传输的语音信号、唇部图像信号以及超声舌图像信号，并将其按时间同步；上位机电脑将唇图像和舌图像进行切割，以减少提取特征中的噪音干扰；对于言语信号，使用KALDI中的GOP特征提取工具，提取语音的GOP特征；上位机电脑对于超声舌图像和唇部图像，运用Block WHT
‑
PCA方法提取其特征；上位机电脑对于原始的文本数据，分割为具体的标准音素，对具体音素提取特征同样进行输入；上位机电脑将上述提取到的不包括原始文本所得的言语特征，进行处理后进行加和...

【专利技术属性】
技术研发人员：郭向阳，魏建国，何宇清，王芳，金成曦，孔信柯，张钲基，
申请(专利权)人：天津大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人