一种脑卒中构音障碍语音识别方法及装置制造方法及图纸

技术编号：43534296 阅读：15 留言：0更新日期：2024-12-03 12:18

本申请公开了一种脑卒中构音障碍语音识别方法及装置，本申请的技术方案通过对获取到的语音样本数据，根据音频所代表的音节类别以及正常和患者进行分类，并通过变换获得音频语谱图，然后在构建网络模型阶段，前端网络利用植物形态生理学设计核心处理模块，以STEM模块后连续的Downsample构成根茎，以快速运输计算节点到更高的感受野领域，后端网络则基于Xception模块基于的深度可分离卷积与注意力机制的交替配置，形成藤蔓交叉结构，注意力机制被有选择地置于交替的卷积模块中，以此提高对关键语音特征的识别能力和准确性，从而能够在多个尺度上捕捉全局感受野，准确学习和判别脑卒中病理显著特征信息，解决了现有的脑卒中患者构音分析存在准确度低的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及计算机，尤其涉及一种脑卒中构音障碍语音识别方法及装置。

技术介绍

1、计算机技术，尤其是机器学习和深度学习，已经成为医疗病理语音分析领域的核心技术。这些先进的计算模型能够处理和分析大量的语音数据，从中识别出可能与特定疾病相关的微妙声学变化。例如，卷积神经网络（cnn）和循环神经网络（rnn）通过学习语音样本的庞大数据集，能够自动提取和识别与各种脑卒中相关的关键声学特征。

2、在病理语音数据处理中，关键步骤包括声学特征的精确提取和有效表示。技术如声谱图和mel频率倒谱系数（mfcc）等信号处理方法，在机器学习框架下被用来提取具有诊断价值的声音属性。这些特征随后被用作训练数据，以训练深度学习模型，使其能够在新的语音样本中识别出病理状态。

3、然而，在实际应用中，由于脑卒中患者的语音样本质量普遍偏低，分析难度较大，需要依赖算力性能更强的大模型，导致采用常规的轻量化神经网络模型对脑卒中患者构音分析存在准确度低的技术问题。

技术实现思路

1、本申请提供了一种脑卒中构音障碍语音识别方法及装置，用于解决现有基于轻量化神经网络模型的脑卒中患者构音分析存在准确度低的技术问题。

2、为解决上述技术问题，本申请第一方面提供了一种脑卒中构音障碍语音识别方法，包括：

3、获取预设的语音样本数据，其中，所述语音样本数据包括：成对的构音障碍语音样本数据和正常语音样本数据；

4、对所述语音样本数据进行音节分类处理，得到多个语音音节数据；

...

【技术保护点】

1.一种脑卒中构音障碍语音识别方法，其特征在于，包括：

2.根据权利要求1所述的一种脑卒中构音障碍语音识别方法，其特征在于，所述语音音节数据的种类包括：单元音语音音节数据、复合元音语音音节数据、辅音语音音节数据及鼻元音语音音节数据。

3.根据权利要求1所述的一种脑卒中构音障碍语音识别方法，其特征在于，所述将各个所述语音音节数据，转换成对应的语谱图数据具体包括：

4.根据权利要求1所述的一种脑卒中构音障碍语音识别方法，其特征在于，还包括：

5.根据权利要求1所述的一种脑卒中构音障碍语音识别方法，其特征在于，将各个所述语音音节数据，转换成对应的语谱图数据之后还包括：

6.一种脑卒中构音障碍语音识别装置，其特征在于，包括：

7.根据权利要求6所述的一种脑卒中构音障碍语音识别装置，其特征在于，所述语音音节数据的种类包括：单元音语音音节数据、复合元音语音音节数据、辅音语音音节数据及鼻元音语音音节数据。

8.根据权利要求6所述的一种脑卒中构音障碍语音识别装置，其特征在于，所述语谱图转化单元具体用于：

<...

【技术特征摘要】

1.一种脑卒中构音障碍语音识别方法，其特征在于，包括：

3.根据权利要求1所述的一种脑卒中构音障碍语音识别方法，其特征在于，所述将各个所述语音音节数据，转换成对应的语谱图数据具体包括：

4.根据权利要求1所述的一种脑卒中构音障碍语音识别方法，其特征在于，还包括：

5.根据权利要求1所述的一种脑卒中构音障碍语音识别方法，其特征在于，将各个所述语音音节数据，转换成对应的语谱图数据之...

【专利技术属性】
技术研发人员：叶武剑，杨东东，刘怡俊，郑颖聪，
申请(专利权)人：广东工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人