一种结合精准模型与轻量级模型的抑郁症识别方法及系统技术方案

技术编号：41504609 阅读：5 留言：0更新日期：2024-05-30 14:45

本发明专利技术提供一种结合精准模型与轻量级模型的抑郁症识别方法及系统，涉及语音识别技术领域，包括获取受访者的原始语音数据，预处理得到第一语音数据；构建教师模型和学生模型，并对教师模型和学生模型进行训练；将第一语音数据输入训练后的学生模型中进行抑郁症检测，得到第一语音数据的检测结果，检测结果为抑郁或无抑郁，将检测结果为抑郁的第一语音数据作为第二语音数据；将第二语音数据输入训练后的教师模型中进行抑郁程度识别，得到第二语音数据的识别结果。本发明专利技术不仅能快速筛查是否抑郁，还能实现对抑郁程度的精准识别，能够为抑郁症的早期检测提供一种有效辅助支持手段。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音识别，尤其涉及一种结合精准模型与轻量级模型的抑郁症识别方法及系统。

技术介绍

1、抑郁症是一种常见的精神障碍，涉及长时间情绪低落或失去快乐或对活动的兴趣。根据世界卫生组织的不完全统计，全球约有3.5亿人患有不同程度的抑郁症。抑郁症的发病机制和病理学原理尚未明确，临床诊断只能根据患者的自我描述和相关信息进行主观诊断，缺乏客观的定量评价指标。此外，精神病理学评估通常需要丰富的专业知识支持，而且耗时长、评测项目繁多，不利于抑郁症的早期快速确诊。

2、近年来，使用生物材料样本进行抑郁症的客观评估引起许多研究者的关注，比如使用细胞因子或者唾液等，但生物材料样本的获取通常是侵入性的，并且对其进行分析检测的成本较高。与此同时，基于生理信号的抑郁症自动检测方法也进入人们的视野，生理信号主要包括心率、脑电、皮肤电、核磁、睡眠生理数据等信号，但上述生理信号的获取需要大量的人力物力、低精密度、技术门槛高、不易推广，并且生理状态和情感状态之间的相互作用仍有待在可穿戴设备的帮助下进行研究，数据获取具有挑战性，并且存在个人隐私泄露的风险。

3、由于抑郁症患者和非抑郁症患者之间的声学特征存在显著差异，一些研究开始聚焦于使用语音信号进行抑郁症检测，并证实了使用语音信号检测抑郁症的可行性。此外，录音设备的普及率高、录音成本低、语音信号的获取相对简单且无侵入性，进一步提高了使用语音信号检测抑郁症的可行性。随着深度学习方法的发展，一些研究开始尝试将其应用于抑郁症检测。诸如无监督编码，基于注意力机制的转换器（transform

4、目前，在使用语音数据进行抑郁症识别方面仍然存在数据规模不足、模型泛化性能有待提高等挑战。此外，对抑郁症的识别研究主要局限于单一语言的二分类任务，鲜有对抑郁症严重程度进行多分类研究以及跨语言的抑郁症识别检测。因此跨语言的语音抑郁症自动化早期快速筛查与精准诊断有重要的实际意义与广阔的应用前景。

技术实现思路

1、有鉴于此，本专利技术提供一种结合精准模型与轻量级模型的抑郁症识别方法及系统，不仅可快速筛查是否抑郁，还对抑郁程度进行精准识别，能够为抑郁症的早期检测提供一种有效辅助支持手段。

2、本专利技术的技术目的是这样实现的：

3、一方面，一种结合精准模型与轻量级模型的抑郁症识别方法，包括以下步骤：

4、s1：获取受访者的原始语音数据，对原始语音数据进行语音活动检测和预处理，得到第一语音数据；

5、s2：构建教师模型和学生模型，并对教师模型和学生模型进行训练，其中，训练时，先对教师模型进行抑郁程度识别的迭代训练，再基于训练后的教师模型对学生模型进行抑郁症检测的迭代训练；

6、s3：将第一语音数据输入训练后的学生模型中进行抑郁症检测，得到第一语音数据的检测结果，检测结果为抑郁或无抑郁，将检测结果为抑郁的第一语音数据作为第二语音数据；

7、s4：将第二语音数据输入训练后的教师模型中进行抑郁程度识别，得到第二语音数据的识别结果。

8、在上述技术方案的基础上，优选的，步骤s1包括：

9、s11：获取受访者的原始语音数据，采用基于短时能量和短时平均过零率的动态双门限端点检测方法对原始语音数据进行语音活动检测，得到有效语音数据；

10、s12：将有效语音数据进行预处理，对有效语音数据的语音信号按照时序关系进行前后拼接，得到第一语音数据。

11、在上述技术方案的基础上，优选的，步骤s11包括：

12、计算原始语音数据中语音前导静默片段平均能量值和短时平均过零率，作为背景噪声平均能量值和背景噪声短时平均过零率，并获取原始语音数据的语音信号，计算语音信号的短时平均能量值；

13、设置第一阈值t1、第二阈值t2和第三阈值t3，其中，t1=背景噪声平均能量值，t2=短时平均能量值，t3=背景噪声短时平均过零率；

14、在语音信号中针对每个短时时间段内的能量值进行计算，并将能量值连接形成一条曲线，作为短时能量包络线，其中，短时能量包络线用于表示语音信号在时间上的能量变化；

15、将t2与短时能量包络线进行比对，在短时能量包络线中查询与t2重合的点，作为第一交点；

16、将t2与短时能量包络线进行粗判，将短时能量包络线中高于t2的曲线部分判定为有效能量包络线，其中，第一交点位于有效能量包络线上；

17、将t1与有效能量包络线重合的点作为第二交点，在有效能量包络线上从第一交点开始沿曲线路径进行搜索，将搜索到的第二交点作为候选点，根据语音信号的能量值波动趋势在候选点中选取两个第二交点，作为第一起止点对，包括第一起点和第一止点，将第一起点和第一止点之间的曲线作为第一曲线段；

18、在有效能量包络线上从第一起止点对开始分别沿曲线路径的远离第一曲线段的两个方向进行搜索，寻找有效能量包络线上能量值低于t3的点：

19、从第一起点开始沿曲线路径的远离第一曲线段的方向进行搜索，当搜索到首个能量值低于t3的点，即停止该方向的搜索，将该点作为第二起点；

20、从第一止点开始沿曲线路径的远离第一曲线段的方向进行搜索，当搜索到首个能量值低于t3的点，将该点作为第二候选止点，计算第二候选止点的静音区域长度，判断静音区域长度是否满足最小长度，若满足，则将第二候选止点作为第二止点，并结束搜索；若不满足，则继续搜索下一个能量值低于t3的点，直至静音区域长度满足最小长度，得到第二止点；

21、将第二起点和第二止点之间的语音数据作为有效语音数据。

22、在上述技术方案的基础上，优选的，步骤s2中，教师模型包括第一多尺度特征编码器、第一特征融合模块、上下文网络、量化模块和bi-lstm网络；学生模型包括第二多尺度特征编码器、第二特征融合模块和lstm网络；

23、其中，第一多尺度特征编码器由三个不同尺度的第一特征编码器构成，每个第一特征编码器包括7层一维卷积层，第一层一维卷积层采用组归一化计算输出，其余层一维卷积层采用层归一化计算输出；

24、第二多尺度特征编码器由三个不同尺度的第二特征编码器构成，每个第二特征编码器包括4层一维卷积层。

25、在上述技术方案的基础上，优选的，教师模型的训练过程为：

26、获取语音训练数据x，x包含真实分类，其中，语音训练数据为跨语言数据集；

27、将语音训练数据x输入第一多尺度特征编码器，经三个第一特征编码器处理后得到三个特征向量序列z1、z2和z本文档来自技高网...

【技术保护点】

1.一种结合精准模型与轻量级模型的抑郁症识别方法，其特征在于，包括以下步骤：

2.如权利要求1所述的一种结合精准模型与轻量级模型的抑郁症识别方法，其特征在于，步骤S1包括：

3.如权利要求2所述的一种结合精准模型与轻量级模型的抑郁症识别方法，其特征在于，步骤S11包括：

4.如权利要求1所述的一种结合精准模型与轻量级模型的抑郁症识别方法，其特征在于，步骤S2中，教师模型包括第一多尺度特征编码器、第一特征融合模块、上下文网络、量化模块和Bi-LSTM网络；学生模型包括第二多尺度特征编码器、第二特征融合模块和LSTM网络；

5.如权利要求4所述的一种结合精准模型与轻量级模型的抑郁症识别方法，其特征在于，教师模型的训练过程为：

6.如权利要求5所述的一种结合精准模型与轻量级模型的抑郁症识别方法，其特征在于，在训练教师模型时，冻结教师模型中量化模块和上下文网络的参数，调整第一多尺度特征编码器、第一特征融合模块和Bi-LSTM网络的参数。

7.如权利要求5所述的一种结合精准模型与轻量级模型的抑郁症识别方法，其特征在于，学生模型的训练过程为：

8.如权利要求7所述的一种结合精准模型与轻量级模型的抑郁症识别方法，其特征在于，映射关系为：

9.如权利要求8所述的一种结合精准模型与轻量级模型的抑郁症识别方法，其特征在于，蒸馏损失的计算公式为：

10.一种结合精准模型与轻量级模型的抑郁症识别系统，其特征在于，所述系统用于执行所述权利要求1-9任一项所述的方法，所述系统包括：

...

【技术特征摘要】

1.一种结合精准模型与轻量级模型的抑郁症识别方法，其特征在于，包括以下步骤：

2.如权利要求1所述的一种结合精准模型与轻量级模型的抑郁症识别方法，其特征在于，步骤s1包括：

3.如权利要求2所述的一种结合精准模型与轻量级模型的抑郁症识别方法，其特征在于，步骤s11包括：

4.如权利要求1所述的一种结合精准模型与轻量级模型的抑郁症识别方法，其特征在于，步骤s2中，教师模型包括第一多尺度特征编码器、第一特征融合模块、上下文网络、量化模块和bi-lstm网络；学生模型包括第二多尺度特征编码器、第二特征融合模块和lstm网络；

5.如权利要求4所述的一种结合精准模型与轻量级模型的抑郁症识别方法，其特征在于，教师模型的训练过程为：

6...

【专利技术属性】
技术研发人员：张莉，廖义龙，黄祥胜，王芳，高原，徐振戎，
申请(专利权)人：中南民族大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人