一种基于自然语音的抑郁症自动评估系统技术方案

技术编号:38324672 阅读:20 留言:0更新日期:2023-07-29 09:06
本发明专利技术公开了一种基于自然语音的抑郁症自动评估系统,属于计算机辅助医疗诊断技术领域。包括:语音获取模块,获取音频数据信息;处理模块,与语音获取模块连接,将音频数据信息进行处理,得到有效的频域信号;特征提取模块,与处理模块连接,提取有效的频域信号中的情绪特征信息,并对不同情绪特征信息进行标注,得到对应的情绪特征信息标签结果;绘制模块,与特征提取模块连接,基于绘制情绪波动曲线图;输出模块,与处理模块连接,基于情绪波动曲线图得到评估结果并输出显示。本发明专利技术通过后台模型分析大量的用户数据得出用户抑郁监测结论,评估抑郁状态,能够有效降低成本,输出更准确的评估结果,为抑郁症的临床诊断提供客观参考。考。考。

【技术实现步骤摘要】
一种基于自然语音的抑郁症自动评估系统


[0001]本专利技术涉及计算机辅助医疗诊断
,更具体的说是涉及一种基于自然语音的抑郁症自动评估系统。

技术介绍

[0002]抑郁症是一种常见的精神障碍,其三个主要症状是持续的情绪低落、兴趣减退和精力不足。首先,传统的抑郁症评估大多是靠专业人员,其主观意识强烈,评估缺少客观的测量方法和工具,主要依靠家属供史、患者自述以及临床量表等主观评估方法,再加上患者隐藏真实病情的原因,可能会导致评估效率低甚至评估结果无效。其次评估过程耗时、昂贵,对于有经济困难的人来说,评估费用可能是一个沉重的负担。
[0003]随着语音信号分析与处理技术的发展,通过深度学习模型整合多模态特征对于抑郁症评估尤其有前途,但是,现有深度学习模型较多,结构较为复杂,如支持向量机(svm)、潜在狄利克雷分配(lda)、K最近邻算法(knn)、反射系数因子(rf)、线性高斯(lg)以及卷积神经网络(cnn),且自然语言的音频特征复杂,传统的深度学习模型无法满足基于自然语音的抑郁症自动评估。同时,在广泛应用中,线上抑郁评估的方式通常是采用用户回答问题的方式进行检测,并没有直接采用机器学习的后台对用户的语音数据进行采集和分析。
[0004]因此,如何提供一种基于自然语音的抑郁症自动评估系统是本领域技术人员亟需解决的问题。

技术实现思路

[0005]有鉴于此,本专利技术提供了一种基于自然语音的抑郁症自动评估系统,用以解决上述现有技术中存在的技术问题。
[0006]为了实现上述目的,本专利技术提供如下技术方案:
[0007]一种基于自然语音的抑郁症自动评估系统,包括:
[0008]语音获取模块,获取音频数据信息;
[0009]处理模块,与所述语音获取模块连接,将所述音频数据信息进行处理,得到有效的频域信号;
[0010]特征提取模块,与所述处理模块连接,提取有效的频域信号中的情绪特征信息,并对不同情绪特征信息进行标注,得到对应的情绪特征信息标签结果;
[0011]绘制模块,与所述特征提取模块连接,基于绘制情绪波动曲线图;
[0012]输出模块,与所述处理模块连接,基于情绪波动曲线图得到评估结果并输出显示。
[0013]优选的,所述处理模块包括:
[0014]预处理单元,通过高通滤波器将音频数据信息进行预处理,得到预处理后的音频数据信息;
[0015]分帧单元,将预处理后的音频数据信息进行分帧处理;
[0016]加窗单元,使用汉明窗函数对单位帧的音频数据信息进行加窗处理;
[0017]变换单元,使用快速傅里叶变换将音频数据信息的音频信号变换为频域信号;
[0018]滤波单元,通过三角带通滤波器组对频域信号进行滤波,并计算滤波器组的对数能量,得到有效的频域信号。
[0019]优选的,所述预处理单元,通过高通滤波器将音频数据信息进行预处理,得到预处理后的音频数据信息,公式如下:
[0020]H(Z)=1

μz
‑1;
[0021]式中,Z为预加重系数,μ为预加重系数。
[0022]优选的,所述加窗单元,使用汉明窗函数对单位帧的音频数据信息进行加窗处理,公式如下:
[0023]W(n)=0.54

0.46cos(2πn/N

1);
[0024]式中,W(1)表示窗口函数的值,n表示当前的采样点数,N表示采样点的总数;
[0025]S'(n)=S(n)
×
W(n);
[0026]式中,S(n)表示当前采样位置的值,S'(n)表示加窗之后的值。
[0027]优选的,所述变换单元,使用快速傅里叶变换将音频数据信息的音频信号变换为频域信号,具体公式为:
[0028][0029]式中,X
a
(n)为输出的频域信号。
[0030]优选的,所述滤波单元,通过三角带通滤波器组对频域信号进行滤波,并计算滤波器组的对数能量,得到有效的频域信号,具体公式为:
[0031]计算三角滤波器的频率响应:
[0032][0033]式中,f为频率,n为当前的采样点数,其中,n为当前的采样点数;
[0034]计算对数能量:
[0035][0036]式中,N为采样点总数,n为当前的采样点数,k无实际意义,起累加作用。
[0037]优选的,所述特征提取模块包括:
[0038]计算单元,基于有效的频域信号计算梅尔倒谱系数;
[0039]获取单元,获取音频信号的样本数据集,并将样本数据集划分为训练数据集及测试数据集;
[0040]特征提取单元,构建卷积神经网络模型,并根据所述训练数据集对所述卷积神经网络模型进行训练,得到优化后的卷积神经网络模型,将梅尔倒谱系数作为优化后的卷积神经网络模型的输入,输出不同情绪特征信息;
[0041]标注单元,与所述特征提取单元连接,基于测试数据集对不同情绪特征信息进行标注,得到对应的情绪特征信息标签结果。
[0042]优选的,所述计算单元,计算梅尔倒谱系数,包括:经离散余弦变换得到梅尔倒谱系数,公式如下:
[0043][0044]式中,M是三角滤波器个数,n为当前采样点数,s(n)为对数能量。
[0045]优选的,所述卷积神经网络模型的结构包括一次连接的一维卷积层,第一二维卷积层、第二二维卷积层以及全连接层;
[0046]其中,第一层为所述一维卷积层,包括:64个5*1卷积核,步长为1,进行批处理,使每一层神经网络的输入保持相同分布,dropout比率是0.2,2*2最大值池化,步长为1,激活函数选用Relu;
[0047]第二层为所述第一二维卷积层,包括:32个3*3卷积核,步长为1,进行批处理,使每一层神经网络的输入保持相同分布,dropout比率是0.2,2*2最大值池化,步长为1,激活函数选用Relu;
[0048]第三层:2维卷积,包括:32个3*3卷积核,步长为1,进行批处理,使每一层神经网络的输入保持相同分布,2*2最大值池化,dropout比率是0.2,步长为2,激活函数选用Relu;
[0049]第四层:全连接层,包括:1024个神经元,dropout比率0.2,激活函数选用Relu。
[0050]优选的,标注单元包括:标签分类器及域分类器;
[0051]其中,所述标签分类器包括:
[0052]第一层:全连接层,256个神经元,dropout比率0.2,激活函数选用Relu;
[0053]第二层:全连接层,64个神经元,dropout比率0.2,激活函数选用Relu;
[0054]第三层:输出层,2个神经元,激活函数为Softmax;
[0055]所述域分类器包括:
[0056]第一层:全连接层,64个神经元,dropout比率0.2,激活函数选用Relu;...

【技术保护点】

【技术特征摘要】
1.一种基于自然语音的抑郁症自动评估系统,其特征在于,包括:语音获取模块,获取音频数据信息;处理模块,与所述语音获取模块连接,将所述音频数据信息进行处理,得到有效的频域信号;特征提取模块,与所述处理模块连接,提取有效的频域信号中的情绪特征信息,并对不同情绪特征信息进行标注,得到对应的情绪特征信息标签结果;绘制模块,与所述特征提取模块连接,基于绘制情绪波动曲线图;输出模块,与所述处理模块连接,基于情绪波动曲线图得到评估结果并输出显示。2.根据权利要求1所述的一种基于自然语音的抑郁症自动评估系统,其特征在于,所述处理模块包括:预处理单元,通过高通滤波器将音频数据信息进行预处理,得到预处理后的音频数据信息;分帧单元,将预处理后的音频数据信息进行分帧处理;加窗单元,使用汉明窗函数对单位帧的音频数据信息进行加窗处理;变换单元,使用快速傅里叶变换将音频数据信息的音频信号变换为频域信号;滤波单元,通过三角带通滤波器组对频域信号进行滤波,并计算滤波器组的对数能量,得到有效的频域信号。3.根据权利要求2所述的一种基于自然语音的抑郁症自动评估系统,其特征在于,所述预处理单元,通过高通滤波器将音频数据信息进行预处理,得到预处理后的音频数据信息,公式如下:H(Z)=1

μz
‑1;式中,Z为预加重系数,μ为预加重系数。4.根据权利要求2所述的一种基于自然语音的抑郁症自动评估系统,其特征在于,所述加窗单元,使用汉明窗函数对单位帧的音频数据信息进行加窗处理,公式如下:W(n)=0.54

0.46cos(2πn/N

1);式中,W(1)表示窗口函数的值,n表示当前的采样点数,N表示采祥点的总数;S

(n)=S(n)
×
W(n);式中,S(n)表示当前采样位置的值,S

(n)表示加窗之后的值。5.根据权利要求2所述的一种基于自然语音的抑郁症自动评估系统,其特征在于,所述变换单元,使用快速傅里叶变换将音频数据信息的音频信号变换为频域信号,具体公式为:式中,X
a
(n)为输出的频域信号。6.根据权利要求2所述的一种基于自然语音的抑郁症自动评估系统,其特征在于,所述滤波单元,通过三角带通滤波器组对频域信号进行滤波,并计算滤波器组的对数能量,得到有效的频域信号,具体公式为:计算三角滤波器的频率响应:
式中,f为频率,n为当前的采样点数,其中,n为当前的采样点数;计算对数能量:式中,N为采样点总数,n为当...

【专利技术属性】
技术研发人员:赵祥红周文华王琦翔马龙华周东升练斌蔡卫明崔家林秦圣杰吴伟李浩朱琳姜轶剑李世聪刘意林
申请(专利权)人:浙大宁波理工学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1