System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及情绪识别,具体涉及一种基于联合标记分布学习的面部抑郁识别方法。
技术介绍
1、抑郁症是一种常见的精神障碍,得了抑郁症的人通常会产生悲伤、自我否定的情绪,对人的健康和生活造成严重危害。临床上而言,抑郁症的诊断通常依赖于心理医生的主观评估,这一过程需要专业的心理知识,难以进行早期抑郁症诊断的大规模推广。因此,近年来自动化抑郁症诊断在临床研究中引起了广泛关注,尤其是随着深度学习与计算机视觉相关技术的进步,基于面部图像的抑郁识别方法吸引了研究人员的广泛关注。随着摄像设备的普及,研究人员能够获取到大量人脸图像数据,将这些人脸图像用于构建面部抑郁识别系统,并部署于终端系统,有望实现早期抑郁症诊断的大规模推广。
2、总体而言,现有方法大抵将面部抑郁识别问题当作一个单标记beck depressioninventories (bdi)-ii分值学习与预测问题。bdi-ii分值取值为0到63,数值越大表示抑郁程度越严重。基于深度学习的面部抑郁识别方法首先利用单标记bdi-ii分值标注的人脸图像数据训练一个深度神经网络(如卷机深度网络或transformer),接着利用训练好的网络对新的人脸图像的bdi-ii分值进行预测。然而,现有方法仍面临着以下三点挑战:
3、第一是缺少充足的有标注的人脸图像数据集。bdi-ii分值是根据21个bdi-ii问卷进行评估(每个问卷的评分范围为0到3)得到,因此数据集的标注过程较为困难,获取到充足的有标注数据集的代价高昂。缺少充足的有标注数据集导致了现有基于深度学习的面部抑郁识别
4、第二是忽略了bdi-ii分值标注存在的不确定性与不准确性。bdi-ii问卷的不同选项间具有一定的模糊性,受评估者也通常会选择一个差不多的选项,这就导致bdi-ii分值本身就具有一定的不确定性与不准确。例如,一张bdi-ii分值标注为20的人脸图像,也会有一定的概率标注为19或21。现有方法将bdi-ii分值当作绝对正确的标记,忽略了标准过程存在的不确定性,导致识别性能不稳定。
5、第三是训练过程未考虑抑郁程度等级。现有方法的训练过程通常只通过bdi-ii分值来训练一个预测模型,但实际应用中往往需要给出抑郁程度等级的诊断,例如轻度、中等、严重等不同等级。bdi-ii分值与抑郁等级分别从细粒度与粗粒度衡量了一张人脸的抑郁信息,两者之间存在着强关联关系,然而现有方法在训练过程中却忽略了抑郁程度等级,导致模型在进行抑郁等级诊断时性能欠佳。
技术实现思路
1、在本专利技术的目的在于克服现有技术的不足,提供一种基于联合标记分布学习的面部抑郁识别方法。
2、本专利技术的目的是通过以下技术方案来实现的:
3、本专利技术公开了一种基于联合标记分布学习的面部抑郁识别方法,包括以下步骤:
4、s1、抑郁分值分布生成:将面部图像作为训练数据,每张面部图像标注为一个单标记bdi- ii值,作为其所对应的描述度,所有描述度的和等于1,用于表示人脸的抑郁严重分程度,其中bdi-ii分值的取值为0到63,通过高斯分布生成每张面部图像的抑郁分值分布;
5、s2、抑郁分值分布学习:设计一个68维输出的深度网络模型,其中前64维用于学习抑郁分值分布,每张面部图像包括学习真实的抑郁分值和邻域内的分值;
6、s3、抑郁等级分布学习:68维输出的深度网络模型的后4位用于学习抑郁等级分布,抑郁等级分布包括真实的抑郁等级的描述度,还包括其它等级的描述度;
7、s4、联合标记分布学习:设计一个多任务联合标记分布学习框架,联合学习抑郁分值分布与抑郁等级分布。
8、进一步地,所述的步骤s1具体包括以下步骤:
9、s11、设训练数据为,,其中表示第张面部图像,为第张面部图像对应的单标记bdi-ii抑郁分值;对于第张面部图像,通过高斯分布生成对应的抑郁分值分布,其中为抑郁分值,是标准差通常设置为1, 为均值,为标准差;
10、s12、通过公式进行归一化,其中为归一化参数;抑郁分值对应的描述度构成一个64维的标记分布=,其中表示抑郁分值对于的描述度,到表示所有的取值,生成每张面部图像的抑郁分值分布。
11、优选地,所述步骤s2具体包括以下步骤:
12、s21、设计一个68维输出的深度网络模型,其中前64维到用于学习抑郁分值分布,经过softmax函数之后,第j维输出为:;预测的抑郁分值分布为;
13、s22、设计两个损失函数来学习抑郁分值分布,首先利用kl散度设计第一损失函数学习整体的抑郁分值分布;
14、s23、预测的抑郁分值等于预测的抑郁分值分布的均值,即等于,使其靠近真实的bdi-ii抑郁分值,通过绝对值设计第二损失函数来学习真实的抑郁分值。
15、优选地,所述步骤s3具体包括以下步骤:
16、s31、将预测抑郁分值分布转化预测抑郁等级分布:,其中为抑郁等级,表示对应的抑郁分值区间,即区间内分值的预测描述度和作为对应等级的预测描述度,得到映射的预测抑郁等级分布;利用kl散度设计第三损失函数来学习抑郁等级分布;
17、s32、深度网络模型最后4维到用于学习抑郁等级分布,添加softmax函数之后第维的预测描述度等于;得到预测抑郁等级分布;设计kl散度设计第四损失函数用于学习抑郁等级分布;
18、s33、对于,基于抑郁分值设计第五损失函数,其中是一个常数,为真实的抑郁等级;若真实抑郁等级的预测描述度高于其它等级时,第五损失为0,反之则产生一个正的惩罚。
19、优选地,所述步骤s4具体包括:设计第六损失函数来训练所述68维输出的深度网络模型,其中所述深度网络模型通过混合多头交叉注意力网络架构进行训练,,。
20、优选地,所述步骤s4还包括:所述深度网络模型还通过现有卷积神经网络或transformer模型进行训练。
21、本专利技术的有益效果是:
22、1)本专利技术将单标记的bdi-ii分值转化成64维的标记分布,其中每个元素表示了对应分值与人脸图像的关联程度,一张人脸图像既与真实的bdi-ii分值相关,也与邻域内的其它分值相关,从而解决了单标记bdi-ii分值标注不确定性问题。
23、2)与学习单标记的bdi-ii分值相比较,通过学习64维的标记分布,一张人脸图像既可以用于真实的bdi-ii分值的学习,也可用于邻域内其它分值的学习,因此还能起到增广训练数据的效果。
24、3)本专利技术联合学习抑郁分值分布与等级分布,通过两者的学习起到相互促进的效果,既能提高了抑郁分值预测的准确性,也能提高了抑郁等级诊断的精度。
本文档来自技高网...【技术保护点】
1.一种基于联合标记分布学习的面部抑郁识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于联合标记分布学习的面部抑郁识别方法,其特征在于,所述的步骤S1具体包括以下步骤:
3.根据权利要求2所述的一种基于联合标记分布学习的面部抑郁识别方法,其特征在于,所述步骤S2具体包括以下步骤:
4.根据权利要求3所述的一种基于联合标记分布学习的面部抑郁识别方法,其特征在于,所述步骤S3具体包括以下步骤:
5.根据权利要求4所述的一种基于联合标记分布学习的面部抑郁识别方法,其特征在于,所述步骤S4具体包括:
6.根据权利要求5所述的一种基于联合标记分布学习的面部抑郁识别方法,其特征在于,所述步骤S4还包括:所述深度网络模型还通过现有卷积神经网络或Transformer模型进行训练。
【技术特征摘要】
1.一种基于联合标记分布学习的面部抑郁识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于联合标记分布学习的面部抑郁识别方法,其特征在于,所述的步骤s1具体包括以下步骤:
3.根据权利要求2所述的一种基于联合标记分布学习的面部抑郁识别方法,其特征在于,所述步骤s2具体包括以下步骤:
4.根据权利要求3所述的一种基于联合标记...
【专利技术属性】
技术研发人员:姜华茂,王朝,刘永伟,郑华川,刘丽,李芳,王靖,王昊,
申请(专利权)人:锦州医科大学附属第一医院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。