System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及抑郁症检测,具体涉及基于三支决策的文本知识增强抑郁症检测系统。
技术介绍
1、抑郁症是一种常见的心理疾病,影响着全世界数亿人的生活质量。据世卫组织报道,抑郁症一直是世界面临的重大健康挑战,有超过2.8亿人受到影响。然而因为患者自身对这样的精神状况感到耻辱,他们并不会主动寻求临床意义上的帮助,这导致抑郁症具有很高的威胁性。但研究表明,抑郁症可以通过人们的写作方式表现出来,这有助于基于文本的分析。随着社交媒体成为我们日常生活中不可或缺的一部分,twitter、facebook、微博等社交平台层出不穷,人们不断转向这些社交媒体平台来分享自己的感受,由于社交网络天生的匿名性,人们更愿意在这样的平台畅所欲言,用户生成的海量文本中隐藏着宝贵的心理健康信息,这些文本往往会对用户的生活点滴进行描述,并透露出他们的心理状态,越来越多的人愿意在网络上吐露心声,这使得社交媒体文本中的文字线索有助于发现抑郁信号,也为利用社交媒体数据检测抑郁症提供了新的可能性。
2、与其他自然语言处理任务类似,抑郁症检测也需要很强的上下文建模能力来有效捕获用户言辞中的线索和情感迹象。早年的工作使用卷积神经网络(cnn)或循环神经网络(rnn)从帖子中捕获语义信息。然而,近年来,预训练语言模型(plms)的崛起已经改变了这一领域的格局。bert、elmo和gpt这样的预训练语言模型,展现出了卓越的情境建模能力,因此在心理健康状况检测中变得越来越受欢迎。然而,抑郁症检测仍然比其他相关任务更复杂,因为它不仅需要对语义信息进行建模,情感信息也是不可或缺
技术实现思路
1、本专利技术所要解决的技术问题在于现有技术抑郁症检测系统检测结果片面化,不够准确的问题。
2、本专利技术通过以下技术手段解决上述技术问题的:基于三支决策的文本知识增强抑郁症检测系统,包括:
3、模板获取模块,用于根据临床量表和显性抑郁表达构建抑郁症检测模板;
4、帖子筛选模块,用于利用抑郁症检测模板获取每个用户抑郁程度最高的r条帖子;
5、帖子清洗模块,用于利用三支决策对帖子进行清洗,生成外部知识;
6、嵌入处理模块,用于筛选生成的外部知识,对帖子和筛选后的外部知识进行嵌入得到帖子和所选外部知识的特征向量;
7、文本感知模块,用于将注意力权重分配给所选外部知识的特征向量,得到文本感知的知识;
8、信息融合模块,用于动态融合帖子的语义信息和情感信息,得到每条帖子最终的表示向量,其中,帖子的特征向量为语义信息,文本感知的知识为情感信息;
9、结果输出模块,用于把用户所有的帖子最终的表示向量聚合成用户特征,根据用户特征对该用户进行抑郁检测。
10、进一步地,所述模板获取模块用于:
11、将精神病学量表bdi-ii和三个显性抑郁表达:“我感到抑郁”、“我被确诊为抑郁”、“我正在治疗我的抑郁症”组合在一起,作为抑郁检测模板。
12、进一步地,所述帖子筛选模块用于:
13、使用sentence-transformers模型分别对用户帖子和抑郁模板进行嵌入得到它们的特征向量,然后利用相似度计算函数计算每个帖子模板对之间的余弦相似度,并以此为依据筛选相似度分数靠前的r条帖子,作为每个用户抑郁程度最高的r条帖子。
14、更进一步地,所述相似度计算函数表示为:
15、
16、其中,u和v分别为帖子的特征向量和抑郁模板的特征向量,n是它们的维数,i表示第i个对应的特征向量。
17、更进一步地,所述帖子清洗模块用于:
18、利用帖子筛选模块的相似度分数,引入三支决策划分上下界,超出上下界的部分,抑郁和非抑郁倾向较为明显,对处于上下界之间的相似度分数对应的帖子模板对,使用comet模型生成外部知识。
19、进一步地,所述嵌入处理模块用于:
20、将外部知识作为给定知识集合k={k1,k2,...,kb},k中的每个ki都是一个候选知识,b是候选知识的数量,利用情感词典sentiwordnet计算情感极性,情感极性相加的得分大于0,则选择得分大于0的候选知识,如果该得分小于0,则选择得分小于0的候选知识,筛选后得到新的知识集合ks={k′1,k′2,...,k′c},c是符合条件的外部知识的数量,分别对帖子和筛选后的外部知识进行嵌入得到帖子和所选外部知识的特征向量tenc和ksenc,特征向量tenc为帖子的语义信息,特征向量ksenc为帖子的情感信息。
21、进一步地,所述文本感知模块用于:
22、利用注意力机制,将注意力权重分配给所选的外部知识,得到文本感知的知识,表示为:
23、
24、其中,tenc是帖子的特征向量,ksenc是所选外部知识的特征向量,kstenc是文本感知的知识特征向量。
25、进一步地,所述信息融合模块用于:
26、对所选外部知识的特征向量ksenc进行平均池化,得到表示知识的单个向量ksmean,然后将帖子的特征向量tenc中的每个表示与知识的单个向量ksmean连接起来,通过公式获得门控机制的权重向量α,其中,wg是一个可学习的参数,sigmoid是一种常用的激活函数;
27、利用公式引入残差结构将文本信息和知识信息结合在一起,其中,ln表示层归一化操作,wb是另一个可学习的参数,在此之后通过公式在上使用前馈网络和另一个残差连接,得到每条帖子最终的表示向量z,其中,mlp表示多层感知机。
28、进一步地,所述结果输出模块用于:
29、对用户所有帖子的最终的表示向量之间的关系以及它们的时间顺序进行建模,通过公式z′1,z′2,...,z′r=transformer(z1,z2,...,zr)生成每条帖子的上下文表示{z′1,z′2,...,z′r},并将这些上下文表示聚合得到一个用户特征u中,其中,zr为第r个帖子的最终的表示向量,z′r为第r个帖子的上下文表示;
30、用户特征u的公式为其中,αr为帖子嵌入的权重且其中,w和b为注意力池化层中线性变换的可学习权重矩阵和偏置项,exp表示自然指数函数,z′r为第r个帖子的上下文表示,这里相当于利用softmax函数对r个帖子进行归一化表示,从而将其映射成概率分布,用于确定每个帖子在最终输出中的权重;
31、最后根据用户特征本文档来自技高网...
【技术保护点】
1.基于三支决策的文本知识增强抑郁症检测系统,其特征在于,包括:
2.根据权利要求1所述的基于三支决策的文本知识增强抑郁症检测系统,其特征在于,所述模板获取模块用于:
3.根据权利要求1所述的基于三支决策的文本知识增强抑郁症检测系统,其特征在于,所述帖子筛选模块用于:
4.根据权利要求3所述的基于三支决策的文本知识增强抑郁症检测系统,其特征在于,所述相似度计算函数表示为:
5.根据权利要求3所述的基于三支决策的文本知识增强抑郁症检测系统,其特征在于,所述帖子清洗模块用于:
6.根据权利要求1所述的基于三支决策的文本知识增强抑郁症检测系统,其特征在于,所述嵌入处理模块用于:
7.根据权利要求1所述的基于三支决策的文本知识增强抑郁症检测系统,其特征在于,所述文本感知模块用于:
8.根据权利要求1所述的基于三支决策的文本知识增强抑郁症检测系统,其特征在于,所述信息融合模块用于:
9.根据权利要求1所述的基于三支决策的文本知识增强抑郁症检测系统,其特征在于,所述结果输出模块用于:
...
【技术特征摘要】
1.基于三支决策的文本知识增强抑郁症检测系统,其特征在于,包括:
2.根据权利要求1所述的基于三支决策的文本知识增强抑郁症检测系统,其特征在于,所述模板获取模块用于:
3.根据权利要求1所述的基于三支决策的文本知识增强抑郁症检测系统,其特征在于,所述帖子筛选模块用于:
4.根据权利要求3所述的基于三支决策的文本知识增强抑郁症检测系统,其特征在于,所述相似度计算函数表示为:
5.根据权利要求3所述的基于三支决策的文本知识增强抑郁症检测系统,其特征在于,所述帖子清洗模块用于:
6.根据权利要求1...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。