本申请提供了一种问答文本的情绪识别方法、装置及电子设备,提取出与所有预设主题对应的多个问答文本对;针对每个预设主题,该预设主题对应的所有问答文本对转换为特征向量,并形成与该预设主题对应的提问文本向量序列和应答文本向量序列;通过注意力机制对提问文本向量序列和应答文本向量序列进行信息交互,以生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量;通过门控融合机制对该预设主题对应的目标提问文本特征向量和目标应答文本特征向量进行信息融合并拼接;将所有预设主题对应的问答拼接特征向量按顺序进行拼接,以确定出情绪识别结果,通过关注问答文本的结构特点,可以进一步提升情绪识别的准确性。的准确性。的准确性。
【技术实现步骤摘要】
一种问答文本的情绪识别方法、装置及电子设备
[0001]本申请涉及文本识别
,具体而言,涉及一种问答文本的情绪识别方法、装置及电子设备。
技术介绍
[0002]近年来,基于深度学习的模型成为了文本分类模型的主流,其中主要的模型包括RNN,CNN等。在这些基础深度模型的基础之上,一些工作着眼于将不同角度的信息融入到文本分类任务当中,并取得了成功。
[0003]语言和对话是医生诊断和治疗精神疾病的主要数据来源,将人工智能技术应用于患者的分析,可以帮助精神疾病的预警。而现有的抑郁症识别方法,通常直接拼接问答文本进行识别,效果不佳,因此需要进一步提升识别的准确性。
技术实现思路
[0004]有鉴于此,本申请的目的在于提供一种问答文本的情绪识别方法、装置及电子设备,通过关注问答文本的结构特点,可以进一步提升情绪识别的准确性。
[0005]第一方面,本申请提供了一种问答文本的情绪识别方法,方法包括:对目标问答文本进行处理,以提取出与所有预设主题对应的多个问答文本对,每个问答文本对包括提问文本和对应的应答文本;针对每个预设主题,将该预设主题对应的所有问答文本对转换为特征向量,并形成与该预设主题对应的提问文本向量序列和应答文本向量序列;针对每个预设主题,通过注意力机制对提问文本向量序列和应答文本向量序列进行信息交互,以生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量;针对每个预设主题,通过门控融合机制对该预设主题对应的目标提问文本特征向量和目标应答文本特征向量进行信息融合并拼接,以生成问答拼接特征向量;将所有预设主题对应的问答拼接特征向量按顺序进行拼接,以确定出情绪识别结果,情绪识别结果用于指示目标问答文本所表达的情绪的健康程度。
[0006]优选的,通过以下方式确定出情绪识别结果:将所有预设主题对应的问答拼接特征向量按顺序进行拼接,以获取主题拼接特征;通过自注意力机制对主题拼接特征进行信息融合,以生成主题融合特征;将主题融合特征输入前馈神经网络,以输出情绪特征向量,情绪特征向量用于指示目标问答文本所表达的情绪;基于情绪特征向量,计算出目标问答文本所表达的情绪为目标情绪的概率值、目标问答文本所表达的情绪为非目标情绪的概率值。
[0007]优选的,通过以下方式对目标问答文本进行处理:确定出目标问答文本中的所有问答文本对;针对每个问答文本对,基于文本情绪的相似度,确定该问答文本对所表达的主题是否为预设主题中的一个,若是,则将该问答文本对作为该预设主题对应的一个问答文本对。
[0008]优选的,针对每个预设主题,通过以下方式形成于该预设主题对应的提问文本向
量序列和应答文本向量序列:将该预设主题所对应的所有问答文本对输入预先训练好的BERT模型进行向量转换,以输出提问文本向量序列和应答文本向量序列。
[0009]优选的,针对每个预设主题,通过以下方式生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量:将提问文本向量序列和应答文本向量序列输入预先训练好的多头注意力机制模型,以输出第一信息交互结果和第二信息交互结果;将第一信息交互结果和提问文本向量序列输入归一层,以输出目标提问文本特征向量;将第二信息交互结果和应答文本向量序列输入归一层,以输出目标应答文本特征向量。
[0010]优选的,针对每个预设主题,通过以下方式生成对应的问答拼接特征向量:生成目标提问文本特征向量对应的目标提问融合特征;将目标提问融合特征向量与目标应答文本特征进行拼接,以生成第一拼接特征;将第一拼接特征输入预先训练好的双向长短期记忆力神经网络,以分别输出正向第二拼接特征和反向第二拼接特征;将正向第二拼接特征和反向第二拼接特征进行拼接,以生成该预设主题对应的问答拼接特征向量。
[0011]优选的,针对每个预设主题,该预设主题对应的所有问答文本对转换为特征向量的步骤之前,还包括:针对每个问答文本对中的提问文本和应答文本,通过以下至少一种方式进行归一化处理:对提问文本和应答文本中的缩写词进行还原;对提问文本和应答文本中的词性进行还原;去除提问文本和应答文本中的停用词;去除提问文本和应答文本中的标点符号。
[0012]第二方面,本申请提供了一种问答文本的情绪识别装置,装置包括:
[0013]文本提取模块,用于对目标问答文本进行处理,以提取出与所有预设主题对应的多个问答文本对,每个问答文本对包括提问文本和对应的应答文本;
[0014]向量转换模块,用于针对每个预设主题,将该预设主题对应的所有问答文本对转换为特征向量,并形成与该预设主题对应的提问文本向量序列和应答文本向量序列;
[0015]信息交互模块,用于针对每个预设主题,通过注意力机制对提问文本向量序列和应答文本向量序列进行信息交互,以生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量;
[0016]融合拼接模块,用于针对每个预设主题,通过门控融合机制对该预设主题对应的目标提问文本特征向量和目标应答文本特征向量进行信息融合并拼接,以生成问答拼接特征向量;
[0017]情绪评价模块,用于将所有预设主题对应的问答拼接特征向量按顺序进行拼接,以确定出情绪识别结果,情绪识别结果用于指示目标问答文本所表达的情绪的健康程度。
[0018]第三方面,本申请还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述的问答文本的情绪识别方法的步骤。
[0019]第四方面,本申请还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述的问答文本的情绪识别方法的步骤。
[0020]本申请提供的问答文本的情绪识别方法、装置及电子设备,对目标问答文本进行处理,以提取出与所有预设主题对应的多个问答文本对,每个问答文本对包括提问文本和
对应的应答文本;针对每个预设主题,将该预设主题对应的所有问答文本对转换为特征向量,并形成与该预设主题对应的提问文本向量序列和应答文本向量序列;针对每个预设主题,通过注意力机制对提问文本向量序列和应答文本向量序列进行信息交互,以生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量;针对每个预设主题,通过门控融合机制对该预设主题对应的目标提问文本特征向量和目标应答文本特征向量进行信息融合并拼接,以生成问答拼接特征向量;将所有预设主题对应的问答拼接特征向量按顺序进行拼接,以确定出情绪识别结果,情绪识别结果用于指示目标问答文本所表达的情绪的健康程度,通过基于问答文本的结构特点设计模型结构,对文本向量进行处理,计算出情绪识别结果,提升了情绪识别的准确性。
[0021]为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
[0022]为了更清楚地说明本申请实施例的技术方案,下面将本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种问答文本的情绪识别方法,其特征在于,所述方法包括:对目标问答文本进行处理,以提取出与所有预设主题对应的多个问答文本对,每个问答文本对包括提问文本和对应的应答文本;针对每个预设主题,将该预设主题对应的所有问答文本对转换为特征向量,并形成与该预设主题对应的提问文本向量序列和应答文本向量序列;针对每个预设主题,通过注意力机制对提问文本向量序列和应答文本向量序列进行信息交互,以生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量;针对每个预设主题,通过门控融合机制对该预设主题对应的目标提问文本特征向量和目标应答文本特征向量进行信息融合并拼接,以生成问答拼接特征向量;将所有预设主题对应的问答拼接特征向量按顺序进行拼接,以确定出情绪识别结果,所述情绪识别结果用于指示目标问答文本所表达的情绪的健康程度。2.根据权利要求1所述的方法,其特征在于,通过以下方式确定出情绪识别结果:将所有预设主题对应的问答拼接特征向量按顺序进行拼接,以获取主题拼接特征;通过自注意力机制对所述主题拼接特征进行信息融合,以生成主题融合特征;将所述主题融合特征输入前馈神经网络,以输出情绪特征向量,所述情绪特征向量用于指示所述目标问答文本所表达的情绪;基于所述情绪特征向量,计算出所述目标问答文本所表达的情绪为目标情绪的概率值、所述目标问答文本所表达的情绪为非目标情绪的概率值。3.根据权利要求1所述的方法,其特征在于,通过以下方式对目标问答文本进行处理:确定出目标问答文本中的所有问答文本对;针对每个问答文本对,基于文本情绪的相似度,确定该问答文本对所表达的主题是否为预设主题中的一个,若是,则将该问答文本对作为该预设主题对应的一个问答文本对。4.根据权利要求1所述的方法,其特征在于,针对每个预设主题,通过以下方式形成于该预设主题对应的提问文本向量序列和应答文本向量序列:将该预设主题所对应的所有问答文本对输入预先训练好的BERT模型进行向量转换,以输出提问文本向量序列和应答文本向量序列。5.根据权利要求1所述的方法,其特征在于,针对每个预设主题,通过以下方式生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量:将提问文本向量序列和应答文本向量序列输入预先训练好的多头注意力机制模型,以输出第一信息交互结果和第二信息交互结果;将所述第一信息交互结果和提问文本向量序列输入归一层,以输出目标提问文本特征向量;将所述第二信息交互结果和应答文本向量序列输入归一层,以输出目标...
【专利技术属性】
技术研发人员:尚媛园,陈德馨,邵珠宏,刘靖祎,王雪,丁辉,刘铁,赵晓旭,
申请(专利权)人:首都师范大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。