System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种整合多源常识知识的多轮共情对话生成方法技术_技高网

一种整合多源常识知识的多轮共情对话生成方法技术

技术编号:41759756 阅读:1 留言:0更新日期:2024-06-21 21:40
本发明专利技术提供一种整合多源常识知识的多轮共情对话生成方法,包括以下步骤:S1、将历史多轮对话内容作为对话上下文,分别输入到COMET、LLama2和ConceptNet知识库中,从而获取三类常识知识:短语型推理知识、文档型事实知识以及三元组型本体知识;S2、分别使用词嵌入技术、Transformer编码器和图神经网络GNN对获得推理知识、事实知识和本体知识进行编码处理,生成对应的推理知识特征向量、事实知识特征向量和本体图特征向量;S3、将编码后的知识特征向量和对话上下文一同输入到预训练模型,通过该模型的处理和生成,产生共情回复;本发明专利技术通过整合多源常识知识,有效解决了单一来源知识在覆盖率和领域知识限制方面的不足。这种方法显著增强了模型在语义理解和情感感知方面的能力,从而使得生成的共情回复更加精准、丰富和多样化,提升了对话系统的整体性能和用户体验。

【技术实现步骤摘要】

本专利技术属于自然语言处理领域,具体涉及一种整合多源常识知识的多轮共情对话生成方法


技术介绍

1、在当前社会发展和技术进步的背景下,人类对情感交流的需求日益增长。共情对话任务作为近年来人工智能领域中的一项重要研究,旨在借助人工智能技术,实现计算机与人类之间的情感交流和互动。这一领域的研究努力致力于帮助人们更深入地理解和表达情感,以满足人类日益增长的情感需求。

2、随着互联网技术的快速发展,众多知识库得以构建,例如conceptnet、atomic等,它们积累了大量的知识信息。近年来,共情回复相关工作聚焦于如何将这些知识库中的信息融入对话模型,以增强共情回复的能力。尽管这些研究工作很大程度上推动了该领域的进步,但大多数研究仍然局限于将单一形式的知识集成到对话模型中。因此,依赖单一知识源的局限性可能会限制模型在生成共情回复时的能力。为了克服这一问题,有必要探索如何整合多种形式的知识,以提升对话系统的共情能力和覆盖范围。


技术实现思路

1、针对现有技术的缺陷,本专利技术的目的在于提供一种整合多源常识知识的多轮共情对话生成方法。这种方法的核心目的是实现多源知识的有效融合,并将其注入到预训练的对话模型中。通过这种创新性的方法,解决目前单源知识依赖的对话模型在共情能力上的不足,并显著提高模型面对多种知识表示形式时的扩展性和灵活性。这种方法的实施将大幅提升对话系统在理解和生成响应方面的能力,尤其是在处理复杂、多维的情感交流场景时。

2、为实现上述目的,本专利技术提供了整合多源知识的共情对话生成方法,包括以下步骤:

3、s1、将历史多轮对话内容作为对话上下文,分别输入到comet、llama2以及conceptnet,从而获得三类常识知识:短语型推理知识、文档型事实知识以及三元组型本体知识;

4、s2、针对不同形式的知识,采用三种编码方式将文本知识转化为特征向量,以便后续注入预训练模型。对于短语型推理知识,采用词嵌入技术将单词或短语的语义信息转化为具有固定维度的向量;对于文档型事实知识,使用transformer编码器进行特征提取,以捕捉句子内部的上下文信息;对于三元组本体知识,将三元组转化为图形结构,并利用图神经网络来捕捉三元组中的实体关系信息;

5、s3、将推理知识特征向量、事实知识特征向量及本体图特征向量输入到基于transformer架构的预训练模型bart的前馈网络模型中,这些特征向量作为附加输入,与bart编码器的隐藏表征一同经过前馈网络处理,通过该模型的处理和生成,产生共情回复。

6、在bart模型(bidirectionalandauto-regressivetransformers)的每一层前馈网络模块中,注入推理知识特征向量、事实知识特征向量及本体图特征向量。这些特征向量作为附加输入,与模型的原始输入一同经过前馈网络处理。在随后的微调过程中,不断调整前馈网络中的参数矩阵,以增强模型对知识特征向量的利用。

7、优选的,步骤1具体为:

8、s11、对于短语型推理知识,将对话上下文d和预定义的常识类型r同时输入到comet知识库,得到推理知识集合:

9、kgs=comet(r,d)

10、其中r∈{xwant,xneed,xintent,xeffect,xreact},xwant,xneed,xintent,xeffect,xreact为comet知识库生成推理知识所需的边类型,含义分别为“某人想”,“某人需要”,“某人希望”,“对某人的影响”,“某人的反应”,kgs为推理知识集合,对于每个上下文,包含五类推理知识,每类包含多个短语,比如:[[“变合群”,“避免冲突”,“变友好”],[“谈论某人”,“得到拥抱”,“得到朋友”],...,[“开心”,”友好”,“满意”]];

11、s12、对于文档型事实知识,为llama2提供特定的prompt以指导模型生成与上下文d相关的文档型知识:

12、kgd=llama2(p,d)

13、其中p表示prompt语句,内容为“你扮演一个常识知识库,我提供一段对话,你帮我生成五条与对话内容最相关的文档型事实常识”。kgd为文档型事实知识集合,对于每个上下文,对应五个文档知识,比如:[“安全驾驶需要注意道路和其他车辆”,“开车时必须对自己行为负责”,“道路上碾压他人是危险的,可能会造成严重伤害或死亡”,“如果有人在事故中有过错,他们应该承担责任并道歉”,“必须优先考虑道路安全,避免激进或鲁莽的驾驶行为”];

14、s13、对于三元组型本体知识,首先从对话上下文中剔除停用词,然后利用nrc情感词表挑选出上下文中的情感词,最后筛选出conceptnet中与情感相关的三元组构建本体集合:

15、kgt=conceptnet(x)

16、其中x表示上下文情感词,kgt为三元组集合。每个三元组被表示为(x,r,t),x和t为实体,r为实体关系,比如:(“出生”,“相关”,“快乐”);

17、优选的,步骤s2具体为:

18、s21、对于短语型推理知识,将kgs中的每类推理知识进行拼接,形成知识序列css。随后通过词嵌入技术得到css对应的词嵌入向量最后average词嵌入向量得到中推理知识的特征表示

19、

20、s22、对于文档型事实知识,将kgd中的每条文档知识前添加起始标记符[cls],形成序列csd,接着,将这些序列对应的词嵌入向量输入到transformer编码器,提取最后一层[cls]位置对应的隐藏向量,作为事实知识对应的特征向量。

21、

22、enc表示bart编码器;ew为词嵌入层;[0]为索引操作,表示取[cls]位置对应的隐藏表征;

23、s23、对于三元组本体知识,由于三元组着重表示实体间关系,因此考虑将其转化为图网络,并借助图神经网络捕捉三元组中的实体关系信息。

24、首先需要构造图g=(v,e),其中v为节点集,e为节点关系。为此,将三元组中的实体作为节点,实体关系作为节点关系。接着,借助节点集和节点关系构建出邻接矩阵a,a中的值为1或0,比如aij=1表示节点i和节点j之间存在一个边。为避免特征提取过程丢失自身信息,将邻接矩阵斜对角线置为1,得到自邻接矩阵

25、然而,拥有邻接矩阵仍无法完整的表示图,因为每个节点具有其自身特征,因此使用节点对应的词向量表示节点特征,得到邻接矩阵对应的特征矩阵h。然后通过以下公式计算出每个节点的特征表示:

26、

27、其中为自连接的邻接矩阵的度矩阵,w为可训练权重矩阵,w l表示gcn第l层可训练参数矩阵,hl为经过第l层gcn层之后提取的特征,σ表示非线性激活函数,比如relu;

28、最后,为得到整个图的特征,对最后一层gcn提取的节点特征做maxpooling,得到本体图特征

29、...

【技术保护点】

1.一种整合多源常识知识的多轮共情对话生成方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的方法,其特征在于,步骤S1包括如下步骤:

3.根据权利要求2所述的方法,其特征在于,步骤S2包括如下步骤:

4.根据权利3所述的方法,其特征在于,步骤S3包括如下步骤:

5.一种整合多源常识知识的多轮共情对话生成装置,其特征在于,包括:

6.一种电子设备,其特征在于:包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器运行所述计算机程序时,执行如权利要求1-4任一项所述的整合多源常识知识的多轮共情对话生成方法的步骤。

7.一种计算机可读存储介质,其存储计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-4任一项所述的整合多源常识知识的多轮共情对话生成方法的步骤。

8.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-4任一项所述的整合多源常识知识的多轮共情对话生成方法的步骤。

【技术特征摘要】

1.一种整合多源常识知识的多轮共情对话生成方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的方法,其特征在于,步骤s1包括如下步骤:

3.根据权利要求2所述的方法,其特征在于,步骤s2包括如下步骤:

4.根据权利3所述的方法,其特征在于,步骤s3包括如下步骤:

5.一种整合多源常识知识的多轮共情对话生成装置,其特征在于,包括:

6.一种电子设备,其特征在于:包括存储器、处理器及存储在存储器上并可在处理器上...

【专利技术属性】
技术研发人员:刘智崔晨阳粟柱孙建文刘三女牙周东波
申请(专利权)人:华中师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1