System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 回答文本生成方法、装置、设备及存储介质制造方法及图纸_技高网

回答文本生成方法、装置、设备及存储介质制造方法及图纸

技术编号:43084844 阅读:6 留言:0更新日期:2024-10-26 09:34
本申请涉及人工智能技术领域,公开一种回答文本生成方法、装置、设备及存储介质。该方法包括:获取用户输入的查询文本;对查询文本进行实体抽取和关系抽取,得到查询文本中的多个查询实体和查询实体两两之间的查询实体关系;对知识图谱中的知识元组进行搜索,得到若干候选知识元组;将查询文本和候选知识元组输入预训练的文本生成模型,以进行上下文语义关联和文本内容生成,得到预回答文本;将预回答文本输入预训练的风格转换模型,根据相应的风格提示词,对预回答文本的文本风格进行转换,得到目标回答文本。本申请实施例可以提升回答文本的准确性和可读性。

【技术实现步骤摘要】

本申请涉及人工智能,尤其是一种回答文本生成方法、装置、设备及存储介质


技术介绍

1、知识图谱(knowledge graph),作为一种数据表示和组织方式,能够将复杂的关系和信息结构化,从而为各种智能应用提供更丰富的语义支持。

2、相关技术中,基于知识图谱的问答系统是通过获取用户产生的查询文本,理解用户提出的问题,并通过知识推理以生成相应的回答文本。然而,对于查询关键词少、定义广泛、指向不清晰的查询文本,基于知识图谱的问答系统难以准确理解用户意图并提供准确的回答文本,且生成的回答文本无法与查询文本对应的领域的语言风格相匹配,降低交互体验感。


技术实现思路

1、本申请的目的是提供一种回答文本生成方法、装置、设备及存储介质,通过对查询文本进行语义理解以及对生成的回答文本进行风格优化,提升回答文本的准确性和可读性。

2、本申请实施例提供一种回答文本生成方法,包括:

3、获取用户输入的查询文本;

4、对所述查询文本进行实体抽取和关系抽取,得到所述查询文本中的多个查询实体和所述查询实体两两之间的查询实体关系;

5、对知识图谱中的知识元组进行搜索,得到若干候选知识元组;所述知识元组包括多个实体中的任一实体对和该所述实体对中实体两两之间的实体关系,所述候选知识元组为包括多个所述查询实体中的任一查询实体对和该所述查询实体对中查询实体两两之间的查询实体关系的知识元组;

6、将所述查询文本和所述候选知识元组输入预训练的文本生成模型,以进行上下文语义关联和文本内容生成,得到预回答文本;

7、将所述预回答文本输入预训练的风格转换模型,根据相应的风格提示词,对所述预回答文本的文本风格进行转换,得到目标回答文本;所述文本生成模型和所述风格转换模型均为基于transformer架构的语言模型训练得到。

8、在一些实施例中,所述对所述查询文本进行实体抽取和关系抽取,得到所述查询文本中的多个查询实体和所述查询实体两两之间的查询实体关系,包括:

9、对所述查询文本进行特征抽取,得到第一特征组合,所述第一特征组合包括所述查询文本中每个特征字词对应的词性、命名实体和依存关系;

10、将所述第一特征组合输入到预训练的条件随机场模型,得到所述条件随机场模型的输出结果;

11、根据所述条件随机场模型的输出结果,提取所述查询文本中的多个查询实体和所述查询实体两两之间的查询实体关系。

12、在一些实施例中,在所述对知识图谱中的知识元组进行搜索,得到若干候选知识元组之前,还包括:

13、获取知识文本;

14、对所述知识文本进行特征抽取,得到第二特征组合,所述第二特征组合包括所述知识文本中每个特征字词对应的词性、命名实体和依存关系;

15、将所述第二特征组合输入到预训练的条件随机场模型,得到所述条件随机场模型的输出结果;

16、根据所述条件随机场模型的输出结果,提取所述知识文本中的多个实体和所述实体两两之间的实体关系;

17、对所述实体和所述实体关系进行结构化表示,得到所述知识元组。

18、在一些实施例中,所述对知识图谱中的知识元组进行搜索,得到若干候选知识元组,包括:

19、以所述实体和所述实体关系作为关键字,对所述知识元组进行搜索,在所述知识元组所包括的一所述实体为其中一种所述查询实体且所述实体关系为其中一种所述查询实体关系时,将该所述知识元组确定为所述候选知识元组。

20、在一些实施例中,所述将所述查询文本和所述候选知识元组输入预训练的文本生成模型,以进行上下文语义关联和文本内容生成,得到预回答文本,包括:

21、将所述查询文本和所述候选知识元组进行拼接,得到查询向量序列;

22、对所述查询向量序列进行位置编码,得到位置嵌入向量序列;

23、对所述位置嵌入向量序列进行线性变换处理,对线性变换处理后的词向量进行注意力权重运算,得到第一上下文语义特征;所述第一上下文语义特征包括所述查询文本和所述候选知识元组两者的上下文语义信息;

24、根据所述第一上下文语义特征,以所述查询文本和所述候选知识元组为基础,进行上下文预测,得到所述预回答文本。

25、在一些实施例中,所述将所述预回答文本输入预训练的风格转换模型,根据相应的风格提示词,对所述预回答文本的文本风格进行转换,得到目标回答文本,包括:

26、根据所述候选知识元组,生成所述风格提示词;

27、将所述预回答文本和所述风格提示词进行拼接,得到预回答向量序列;

28、对所述预回答向量序列进行线性变换处理,对线性变换处理后的词向量进行注意力权重运算,得到第二上下文语义特征;所述第二上下文语义特征包括所述预回答文本和所述风格提示词两者的上下文语义信息;

29、根据所述第二上下文语义特征,以所述预回答文本和所述风格提示词为基础,进行上下文预测,得到所述目标回答文本。

30、在一些实施例中,所述根据所述候选知识元组,生成所述风格提示词,包括:

31、对所述候选知识元组进行向量嵌入,得到所述候选知识元组向量序列;

32、对所述候选知识元组向量序列进行线性变换处理,对线性变换处理后的词向量进行注意力权重运算,得到第三上下文语义特征;所述第三上下文语义特征包括各所述候选知识元组两者的上下文语义信息;

33、根据所述第三上下文语义特征,确定所述候选知识元组对应的场景领域;

34、根据该所述场景领域,生成所述风格提示词。

35、本申请实施例还提供一种回答文本生成装置,包括:

36、第一模块,用于获取用户输入的查询文本;

37、第二模块,对所述查询文本进行实体抽取和关系抽取,得到所述查询文本中的多个查询实体和所述查询实体两两之间的查询实体关系;

38、第三模块,对知识图谱中的知识元组进行搜索,得到若干候选知识元组;所述知识元组包括多个实体中的任一实体对和该所述实体对中实体两两之间的实体关系,所述候选知识元组为包括多个所述查询实体中的任一查询实体对和该所述查询实体对中查询实体两两之间的查询实体关系的知识元组;

39、第四模块,将所述查询文本和所述候选知识元组输入预训练的文本生成模型,以进行上下文语义关联和文本内容生成,得到预回答文本;

40、第五模块,将所述预回答文本输入预训练的风格转换模型,根据相应的风格提示词,对所述预回答文本的文本风格进行转换,得到目标回答文本;所述文本生成模型和所述风格转换模型均为基于transformer架构的语言模型训练得到。

41、本申请实施例还提供一种电子设备,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的回答文本生成方法。

42、本申请实施例还提供一种计本文档来自技高网...

【技术保护点】

1.一种回答文本生成方法,其特征在于,包括:

2.根据权利要求1所述的回答文本生成方法,其特征在于,所述对所述查询文本进行实体抽取和关系抽取,得到所述查询文本中的多个查询实体和所述查询实体两两之间的查询实体关系,包括:

3.根据权利要求1所述的回答文本生成方法,其特征在于,在所述对知识图谱中的知识元组进行搜索,得到若干候选知识元组之前,还包括:

4.根据权利要求1所述的回答文本生成方法,其特征在于,所述对知识图谱中的知识元组进行搜索,得到若干候选知识元组,包括:

5.根据权利要求1所述的回答文本生成方法,其特征在于,所述将所述查询文本和所述候选知识元组输入预训练的文本生成模型,以进行上下文语义关联和文本内容生成,得到预回答文本,包括:

6.根据权利要求1所述的回答文本生成方法,其特征在于,所述将所述预回答文本输入预训练的风格转换模型,根据相应的风格提示词,对所述预回答文本的文本风格进行转换,得到目标回答文本,包括:

7.根据权利要求6所述的回答文本生成方法,其特征在于,所述根据所述候选知识元组,生成所述风格提示词,包括:

8.一种回答文本生成装置,其特征在于,包括:

9.一种电子设备,其特征在于,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述的回答文本生成方法。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的回答文本生成方法。

...

【技术特征摘要】

1.一种回答文本生成方法,其特征在于,包括:

2.根据权利要求1所述的回答文本生成方法,其特征在于,所述对所述查询文本进行实体抽取和关系抽取,得到所述查询文本中的多个查询实体和所述查询实体两两之间的查询实体关系,包括:

3.根据权利要求1所述的回答文本生成方法,其特征在于,在所述对知识图谱中的知识元组进行搜索,得到若干候选知识元组之前,还包括:

4.根据权利要求1所述的回答文本生成方法,其特征在于,所述对知识图谱中的知识元组进行搜索,得到若干候选知识元组,包括:

5.根据权利要求1所述的回答文本生成方法,其特征在于,所述将所述查询文本和所述候选知识元组输入预训练的文本生成模型,以进行上下文语义关联和文本内容生成,得到预回答文本,包括:

6.根...

【专利技术属性】
技术研发人员:谢凡陈赛霞谢丽慧
申请(专利权)人:深圳市迪博企业风险管理技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1