System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 问答模型训练方法、问答处理方法及相关设备技术_技高网

问答模型训练方法、问答处理方法及相关设备技术

技术编号:43878960 阅读:24 留言:0更新日期:2024-12-31 19:01
本申请涉及人工智能技术领域,公开一种问答模型训练方法、问答处理方法及相关设备。问答模型训练方法包括:获取训练询问数据;根据训练询问数据,在预设的知识库中检索出训练知识数据;将训练询问数据和训练知识数据输入待训练问答模型,得到训练答复数据;训练答复数据由待训练问答模型基于训练询问数据进行问答预测得到的预测答复数据和训练知识数据融合得到;基于训练答复数据训练待训练问答模型,得到问答模型。本申请实施例可以提升问答系统的知识储备深度,提高问答精度和知识推理精度。

【技术实现步骤摘要】

本申请涉及人工智能,尤其是一种问答模型训练方法、问答处理方法及相关设备


技术介绍

1、问答系统(question answering system,qa)是信息检索系统的一种高级形式,它能用准确、简洁的自然语言回答用户用自然语言提出的问题。其研究兴起的主要原因是人们对快速、准确地获取信息的需求。问答系统是人工智能和自然语言处理领域中一个倍受关注并具有广泛发展前景的研究方向。然后,由于知识范围有限,相关技术中的问答系统无法有效针对专业问题进行在线应答,导致问答精度和知识推理精度相对较低,无法满足用户的高精度问答需求和答案可解释需求。


技术实现思路

1、本申请的目的是提供一种问答模型训练方法、问答处理方法及相关设备,可以提升问答系统的知识储备深度,提高问答精度和知识推理精度。

2、本申请实施例提供一种问答模型训练方法,包括:

3、获取训练询问数据;

4、根据所述训练询问数据,在预设的知识库中检索出训练知识数据;

5、将所述训练询问数据和所述训练知识数据输入待训练问答模型,得到训练答复数据;所述训练答复数据由所述待训练问答模型基于所述训练询问数据进行问答预测得到的预测答复数据和所述训练知识数据融合得到;

6、基于所述训练答复数据训练所述待训练问答模型,得到问答模型。

7、在一些实施例中,在根据所述训练询问数据,在预设的知识库中检索出训练知识数据之前,还包括:

8、获取知识数据;

9、对所述知识数据进行实体抽取和关系抽取,得到所述知识数据中的多个知识实体和所述知识实体两两之间的知识实体关系;

10、根据所述知识实体和所述知识实体关系,构建所述知识库。

11、在一些实施例中,所述根据所述训练询问数据,在预设的知识库中检索出训练知识数据,包括:

12、对所述训练询问数据进行实体抽取和关系抽取,得到所述训练询问数据中的多个训练实体和所述训练实体两两之间的训练实体关系;

13、根据所述训练实体和所述训练实体关系,构建检索结构体;

14、调用预设的检索器,检索所述知识库中的知识结构体,并对所述检索结构体和所述知识结构体进行相似度分析,得到相似度分析结果;

15、根据所述相似度分析结果,输出所述训练知识数据。

16、在一些实施例中,所述将所述训练询问数据和所述训练知识数据输入待训练问答模型,得到训练答复数据,包括:

17、对所述训练询问数据进行信息编码,得到嵌入向量序列;

18、对所述嵌入向量序列进行线性变换处理,对线性变换处理后的词向量进行注意力权重运算,得到所述训练询问数据的上下文语义特征;

19、根据所述上下文语义特征进行上下文预测,得到所述预测答复数据;

20、按照预设权重比例或按照预设融合范围,对所述预测答复数据和所述训练知识数据进行融合,得到所述训练答复数据。

21、在一些实施例中,所述问答模型训练方法,还包括:

22、获取用户对所述训练答复数据的评价信息,得到第一评价信息;

23、对所述训练答复数据进行融合精度评价,得到第二评价信息;

24、根据所述第一评价信息和所述第二评价信息,调节融合所述预测答复数据和所述训练知识数据的策略参数。

25、在一些实施例中,所述基于所述训练答复数据训练所述待训练问答模型,得到问答模型,包括:

26、确定模型损失信息;所述模型损失信息表征所述训练答复数据和预期答复数据之间的偏差,所述预期答复数据由所述训练询问数据对应的预设答复数据和所述训练知识数据融合得到;

27、判断所述模型损失信息是否处于损失阈值区间内;

28、若不处于,调节所述待训练问答模型的权重参数;返回所述将所述训练询问数据和所述训练知识数据输入待训练问答模型,得到训练答复数据的步骤;

29、若处于,判断训练询问数据重置次数是否达到重置阈值;

30、若未达到,返回所述获取训练询问数据的步骤;

31、若达到,结束训练,得到所述问答模型。

32、本申请实施例还提供一种问答处理方法,包括:

33、获取用户输入的询问数据;

34、根据所述询问数据,在预设的知识库中检索出目标知识数据;

35、将所述询问数据和所述目标知识数据输入问答模型,得到答复数据;所述答复数据由所述问答模型基于所述询问数据进行问答预测得到的预答复数据和所述目标知识数据融合得到,所述问答模型通过上所述的问答模型训练方法训练得到。

36、在一些实施例中,所述问答处理方法,还包括:

37、提取所述询问数据的超链接;

38、判断所述询问数据的超链接是否为有效链接;

39、若有效,将所述询问数据的超链接嵌入所述答复数据。

40、本申请实施例还提供一种电子设备,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法。

41、本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法。

42、本申请的有益效果:根据训练询问数据在预设的知识库中检索出训练知识数据,并利用训练询问数据和训练知识数据对待训练问答模型进行训练,使待训练问答模型基于训练询问数据进行问答预测并得到预测答复数据,再将预测答复数据和训练知识数据进行融合并得到训练答复数据,可以确保待训练问答模型能够有效地利用知识库中的知识数据进行训练,填补待训练问答模型在多个领域的知识空白,使训练得到的问答模型具有深厚的知识储备,提高问答精度和知识推理精度。

本文档来自技高网...

【技术保护点】

1.一种问答模型训练方法,其特征在于,包括:

2.根据权利要求1所述的问答模型训练方法,其特征在于,在根据所述训练询问数据,在预设的知识库中检索出训练知识数据之前,还包括:

3.根据权利要求1所述的问答模型训练方法,其特征在于,所述根据所述训练询问数据,在预设的知识库中检索出训练知识数据,包括:

4.根据权利要求1所述的问答模型训练方法,其特征在于,所述将所述训练询问数据和所述训练知识数据输入待训练问答模型,得到训练答复数据,包括:

5.根据权利要求1所述的问答模型训练方法,其特征在于,还包括:

6.根据权利要求1所述的问答模型训练方法,其特征在于,所述基于所述训练答复数据训练所述待训练问答模型,得到问答模型,包括:

7.一种问答处理方法,其特征在于,包括:

8.根据权利要求7所述的问答处理方法,其特征在于,还包括:

9.一种电子设备,其特征在于,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现权利要求1至8任一项所述的方法。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法。

...

【技术特征摘要】

1.一种问答模型训练方法,其特征在于,包括:

2.根据权利要求1所述的问答模型训练方法,其特征在于,在根据所述训练询问数据,在预设的知识库中检索出训练知识数据之前,还包括:

3.根据权利要求1所述的问答模型训练方法,其特征在于,所述根据所述训练询问数据,在预设的知识库中检索出训练知识数据,包括:

4.根据权利要求1所述的问答模型训练方法,其特征在于,所述将所述训练询问数据和所述训练知识数据输入待训练问答模型,得到训练答复数据,包括:

5.根据权利要求1所述的问答模型训练方法,其特征在于,还包括:

6.根据权...

【专利技术属性】
技术研发人员:杨良志白琳汪志新夏华李海涛肖胜雄张庆艺雷震强
申请(专利权)人:彩讯科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1