System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 用于训练答案评分模型的方法、装置及存储介质制造方法及图纸_技高网

用于训练答案评分模型的方法、装置及存储介质制造方法及图纸

技术编号:42660622 阅读:3 留言:0更新日期:2024-09-10 12:18
本申请涉及智能问答技术领域,尤其是一种用于训练答案评分模型的方法、装置及存储介质。包括:构建训练集;将训练集中的每个训练样本依次输入至答案评分模型,并基于答案评分模型的输出和第一损失函数确定每个训练样本的第一损失值;根据每个训练样本对应的向量和第二损失函数确定每个训练样本的第二损失值;根据每个训练样本的第一损失值和第二损失值确定训练集的总损失值;在总损失值处于预设范围内的情况下,确定答案评分模型训练完成,采用正样本、负样本来训练答案评分模型,提高了答案评分模型的性能和评估精确度,能够更为准确地评估与查询问题对应的多个答案,从而准确地确定出正确答案,有效的提升了问答的效率和准确性。

【技术实现步骤摘要】

本申请涉及智能问答,具体地涉及一种用于训练答案评分模型的方法、用于确定查询问题的最终答案的方法、装置、存储介质及计算机程序产品。


技术介绍

1、网络安全知识图谱可以将分散、杂乱的网络安全知识进行有序整合,形成系统化、结构化的知识库。基于网络安全知识图谱的知识问答有助于用户了解事件发生的攻击链条和发展趋势,制定及时有效的应对策略,提升网络安全事件的应对能力。但是结构化的知识图谱和用户输入的自然语言之间存在一定的语义鸿沟,因此用户在知识问答的过程中通常借助语言模型来优化自然语言的理解能力。但是,目前经常使用的语言模型在对自然语言解析时,会存在识别误差,导致同一自然语言会出现多个不同的查询语句,且每个查询语言得到的答案也存在误差,进而使得最终的答案不够准确,常常出现答非所问、问而不答等各种问题,影响用户的使用体验。


技术实现思路

1、本申请实施例的目的是提供一种用于训练答案评分模型的方法、用于确定查询问题的最终答案的方法、装置、存储介质及计算机程序产品,用以解决现有技术中无法准确地评估与查询问题对应的多个答案、出现错误答案的概率高的问题。

2、为了实现上述目的,本申请第一方面提供一种用于训练答案评分模型的方法,方法包括:

3、构建训练集,训练集中包括多个训练样本,其中,训练样本包括正样本和负样本,正样本是基于每个历史查询问题和每个历史查询问题的正确答案生成的,负样本是基于每个历史查询问题和每个历史查询问题的错误答案生成的;

4、将训练集中的每个训练样本依次输入至答案评分模型,并基于答案评分模型的输出和第一损失函数确定每个训练样本的第一损失值;

5、确定每个训练样本对应的向量;

6、根据每个训练样本对应的向量和第二损失函数确定每个训练样本的第二损失值;

7、根据每个训练样本的第一损失值和第二损失值确定训练集的总损失值;

8、在总损失值处于预设范围内的情况下,确定答案评分模型训练完成。

9、在本申请实施例中,构建训练集包括:针对每个历史查询问题,确定历史查询问题对应的多个正确答案和错误答案;针对每个历史查询问题,将历史查询问题和对应的每个正确答案确定为一个正样本,并将历史查询问题和对应的每个错误答案确定为一个负样本;将每个历史查询问题对应的每个正样本和负样本分别确定为一个训练样本,并基于全部的训练样本构建训练集。

10、在本申请实施例中,第一损失函数如表达式(1)所示:

11、

12、其中,λ1为第一损失函数的第一损失值,m为训练样本的总数,yj为第j个训练样本的标签值,pj为答案评分模型输出的第j个训练样本为正确答案的概率,log(pj)为pj的对数函数,log(1-pj)为(1-pj)的对数函数。

13、在本申请实施例中,第二损失函数如表达式(2)所示:

14、

15、其中,λ2为第二损失函数的第二损失值,m为训练样本的总数,hj是第j个训练样本对应的向量,是第j个训练样本为正样本时对应的向量,是第j个训练样本为负样本时对应的向量,τ为温度参数,为的相似性度量函数,为的相似性度量函数,e为自然对数函数的底数,是一个常数。

16、在本申请实施例中,根据每个训练样本的第一损失值和第二损失值确定训练集的总损失值包括:确定训练集中全部的训练样本的第一损失值的第一和值;确定训练集中全部的训练样本的第二损失值的第二和值,并确定第二和值与预设数值的乘积;将第一和值和乘积的和值确定为总损失值。

17、本申请第二方面提供一种用于确定查询问题的最终答案的方法,方法包括:

18、上述的用于训练答案评分模型的方法训练答案评分模型;

19、在确定答案评分模型训练完成之后,获取当前查询问题;

20、将当前查询问题多次输入至训练后的语言模型,以通过训练后的语言模型输出与当前查询问题对应的多条查询语句,其中,训练后的语言模型每次输出与当前查询问题对应的一条查询语句;

21、确定与每条查询语句对应的候选答案;

22、基于训练后的答案评分模型处理每条候选答案,以得到当前查询问题的最终答案。

23、在本申请实施例中,方法还包括:在基于训练后的语言模型和当前查询问题确定与当前查询问题对应的多条查询语句之前,针对每个历史查询问题,组合历史查询问题和历史查询问题之前的多个历史查询问题,并确定组合后的历史查询问题对应的标准查询语句;根据全部的组合后的历史查询问题和对应的标准查询语句生成数据集;依次将每个组合后的历史查询问题输入至初始语言模型,以通过初始语言模型输出与每个组合后的历史查询问题对应的历史查询语句;针对每个组合后的历史查询问题,根据组合后的历史查询问题对应的标准查询语句、历史查询语句以及第三损失函数确定组合后的历史查询问题的第三损失值;针对任意一个组合后的历史查询问题,在历史查询问题的第三损失值小于预设损失值的情况下,确定组合后的历史查询问题和组合后的历史查询问题的历史查询语句为一个待选训练数据;针对任意一个组合后的历史查询问题,确定与组合后的历史查询问题对应的待选训练数据的存储系数,并在存储系数小于预设存储概率的情况下,将组合后的历史查询问题对应的待选训练数据确定为一个训练数据;根据全部的训练数据生成候选集合。

24、在本申请实施例中,第三损失函数如表达式(3)所示:

25、

26、其中,l为第三损失函数的第三损失值,n为组合后的历史查询问题的总数,为第i个组合后的历史查询问题对应的标准查询语句,yi第i个组合后的历史查询问题对应的历史查询语句,为第i个组合后的历史查询问题对应的标准查询语句的文本向量,v(yi)为第i个组合后的历史查询问题对应的历史查询语句的文本向量,为第i个组合后的历史查询问题对应的标准查询语句的文本向量和第i个组合后的历史查询问题对应的历史查询语句的文本向量之间的欧式距离,为的自然指数函数。

27、在本申请实施例中,方法还包括:在根据全部的训练数据生成候选集合之后,将每个组合后的历史查询问题的第三损失值的倒数确定为每个组合后的历史查询问题的第一权重;确定候选集合的词汇总数和每个组合后的历史查询问题对应的词汇;针对每个组合后的历史查询问题,根据组合后的历史查询问题对应的词汇和词汇总数确定组合后的历史查询问题的第二权重;根据每个组合后的历史查询问题的第一权重和第二权重确定每个组合后的历史查询问题对应的训练数据的重要性系数;根据每个训练数据的重要性系数从候选集合中选取第一预设数量的训练数据;从候选集合中选取第二预设数量的训练数据;将第一预设数量的训练数据和第二预设数量的训练数据更新至数据集中,并通过更新后的数据集训练初始语言模型,以得到训练后的语言模型。

28、在本申请实施例中,根据组合后的历史查询问题对应的词汇和词汇总数确定组合后的历史查询问题的第二权重包括根据公式(4)确定第二权重:

29、

本文档来自技高网...

【技术保护点】

1.一种用于训练答案评分模型的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的用于训练答案评分模型的方法,其特征在于,所述构建训练集包括:

3.根据权利要求1所述的用于训练答案评分模型的方法,其特征在于,所述第一损失函数如表达式(1)所示:

4.根据权利要求1所述的用于训练答案评分模型的方法,其特征在于,所述第二损失函数如表达式(2)所示:

5.根据权利要求1所述的用于训练答案评分模型的方法,其特征在于,所述根据每个训练样本的第一损失值和第二损失值确定所述训练集的总损失值包括:

6.一种用于确定查询问题的最终答案的方法,其特征在于,所述方法包括:

7.根据权利要求6所述的用于确定查询问题的最终答案的方法,其特征在于,所述方法还包括:

8.根据权利要求7所述的用于确定查询问题的最终答案的方法,其特征在于,所述第三损失函数如表达式(3)所示:

9.根据权利要求7所述的用于确定查询问题的最终答案的方法,其特征在于,所述方法还包括:

10.根据权利要求9所述的用于确定查询问题的最终答案的方法,其特征在于,根据所述组合后的历史查询问题对应的词汇和所述词汇总数确定所述组合后的历史查询问题的第二权重包括根据公式(4)确定所述第二权重:

11.一种用于训练答案评分模型的装置,其特征在于,包括:

12.一种用于确定查询问题的最终答案的装置,其特征在于,包括:

13.一种机器可读存储介质,其特征在于,该机器可读存储介质上存储有指令,该指令用于使得机器执行根据权利要求1至5中任一项所述的用于训练答案评分模型的方法。

14.一种机器可读存储介质,其特征在于,该机器可读存储介质上存储有指令,该指令用于使得机器执行根据权利要求6至10中任一项所述的用于确定查询问题的最终答案的方法。

15.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序在被处理器执行时实现根据权利要求1至5中任一项所述的用于训练答案评分模型的方法。

16.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序在被处理器执行时实现根据权利要求6至10中任一项所述的用于确定查询问题的最终答案的方法。

...

【技术特征摘要】

1.一种用于训练答案评分模型的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的用于训练答案评分模型的方法,其特征在于,所述构建训练集包括:

3.根据权利要求1所述的用于训练答案评分模型的方法,其特征在于,所述第一损失函数如表达式(1)所示:

4.根据权利要求1所述的用于训练答案评分模型的方法,其特征在于,所述第二损失函数如表达式(2)所示:

5.根据权利要求1所述的用于训练答案评分模型的方法,其特征在于,所述根据每个训练样本的第一损失值和第二损失值确定所述训练集的总损失值包括:

6.一种用于确定查询问题的最终答案的方法,其特征在于,所述方法包括:

7.根据权利要求6所述的用于确定查询问题的最终答案的方法,其特征在于,所述方法还包括:

8.根据权利要求7所述的用于确定查询问题的最终答案的方法,其特征在于,所述第三损失函数如表达式(3)所示:

9.根据权利要求7所述的用于确定查询问题的最终答案的方法,其特征在于,所述方法还包括:

10.根据权利要求9所述的用于确...

【专利技术属性】
技术研发人员:李娇
申请(专利权)人:北京天融信网络安全技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1