System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种问答系统语义匹配优化方法及装置制造方法及图纸_技高网

一种问答系统语义匹配优化方法及装置制造方法及图纸

技术编号:41727333 阅读:3 留言:0更新日期:2024-06-19 12:50
本发明专利技术公开了一种问答系统语义匹配优化方法及装置,涉及人工智能技术领域,方法包括:将用户输入问句与问答系统的问答对候选集中问句进行匹配,并与匹配到的相似问句组成句子对;将句子对与预先构建的相似词典和不相似词典进行匹配,若匹配到相似词典,则将句子对中命中词对替换为相似标识符对,匹配到不相似词典,则替换为不相似标识符对;将替换后的句子对输入至训练好的语义匹配模型进行预测并返回对应置信度,若预测结果为相似且满足置信度,则判定相似问句为用户输入问句的同义问句,将问答对候选集中相似问句对应的答案作为用户输入问句的答案。本发明专利技术实现了词典对模型预测结果的定向干预,提高了问答系统语义匹配的准确度与专业性。

【技术实现步骤摘要】

本专利技术涉及人工智能,特别涉及一种问答系统语义匹配优化方法及装置


技术介绍

1、近年来随着人机交互技术的进步,对话系统正逐渐走向实际应用。其中,智能问答系统正受到了很多企业尤其是中大型企业的广泛关注。问答系统作为信息检索的一种高级形式,也是自然语言处理的一个重要领域。问答系统旨在利用自然语言处理技术实现更加准确地理解用户用自然语言提出的问题,并通过检索语料库、知识图谱或问答知识库返回简洁、准确的匹配答案。鉴于,客服是企业必不可少的重要部门,其长期业务中通常积累大量常见问题集,所以基于频繁问答的问答系统也是比较常见的问答系统之一。

2、文本的语义匹配是一项非常基础且重要的自然语言处理任务,也是基于频繁问答的问答系统的关键技术。传统的文本匹配技术例如有tf-idf、bm25等算法,主要解决词汇层面的匹配问题,或者说词汇层面的相似度问题。近些年随着深度学习的兴起,深度文本匹配经历多个阶段的发展,取得了显著的成绩。现有技术中,预训练语言模型在多项自然语言处理的下游任务中取得了优秀的表现,被广泛应用在搜索引擎、智能问答、知识检索、信息流推荐中。但是,当具体到多数垂直领域业务场景中,仍存在很多业务需求无法通过算法模型很好的解决和满足。因此,对于垂直领域业务场景下的问答系统语义匹配还需进行改进。


技术实现思路

1、为解决上述缺陷或不足,本专利技术提供了一种问答系统语义匹配优化方法及装置,通过加入相似与不相似标识符进行模型训练、加入相似与不相似词典进行模型预测的定向干预与辅助决策,优化问答系统语义匹配准确性与专业性,以满足垂直领域业务场景下问答系统的业务需求。

2、本专利技术的一个方面,提供了一种问答系统语义匹配优化方法,包括:

3、将用户输入问句与问答系统的问答对候选集中问句进行匹配,将所述用户输入问句和匹配到的相似问句组成句子对;

4、将所述句子对与预先构建的业务词典进行匹配,所述业务词典包括相似词典和不相似词典,若所述句子对中的词对匹配到所述相似词典,则将所述词对替换为相似标识符对;若所述句子对中的词对匹配到所述不相似词典,则将所述词对替换为不相似标识符对;

5、将替换后的句子对输入至训练好的语义匹配模型,得到句子对的余弦相似度,若余弦相似度达到或超过预设阈值,则判定所述相似问句为所述用户输入问句的同义问句,将问答对候选集中所述相似问句对应的答案作为所述用户输入问句的答案。

6、进一步的,还包括:预先设置所述语义匹配模型需要学习的相似标识符对和不相似标识符对。

7、进一步的,所述语义匹配模型包括siamcnn、bimpm或者sbert。

8、进一步的,还包括:

9、根据垂直领域业务场景制作带有标签的句子,得到基础训练语料,所述标签包括相似标签和不相似标签;

10、在所述基础训练语料中插入相似标识符对或不相似标识符对,得到增强训练语料;

11、将所述基础训练语料与所述增强训练语料合并输入至所述语义匹配模型进行训练。

12、进一步的,所述在所述基础训练语料中插入相似标识符对或不相似标识符对,得到增强训练语料的步骤,包括:

13、当句子对的标签为相似标签时,若句子对中的各句子对应插入的是相似标识符对,则该句子对的标签为相似标签不变,若句子对中的各句子对应插入的是不相似标识符对,则该句子对的标签更改为不相似标签;

14、当句子对的标签为不相似标签时,若句子对中的各句子对应插入的是相似标识符对或不相似标识符对,则该句子对的标签始终为不相似标签。

15、本专利技术的另一方面,提供了一种问答系统语义匹配优化装置,包括:

16、问句匹配模块,被配置为将用户输入问句与问答系统的问答对候选集中问句进行匹配,将所述用户输入问句和匹配到的相似问句组成句子对;

17、词典匹配替换模块,被配置为将所述句子对与预先构建的业务词典进行匹配,所述业务词典包括相似词典和不相似词典,若所述句子对中的词对匹配到所述相似词典,则将所述词对替换为相似标识符对;若所述句子对中的词对匹配到所述不相似词典,则将所述词对替换为不相似标识符对;

18、预测模块,将替换后的句子对输入至训练好的语义匹配模型,得到句子对的余弦相似度,若余弦相似度达到或超过预设阈值,则判定所述相似问句为所述用户输入问句的同义问句,将问答对候选集中所述相似问句对应的答案作为所述用户输入问句的答案。

19、进一步的,还包括:标识符设置模块,被配置为预先设置所述语义匹配模型需要学习的相似标识符对和不相似标识符对。

20、进一步的,所述预测模块被进一步配置为:

21、所述语义匹配模型包括siamcnn、bimpm或者sbert。

22、进一步的,还包括语义匹配模型训练模块,被配置为:

23、根据垂直领域业务场景制作带有标签的句子,得到基础训练语料,所述标签包括相似标签和不相似标签;

24、在所述基础训练语料中插入相似标识符对或不相似标识符对,得到增强训练语料;

25、将所述基础训练语料与所述增强训练语料合并输入至所述语义匹配模型进行训练。

26、进一步的,所述语义匹配模型训练模块被进一步配置为:

27、所述在所述基础训练语料中插入相似标识符对或不相似标识符对,得到增强训练语料的步骤,包括:

28、当句子对的标签为相似标签时,若句子对中的各句子对应插入的是相似标识符对,则该句子对的标签为相似标签不变,若句子对中的各句子对应插入的是不相似标识符对,则该句子对的标签更改为不相似标签;

29、当句子对的标签为不相似标签时,若句子对中的各句子对应插入的是相似标识符对或不相似标识符对,则该句子对的标签始终为不相似标签。

30、本专利技术提供的一种问答系统语义匹配优化方法及装置,通过训练语义匹配模型学习相似标识符与不相似标识符,提升语义匹配模型对标识符的识别效果,结合垂直领域业务词典对句子对进行匹配与标识符替换再进行模型预测的方式,实现了垂直领域业务词典对模型句子对匹配预测结果有效的定向干预,提高了问答系统语义匹配的准确度与专业性。此外,垂直领域业务词典能够随所属领域技术的发展不断完善、更新,而不会影响语义模型训练;句子对的词典匹配与标识符替换可以干预模型预测与辅助决策,可以根据业务需求决定使用与否,而不会影响模型对句子对的匹配功能,更具灵活性。

本文档来自技高网...

【技术保护点】

1.一种问答系统语义匹配优化方法,其特征在于,包括:

2.根据权利要求1所述的一种问答系统语义匹配优化方法,其特征在于,还包括:预先设置所述语义匹配模型需要学习的相似标识符对和不相似标识符对。

3.根据权利要求1所述的一种问答系统语义匹配优化方法,其特征在于,所述语义匹配模型包括siamCNN、BiMPM或者SBERT。

4.根据权利要求1所述的一种问答系统语义匹配优化方法,其特征在于,还包括:

5.根据权利要求4所述的一种问答系统语义匹配优化方法,其特征在于,所述在所述基础训练语料中插入相似标识符对或不相似标识符对,得到增强训练语料的步骤,包括:

6.一种问答系统语义匹配优化装置,其特征在于,包括:

7.根据权利要求6所述的一种问答系统语义匹配优化装置,其特征在于,还包括:预先设置所述语义匹配模型需要学习的相似标识符对和不相似标识符对。

8.根据权利要求6所述的一种问答系统语义匹配优化装置,其特征在于,所述语义匹配模型包括siamCNN、BiMPM或者SBERT。

9.根据权利要求6所述的一种问答系统语义匹配优化装置,其特征在于,还包括语义匹配模型训练模块,被配置为:

10.根据权利要求9所述的一种问答系统语义匹配优化装置,其特征在于,所述语义匹配模型训练模块被进一步配置为:

...

【技术特征摘要】

1.一种问答系统语义匹配优化方法,其特征在于,包括:

2.根据权利要求1所述的一种问答系统语义匹配优化方法,其特征在于,还包括:预先设置所述语义匹配模型需要学习的相似标识符对和不相似标识符对。

3.根据权利要求1所述的一种问答系统语义匹配优化方法,其特征在于,所述语义匹配模型包括siamcnn、bimpm或者sbert。

4.根据权利要求1所述的一种问答系统语义匹配优化方法,其特征在于,还包括:

5.根据权利要求4所述的一种问答系统语义匹配优化方法,其特征在于,所述在所述基础训练语料中插入相似标识符对或不相似标识符对,得到增强训练语料的步骤,包括:...

【专利技术属性】
技术研发人员:杨喆李全忠何国涛蒲瑶马成龙
申请(专利权)人:普强时代珠海横琴信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1