System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 面向文档的问答方法、装置、电子设备、存储介质及产品制造方法及图纸_技高网

面向文档的问答方法、装置、电子设备、存储介质及产品制造方法及图纸

技术编号:42982016 阅读:10 留言:0更新日期:2024-10-15 13:16
本申请提供了一种面向文档的问答方法、装置、电子设备、存储介质及产品,属于人工智能技术领域。所述方法包括:获取查询语句对应的第一语义特征向量及多个源文档的文档标识信息对应的多个第二语义特征向量;从多个第二语义特征向量中,获取与第一语义特征向量之间的语义相似度大于第一预设阈值的至少一个第三语义特征向量;获取至少一个第三语义特征向量对应的至少一个候选文档标识信息;当至少一个候选文档标识信息中包括目标文档标识信息,从目标文档标识信息对应的目标文档中,获取与查询语句之间的相似度高于第二预设阈值的至少一个目标文档段落;基于至少一个目标文档段落,生成查询语句对应的答案。本申请能够提高问答成功率。

【技术实现步骤摘要】

本申请涉及人工智能,特别涉及一种面向文档的问答方法、装置、电子设备、存储介质及产品


技术介绍

1、随着人工智能技术及自然语言处理技术的发展,智能问答系统得到广泛应用。通常智能问答系统维护一个知识库,该知识库中存储有多个文档及其文档名称,而部分用户在使用的时候希望只从一篇/特定几篇文档中来进行问答,不希望引入知识库中无关的文档。当获取到用户输入的包含目标文档名称的查询语句后,在传统的智能问答系统中,从查询语句中识别出目标文档名称,然后将目标文档名称与知识库中存储的各个文档名称进行匹配,如果任一文档名称与目标文档名称相匹配,则基于与目标文档名称匹配的文档名称,从知识库中获取对应的目标文档,进而基于目标文档,生成查询语句对应的答案。

2、然而,查询语句中的文档名称和问题以各种语法形式组合在一起难以直接准确提取,且由于知识库中存储的文档名称以及查询语句中的文档名称可能存在简写、缩写等情况,当知识库中的文档名称或查询语句中的文档名称被简写或改写,采用上述文档名称直接匹配的方法,无法从知识库中查询到目标文档,更无法基于目标文档生成查询语句对应的答案,导致问答成功率较低。


技术实现思路

1、本申请实施例提供了一种面向文档的问答方法、装置、电子设备、存储介质及产品,能够提高问答成功率。所述技术方案如下:

2、第一方面,提供了一种面向文档的问答方法,所述方法包括:

3、获取用户的查询语句对应的第一语义特征向量,并获取多个源文档的文档标识信息对应的多个第二语义特征向量,所述查询语句包括目标文档标识信息;

4、从所述多个第二语义特征向量中,获取与所述第一语义特征向量之间的语义相似度大于第一预设阈值的至少一个第三语义特征向量;

5、获取所述至少一个第三语义特征向量对应的至少一个候选文档标识信息;

6、识别所述至少一个候选文档标识信息中是否包括所述目标文档标识信息;

7、当所述至少一个候选文档标识信息中包括所述目标文档标识信息,从所述目标文档标识信息对应的目标文档中,获取与所述查询语句之间的相似度高于第二预设阈值的至少一个目标文档段落;

8、基于所述至少一个目标文档段落,生成所述查询语句对应的答案。

9、第二方面,提供了一种面向文档的问答方法,所述方法包括:

10、获取用户针对电力领域的查询语句对应的第一语义特征向量,并获取电力领域的多个源文档的文档标识信息对应的多个第二语义特征向量,所述查询语句包括目标文档标识信息;

11、从所述多个第二语义特征向量中,获取与所述第一语义特征向量之间的语义相似度大于第一预设阈值的至少一个第三语义特征向量;

12、获取所述至少一个第三语义特征向量对应的至少一个候选文档标识信息;

13、识别所述至少一个候选文档标识信息中是否包括所述目标文档标识信息;

14、当所述至少一个候选文档标识信息中包括所述目标文档标识信息,从所述目标文档标识信息对应的目标文档中,获取与所述查询语句之间的相似度高于第二预设阈值的至少一个目标文档段落;

15、基于所述至少一个目标文档段落,生成所述查询语句对应的答案。

16、第三方面,提供了一种面向文档的问答装置,所述装置包括:

17、第一获取模块,用于获取用户的查询语句对应的第一语义特征向量,并获取多个源文档的文档标识信息对应的多个第二语义特征向量,所述查询语句包括目标文档标识信息;

18、第二获取模块,用于从所述多个第二语义特征向量中,获取与所述第一语义特征向量之间的语义相似度大于第一预设阈值的至少一个第三语义特征向量;

19、第三获取模块,用于获取所述至少一个第三语义特征向量对应的至少一个候选文档标识信息;

20、识别模块,用于识别所述至少一个候选文档标识信息中是否包括所述目标文档标识信息;

21、第四获取模块,用于当所述至少一个候选文档标识信息中包括所述目标文档标识信息,从所述目标文档标识信息对应的目标文档中,获取与所述查询语句之间的相似度高于第二预设阈值的至少一个目标文档段落;

22、生成模块,用于基于所述至少一个目标文档段落,生成所述查询语句对应的答案。

23、第四方面,提供了一种面向文档的问答装置,所述装置包括:

24、第一获取模块,用于获取用户针对电力领域的查询语句对应的第一语义特征向量,并获取电力领域的多个源文档的文档标识信息对应的多个第二语义特征向量,所述查询语句包括目标文档标识信息;

25、第二获取模块,用于从所述多个第二语义特征向量中,获取与所述第一语义特征向量之间的语义相似度大于第一预设阈值的至少一个第三语义特征向量;

26、第三获取模块,用于获取所述至少一个第三语义特征向量对应的至少一个候选文档标识信息;

27、识别模块,用于识别所述至少一个候选文档标识信息中是否包括所述目标文档标识信息;

28、第一获取模块,用于当所述至少一个候选文档标识信息中包括所述目标文档标识信息,从所述目标文档标识信息对应的目标文档中,获取与所述查询语句之间的相似度高于第二预设阈值的至少一个目标文档段落;

29、生成模块,用于基于所述至少一个目标文档段落,生成所述查询语句对应的答案。

30、第五方面,提供了一种电子设备,包括处理器以及存储器;所述存储器存储至少一条程序代码;所述至少一条程序代码用于被所述处理器调用并执行,以实现第一方面所述的面向文档的问答方法,或第二方面所述的面向文档的问答方法。

31、第六方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条计算机程序,所述至少一条计算机程序被处理器执行时能够实现第一方面所述的面向文档的问答方法,或第二方面所述的面向文档的问答方法。

32、第七方面,提供了一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时能够实现第一方面所述的面向文档的问答方法,或第二方面所述的面向文档的问答方法。

33、本申请实施例提供的技术方案带来的有益效果是:

34、基于用户的查询语句对应的第一语义特征向量和源文档的文档标识信息对应的第二语义特征向量,计算第一语义特征向量与第二语义特征向量之间的语义相似度,然后基于所计算的语义相似度选取候选文档标识信息。由于语义相似度能够反映查询语句与文档标识信息在语义上的相似度程度,即便源文档的文档名称或查询语句中的文档名称被简写或改写,源文档的文档名称和查询语句在语义方面依然相似,因此,采用本申请实施例提供的方法能够查询到与查询语句在语义方面相似的候选文档标识信息,提高了问答成功率。另外,用户的查询语句中会携带目标文档标识信息,而基于语义相似度获取到的候选文档标识信息的数量往往较大,为提高问答效率及用户满意度,本申请实施例在获取到至少一个候选文档标识信息之后,还将识别本文档来自技高网...

【技术保护点】

1.一种面向文档的问答方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述获取用户的查询语句对应的第一语义特征向量,包括:

3.根据权利要求1所述的方法,其特征在于,所述获取多个源文档的文档标识信息对应的多个第二语义特征向量之前,还包括:

4.根据权利要求1所述的方法,其特征在于,所述识别所述至少一个候选文档标识信息中是否包括所述目标文档标识信息,包括:

5.根据权利要求1所述的方法,其特征在于,所述识别所述至少一个候选文档标识信息中是否包括所述目标文档标识信息,包括:

6.根据权利要求1所述的方法,其特征在于,所述识别所述至少一个候选文档标识信息中是否包括所述目标文档标识信息,包括:

7.根据权利要求1所述的方法,其特征在于,所述从所述目标文档标识信息对应的目标文档中,获取与所述查询语句之间的相似度高于第二预设阈值的至少一个目标文档段落,包括:

8.根据权利要求1所述的方法,其特征在于,所述基于所述至少一个目标文档段落,生成所述查询语句对应的答案,包括:

9.根据权利要求1所述的方法,其特征在于,所述方法还包括:

10.根据权利要求1至9中任一项所述的方法,其特征在于,所述文档标识信息包括文档名称、领域标准名称中任一项。

11.一种面向文档的问答方法,其特征在于,所述方法包括:

12.一种面向文档的问答装置,其特征在于,所述装置包括:

13.一种面向文档的问答装置,其特征在于,所述装置包括:

14.一种电子设备,其特征在于,包括处理器以及存储器;所述存储器存储至少一条程序代码;所述至少一条程序代码用于被所述处理器调用并执行,以实现如权利要求1至10中任一项所述的面向文档的问答方法,或权利要求11所述的面向文档的问答方法。

15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条计算机程序,所述至少一条计算机程序被处理器执行时能够实现如权利要求1至10中任一项所述的面向文档的问答方法,或权利要求11所述的面向文档的问答方法。

16.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时能够实现如权利要求1至10中任一项所述的面向文档的问答方法,或权利要求11所述的面向文档的问答方法。

...

【技术特征摘要】

1.一种面向文档的问答方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述获取用户的查询语句对应的第一语义特征向量,包括:

3.根据权利要求1所述的方法,其特征在于,所述获取多个源文档的文档标识信息对应的多个第二语义特征向量之前,还包括:

4.根据权利要求1所述的方法,其特征在于,所述识别所述至少一个候选文档标识信息中是否包括所述目标文档标识信息,包括:

5.根据权利要求1所述的方法,其特征在于,所述识别所述至少一个候选文档标识信息中是否包括所述目标文档标识信息,包括:

6.根据权利要求1所述的方法,其特征在于,所述识别所述至少一个候选文档标识信息中是否包括所述目标文档标识信息,包括:

7.根据权利要求1所述的方法,其特征在于,所述从所述目标文档标识信息对应的目标文档中,获取与所述查询语句之间的相似度高于第二预设阈值的至少一个目标文档段落,包括:

8.根据权利要求1所述的方法,其特征在于,所述基于所述至少一个目标文档段落,生成所述查询语句对应的答案,包括:

9.根据权利要求1所述的方法,其特征在于,所述方法...

【专利技术属性】
技术研发人员:黄伟王浩郑秋硕王华胤曾震宇
申请(专利权)人:阿里云飞天杭州云计算技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1