知识问答方法、装置、设备和存储介质制造方法及图纸

技术编号:38815399 阅读:10 留言:0更新日期:2023-09-15 19:54
本公开提供了一种知识问答方法、装置、设备和存储介质,涉及人工智能技术领域,尤其涉及深度学习和自然语言处理技术,特别涉及大模型技术。具体实现方案为:获取问询语句、问询语句的历史关联语句以及知识库;其中,知识库中存储有基于参考文本内容生成的问答数据;根据问询语句和历史关联语句,生成问询语句的问询衍生语句;在知识库中查询与问询衍生语句相匹配的问答数据;根据匹配结果,生成问询语句的目标答案数据。根据本公开的技术,提高了知识问答结果的准确度。问答结果的准确度。问答结果的准确度。

【技术实现步骤摘要】
知识问答方法、装置、设备和存储介质


[0001]本公开涉及人工智能
,尤其涉及深度学习和自然语言处理技术,特别涉及大模型技术。

技术介绍

[0002]随着人工智能的不断发展,智能问答已经应用至语音助手、智能客服以及在线咨询等服务领域。智能问答是指以自然语言理解为核心,通过对输入的问询语句进行语义分析,然后在大规模知识库通过语义检索或对话管理等技术,匹配相关问题,最后通过自然语言生成技术,进行答案的生成和回复。

技术实现思路

[0003]本公开提供了一种准确度更好的知识问答方法、装置、设备和存储介质。
[0004]根据本公开的一方面,提供了一种知识问答方法,包括:
[0005]获取问询语句、所述问询语句的历史关联语句以及知识库;其中,所述知识库中存储有基于参考文本内容生成的问答数据;
[0006]根据所述问询语句和所述历史关联语句,生成所述问询语句的问询衍生语句;
[0007]在所述知识库中查询与所述问询衍生语句相匹配的问答数据;
[0008]根据匹配结果,生成所述问询语句的目标答案数据。
[0009]根据本公开的另一方面,还提供了一种电子设备,包括:
[0010]至少一个处理器;以及
[0011]与所述至少一个处理器通信连接的存储器;其中,
[0012]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开实施例所提供的任意一种知识问答方法。
[0013]根据本公开的另一方面,还提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使计算机执行本公开实施例所提供的任意一种知识问答方法。
[0014]根据本公开的技术,提高了知识问答结果的准确度。
[0015]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0016]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0017]图1是本公开实施例提供的一种知识问答方法的流程图;
[0018]图2是本公开实施例提供的另一种知识问答方法的流程图;
[0019]图3是本公开实施例提供的另一种知识问答方法的流程图;
[0020]图4是本公开实施例提供的一种知识问答装置的结构图;
[0021]图5是用来实现本公开实施例的知识问答方法的电子设备的框图。
具体实施方式
[0022]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0023]本公开实施例提供的知识问答方法和知识问答装置,适用于在人机交互过程中进行知识问答的应用场景。本公开实施例所提供的各知识问答方法,可以由知识问答装置执行,该装置可以采用软件和/或硬件实现,并具体配置于电子设备中,该电子设备可以是智能终端,例如手机、平板、智能音箱、智能穿戴设备或客服机器人等,本公开对此不作任何限定。
[0024]为了便于理解,首先对知识问答方法进行详细说明。
[0025]参见图1所示的知识问答方法,包括:
[0026]S101、获取问询语句、问询语句的历史关联语句以及知识库;其中,知识库中存储有基于参考文本内容生成的问答数据。
[0027]其中,问询语句可以是在进行知识问答时,所输入的携带问询问题的语句。其中,问询语句可以文本数据,或者将其他形式的数据(如语音等)对应的文本数据转化结果,本公开对此不作任何限定。
[0028]其中,问询语句的历史关联语句,可以是相同语境下与问询语句相关的历史问询语句,例如可以是与问询语句的输入时间相邻和/或输入次数相邻的历史问询语句。其中,输入时间相邻的历史问询语句,可以是在问询语句的输入时间之前的历史预设时间段内,所输入的问询语句;输入次数相邻的历史问询语句,可以是在问询语句的输入次数之前的历史预设次数阈值内,所输入的问询语句。其中,历史预设时间段或历史预设次数阈值,可以由技术人员根据需要或经验值进行设置,或通过大量试验确定,本公开对此不作任何限定。
[0029]需要说明的是,为了保证知识问答结果的准确度,通常问询语句和问询语句的历史关联语句,为相同账号或相同问询方所输入的问询语句。
[0030]其中,知识库中预先存储有至少一条问答数据,用于作为知识问答过程中,进行答案数据确定的基础。其中,问答数据中可以包括参考答案数据;或者,可选的,问答数据中还可以包括参考答案数据对应的参考问题数据。其中,参考文本内容可以是用于生成问答数据所采用的文本数据。
[0031]示例性的,可以直接获取参考文本内容,或者,获取富媒体数据,并对富媒体数据进行文本内容提取,并将提取结果作为参考文本内容;基于参考文本内容生成问答数据;将所生成问答数据存储至预先构建的知识库中,以供后续进行问答数据的查询匹配。其中,富媒体数据中可以承载有文本、图片、语音、视频和文件等至少一种媒体形式的信息。
[0032]可选的,可以直接将参考文本内容中所携带的数据作为问答数据;或者可选的,对参考文本内容进行处理,并将处理结果作为问答数据。
[0033]需要说明的是,进行知识库构建的执行设备,与进行知识问答的执行设备,两者可以相同或不同,本公开对此不作任何限定。
[0034]值得注意的是,对问询语句和问询语句的历史关联语句的获取,以及知识库的获取,两获取过程可以先后执行、同时进行或交叉执行,本公开对不同数据的具体获取时机不作任何限定,仅需保证在进行相应数据前能够获取到即可。
[0035]S102、根据问询语句和历史关联语句,生成问询语句的问询衍生语句。
[0036]其中,问询衍生语句可以为无歧义且无内容缺失的问询语句。
[0037]由于问询语句和历史关联语句语境相同,因此历史关联语句能够补充问询语句中的省略内容,实现对问询语句的内容补全;和/或,能够补充问询语句中的指代内容,实现对问询语句中的指代消解。因此,根据历史关联语句对问询语句进行内容补全和/或指代消解,能够生成无歧义且无内容缺失的问询衍生语句,为后续知识问答结果的准确度的提高,奠定了基础。
[0038]在一个可选实施例中,可以对问询语句和历史关联语句进行语义分析,并根据语义分析结果,对问询语句进行内容补充和/或指代消解,得到问询衍生语句。其中,语义分析可以包括句法分析和句子成分分析等中的至少一种。
[0039]在另一可选实施例中,可以基于大语言模型,根据问询语句和历史关联语句,生成问询衍生语句。其中,大语言模型基于不同自然语言任务下的训练文本数据学习得到。...

【技术保护点】

【技术特征摘要】
1.一种知识问答方法,包括:获取问询语句、所述问询语句的历史关联语句以及知识库;其中,所述知识库中存储有基于参考文本内容生成的问答数据;根据所述问询语句和所述历史关联语句,生成所述问询语句的问询衍生语句;在所述知识库中查询与所述问询衍生语句相匹配的问答数据;根据匹配结果,生成所述问询语句的目标答案数据。2.根据权利要求1所述的方法,其中,所述根据所述问询语句和所述历史关联语句,生成所述问询语句的问询衍生语句,包括:基于大语言模型,根据所述问询语句和所述历史关联语句,生成所述问询衍生语句;其中,所述大语言模型基于不同自然语言任务下的训练文本数据学习得到。3.根据权利要求1或2所述的方法,其中,所述知识库包括第一知识库和/或第二知识库;所述第一知识库中存储有参考文本内容中所包含的问答对;所述第二知识库中存储有参考文本内容的知识生成数据。4.根据权利要求3所述的方法,其中,所述知识生成数据采用以下方式生成:基于大语言模型,对所述参考文本内容进行知识生成,得到包括问答数据的知识生成数据;其中,所述大语言模型基于不同自然语言任务下的训练文本数据学习得到。5.根据权利要求3所述的方法,其中,所述问答对采用以下方式识别得到:根据参考内容文档所使用的文档结构模板、所述参考内容文档的文档类型以及所述参考内容文档中预设分隔符的使用情况中的至少一种,识别所述参考文本内容中的问答对;其中,所述参考文本文档中携带有所述参考内容文档。6.根据权利要求3所述的方法,若所述知识库包括第一知识库和第二知识库,则所述在所述知识库中查询与所述问询衍生语句相匹配的问答数据,包括:在所述第一知识库中查询与所述问询衍生语句相匹配的问答数据;若在所述第一知识库中匹配失败,则在所述第二知识库中查询与所述问询衍生语句相匹配的问答数据。7.根据权利要求3

6任一项所述的方法,其中,若所述问答数据为第二知识库中的匹配结果,则所述根据匹配结果,生成所述问询语句的目标答案数据,包括:基于大语言模型,根据匹配结果和所述问询衍生语句,生成所述问询语句的目标答案数据;其中,所述大语言模型基于不同自然语言任务下的训练文本数据学习得到。8.根据权利要求7所述的方法,其中,所述基于大语言模型,根据匹配结果和所述问询衍生语句,生成所述问询语句的目标答案数据,包括:根据匹配结果和所述问询衍生语句,生成答案模板数据;基于所述大语言模型,根据所述答案模板数据,生成所述问询语句的目标答案数据。9.根据权利要求6所述的方法,其中,所述方法还包括:若在所述第二知识库中匹配失败,则获取人工输入的所述问询衍生语句的标准答案数据,并将获取结果作为所述目标答案数据;
将所述问询衍生语句和所述标准答案数据作为新的问答对,存储至所述第一知识库中。10.一种知识问答装置,包括:数据获取模块,用于获取问询语句、所述问询语句的历史关联语句以及知识库;其中,所述知识库中存储有基于参考文本内容生成的问答数据;问询衍生语句生成模块,用于根据所述问询语句和所述历史关联语句,生成所述问询语句的问询衍生语句;查询匹配模块,用于在所述知识库中查询与所述问询衍生语句相匹配的问答数据;目标答案数据生成模块,用于根据匹配结果,生成...

【专利技术属性】
技术研发人员:卜崇宇孙权董大祥王高俊罗冬冬包顺科陈春筝赵亚飞刘瑛刘倩
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1