FAQ问答对自动构建方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:23890771 阅读:30 留言:0更新日期:2020-04-22 06:22
本发明专利技术实施例公开了一种FAQ问答对自动构建方法、装置、计算机设备及存储介质。其中,所述方法属于人工智能和自然语言处理技术领域,其包括:获取待阅读的文档;对待阅读的文档进行解析并对解析后的文档进行分段以得到分段后的文档作为目标文档;根据待回答问题及预设的筛选模型,从目标文档中筛选出与待回答问题相匹配的段落作为目标段落;根据目标段落及待回答问题,基于预设的阅读理解模型生成FAQ问答对。本申请实施例由于是先筛选出与待回答问题相匹配的目标段落,再根据目标段落及待回答问题生成FAQ问答对,无需对非目标段落进行处理,在一定程度上减少了生成FAQ问答对时非目标段落带来的干扰信息,使生成的FAQ问答对匹配准确度更高。

FAQ for automatic construction methods, devices, computer equipment and storage media

【技术实现步骤摘要】
FAQ问答对自动构建方法、装置、计算机设备及存储介质
本专利技术涉及人工智能和自然语言处理
,尤其涉及一种FAQ问答对自动构建方法、装置、计算机设备及存储介质。
技术介绍
FAQ是英文FrequentlyAskedQuestions的缩写,中文意思就是“经常问到的问题”,或者更通俗地叫做“常见问题解答”。FAQ被认为是一种常用的在线顾客服务手段,一个好的FAQ系统,应该至少可以回答用户80%的一般问题以及常见问题。这样不仅方便了用户,也大大减轻了网站工作人员的压力,节省了大量的顾客服务成本,并且增加了顾客的满意度。因此,如何有效实现FAQ数据库的构建尤为重要。而目前,问答领域的FAQ自动构建主要有以下三种方法:(1)通过对待阅读的文章和待回答的问题进行分词,获取分词后得到相应的词语串,将词语串输入到自动阅读理解模型中,即可输出与问题对应的答案。(2)根据用户提出的问题与问答库中的已有问句记录相似性,在已有的“问题-答案”对数据库中找到与用户提问相匹配的问句,并将其对应的答案返回给用户,完成FAQ对答。(3)采用对已经建立的FAQ,以人工录入的方式建立与标准问句对应的句式模板。对用户的问句用句式模板进行匹配,再通过句式模板与FAQ的映射,匹配到FAQ。以上三种方法虽然能在一定程度上匹配成功,实现FAQ问答对的自动构建,但FAQ问答对的匹配准确度仍然比较低。
技术实现思路
本专利技术实施例提供了一种FAQ问答对自动构建方法、装置、计算机设备及存储介质,旨在解决现有FAQ问答对自动构建匹配准确度比较低的问题。第一方面,本专利技术实施例提供了一种FAQ问答对自动构建方法,其包括:获取待阅读的文档;对所述待阅读的文档进行解析并对解析后的文档进行分段以得到分段后的文档作为目标文档;根据待回答问题及预设的筛选模型,从所述目标文档中筛选出与所述待回答问题相匹配的段落作为目标段落;根据所述目标段落及所述待回答问题,基于预设的阅读理解模型生成FAQ问答对。第二方面,本专利技术实施例还提供了一种FAQ问答对自动构建装置,其包括:获取单元,用于获取待阅读的文档;解析分段单元,用于对所述待阅读的文档进行解析并对解析后的文档进行分段以得到分段后的文档作为目标文档;筛选单元,用于根据待回答问题及预设的筛选模型,从所述目标文档中筛选出与所述待回答问题相匹配的段落作为目标段落;生成单元,用于根据所述目标段落及所述待回答问题,基于预设的阅读理解模型生成FAQ问答对。第三方面,本专利技术实施例还提供了一种计算机设备,其包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法。第四方面,本专利技术实施例还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序当被处理器执行时可实现上述方法。本专利技术实施例提供了一种FAQ问答对自动构建方法、装置、计算机设备及存储介质。其中,所述方法包括:获取待阅读的文档;对所述待阅读的文档进行解析并对解析后的文档进行分段以得到分段后的文档作为目标文档;根据待回答问题及预设的筛选模型,从所述目标文档中筛选出与所述待回答问题相匹配的段落作为目标段落;根据所述目标段落及所述待回答问题,基于预设的阅读理解模型生成FAQ问答对。本专利技术实施例的技术方案,由于是先筛选出与待回答问题相匹配的目标段落,再根据目标段落及待回答问题生成FAQ问答对,无需对非目标段落进行处理,在一定程度上减少了生成FAQ问答对时非目标段落带来的干扰信息,可使生成的FAQ问答对匹配准确度更高。附图说明为了更清楚地说明本专利技术实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种FAQ问答对自动构建方法的场景示意图;图2为本专利技术实施例提供的一种FAQ问答对自动构建方法的流程示意图;图3为本专利技术实施例提供的一种FAQ问答对自动构建方法的子流程示意图;图4为本专利技术实施例提供的一种FAQ问答对自动构建方法的子流程示意图;图5为本专利技术实施例提供的一种FAQ问答对自动构建方法的子流程示意图;图6为本专利技术另一实施例提供的一种FAQ问答对自动构建方法的流程示意图;图7为本专利技术实施例提供的一种FAQ问答对自动构建装置的示意性框图;图8为本专利技术实施例提供的FAQ问答对自动构建装置的解析分段单元的示意性框图;图9为本专利技术实施例提供的FAQ问答对自动构建装置的筛选单元的示意性框图;图10为本专利技术实施例提供的FAQ问答对自动构建装置的生成单元的示意性框图;图11为本专利技术另一实施例提供的一种FAQ问答对自动构建装置的示意性框图;以及图12为本专利技术实施例提供的一种计算机设备的示意性框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。还应当理解,在此本专利技术说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本专利技术。如在本专利技术说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。还应当进一步理解,在本专利技术说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。请参阅图1,图1是本专利技术实施例提供的一种FAQ问答对自动构建方法的场景示意图。本专利技术实施例的FAQ问答对自动构建方法可应用于服务器中,例如可通过配置于服务器上的软件程序来实现该FAQ问答对自动构建方法。服务器与终端进行通信,以使服务器调用用户通过终端上传的待阅读的文档并根据待回答的问题和待阅读文档进行一系列处理后得到FAQ问答对,实现FAQ问答对的自动构建。该终端可以为台式电脑、手提电脑、平板电脑等,在此不做具体限制。另外,在图1中,该终端和用户的个数为一个,可以理本文档来自技高网...

【技术保护点】
1.一种FAQ问答对自动构建方法,其特征在于,包括:/n获取待阅读的文档;/n对所述待阅读的文档进行解析并对解析后的文档进行分段以得到分段后的文档作为目标文档;/n根据待回答问题及预设的筛选模型,从所述目标文档中筛选出与所述待回答问题相匹配的段落作为目标段落;/n根据所述目标段落及所述待回答问题,基于预设的阅读理解模型生成FAQ问答对。/n

【技术特征摘要】
1.一种FAQ问答对自动构建方法,其特征在于,包括:
获取待阅读的文档;
对所述待阅读的文档进行解析并对解析后的文档进行分段以得到分段后的文档作为目标文档;
根据待回答问题及预设的筛选模型,从所述目标文档中筛选出与所述待回答问题相匹配的段落作为目标段落;
根据所述目标段落及所述待回答问题,基于预设的阅读理解模型生成FAQ问答对。


2.根据权利要求1所述的方法,其特征在于,所述对所述待阅读的文档进行解析并对解析后的文档进行分段以得到分段后的文档作为目标文档,包括:
对所述待阅读的文档采用层叠CRF模型进行解析以得到XML文档;
通过预设分段方式对所述XML文档进行分段,以得到具有预设文档结构的文档作为目标文档。


3.根据权利要求1所述的方法,其特征在于,所述根据待回答问题及预设的筛选模型,从所述目标文档中筛选出与所述待回答问题相匹配的段落作为目标段落,包括:
根据所述待回答问题及预设的所述筛选模型对所述目标文档进行编码以得到第一段落文本向量;
根据所述待回答问题计算每个所述第一段落文本向量与所述待回答问题相匹配的概率;
将概率最大的所述第一段落文本向量所对应的段落确定为与所述待回答问题相匹配的段落,并作为目标段落。


4.根据权利要求1所述的方法,其特征在于,所述根据所述目标段落及所述待回答问题,基于预设的阅读理解模型生成FAQ问答对,包括:
对所述目标段落及所述待回答问题分别进行编码以得到第二段落文本向量及问题文本向量;
对所述第二段落文本向量及所述问题文本向量进行编码以得到新文本向量;
根据预设的提取模型对所述新文本向量进行编码以得到目标文本向量;
对所述目标文本向量进行计算以得到所述待回答问题的答案开始及结束的位置,从而生成所述FAQ问答对。


5.根据权利要求1所述的方法,其特征在于...

【专利技术属性】
技术研发人员:杨凤鑫徐国强
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1