一种基于多路召回的多场景智能问答方法和系统技术方案

技术编号：35953622 阅读：18 留言：0更新日期：2022-12-14 10:47

本发明专利技术涉及人工智能领域，尤其是涉及一种基于多路召回的多场景智能问答方法和系统，该方法包括：步骤S100：用户提出实时问题，并将问题同时输入到多路模型进行问题检索和任务识别，召回各路模型检索到的带有相似度的第一候选问题列表；步骤S200：将多路模型返回的第一候选问题列表进行归并，并按照相似度进行排序，生成第二候选问题列表；步骤S300：从第二候选问题列表中，根据阈值获得Top1或者Topk问题列表，生成回答响应用户。本发明专利技术可以进一步提升在多场景问答场景下的召回精度；同时基于多路召回的机制，满足多路模型并发运行的要求，提升运行效率。提升运行效率。提升运行效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多路召回的多场景智能问答方法和系统

[0001]本专利技术涉及人工智能领域，尤其是涉及一种基于多路召回的多场景智能问答方法和系统。

技术介绍

[0002]自然语言处理是人工智能领域重要的一个分支，而智能问答又是自然语言处理领域非常经典应用场景之一，也是人机交互较常用的手段之一。如线上智能客服机器人、线下大厅接待机器人、智能语音助手等。智能问答能够理解以自然语言描述的用户提问，并生成包含答案的回复内容或者执行用户下发的任务。智能问答系统按不同的场景，我们一般分为 FAQ问答系统、（特定领域）任务型问答系统。
[0003]在单一场景下，目前已经有较多成熟的解决方案，在各自的应用场景下也起到了不错的效果。然而，在实际场景中，我们经常会遇到多场景融合的智能问答场景，即智能问答既要能实现FQA问答类型，也能满足特定领域内的任务型问答。目前主流的方法之一是先对用户提出的问题进行分类，判断当前用户问题的所属场景，然后再进入到具体分类下进行问题检索或者识别指令执行任务。然而在实际的不同业务领域中，相同的用户问题也可能表示不同的业务需求，因此容易发生问题分类与用户实际的业务需求不一致的错误。即使系统内有对应的回答或者任务，也会导致因问题分类出错而出现回答错误或者执行错误的情况，即召回精度低。
[0004]另外一种主流的方法是按顺序进行不同类别的问题检索，例如首先基于FAQ类问题检索，如果当前匹配到Top1的问题，则认为命中该问题，返回该问题的答案；如果未匹配到Top1的问题，则进入到下一类问题的检索。这种方法存...

【技术保护点】

【技术特征摘要】
1.一种基于多路召回的多场景智能问答方法，其特征在于，包括以下步骤：步骤S100：用户提出实时问题，并将问题同时输入到多路模型进行问题检索和任务识别，召回各路模型检索到的带有相似度的第一候选问题列表；步骤S200：将多路模型返回的第一候选问题列表进行归并，并按照相似度进行排序，生成第二候选问题列表；步骤S300：从第二候选问题列表中，根据阈值获得Top1或者Topk问题列表，生成回答响应用户。2.如权利要求1所述的一种基于多路召回的多场景智能问答方法，其特征在于，所述多路模型进行的问题检索和任务识别为并行计算，多路模型具体包括：基于关键字检索模型、基于语义检索模型、任务识别模型，所述的基于关键字检索模型和基于语义检索模型用于FAQ问答场景，任务识别模型用于任务型问答场景。3.如权利要求2所述的一种基于多路召回的多场景智能问答方法，其特征在于，所述基于关键字检索模型对输入的问题进行关键字检索，获得基于关键字召回的带有相似度的候选问题列表，具体包括以下步骤：步骤S111，去除输入的问题中的停顿词并对问题进行分词处理；步骤S112，通过Elasticsearch搜索引擎对问题进行检索；步骤S113，召回Top k 的最相关问题列表；步骤S114，计算用户输入的问题与步骤S113中的召回的问题的相似度，获得基于关键字召回的带有相似度的候选问题列表。4.如权利要求3所述的一种基于多路召回的多场景智能问答方法，其特征在于，所述步骤S114，具体包括以下子步骤：步骤S1141，将用户输入的问题通过 Sentence
‑
BERT模型进行句子编码，生成一个句向量，用Q1表示；步骤S1142，将召回列表中的k个问题，通过 Sentence
‑
BERT模型进行句子编码，生成k个句向量，用Pi(i=1,2,3
…
,k)表示；步骤S1143，采用余弦相似度计算方法，计算Q1与Pi之间的相似度，用SKi(i=1,2,3
…
,k)表示，获得基于关键字召回的带有相似度的候选问题列表。5.如权利要求3所述的一种基于多路召回的多场景智能问答方法，其特征在于，所述基于语义检索模型对输入的问题进行语义检索，获得基于语义检索的召回问题列表，具体包括以下步骤：步骤S121，将用户输入的问题，通过 Sentence
‑
BERT模型进行问题句子的语义编码，生成语义编码向量；步骤S122，利用生成的语义编码向量，通过Milvus向量搜索引擎进行查询，采用归一化的向量内积法计算向量相似度，返回相似度最高的Top k 个相似向量ID；步骤S123，利用召回的Top k个相似向量ID，进一步获取问题列表，具体为：与步骤S122同步进行通过Sentence
‑
BERT模型对问题进行句向量编码，并将句向量存储于Elas...

【专利技术属性】
技术研发人员：李月标，谭一匡，王梁昊，张灵箭，郭坤龙，王娱，
申请(专利权)人：之江实验室，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人