一种基于孪生网络BERT模型的智能问答匹配方法及系统技术方案

技术编号：28131667 阅读：18 留言：0更新日期：2021-04-19 11:54

一种基于孪生网络BERT模型的智能问答匹配方法及系统，涉及智能分类技术领域，所述方法包括S1：收集问题和答案作为数据集；S2：对所述数据集中的问题进行分词操作，获得智能问答语料库；S3：将智能问答语料库导入数据库，在数据库中建立词语对应问题的倒排索引；S4：获取用户问题，将用户问题分词后得到的每个词语放入数据库中检索得到若干候选问题；S5：分别利用编辑距离、TF

全部详细技术资料下载

【技术实现步骤摘要】
一种基于孪生网络BERT模型的智能问答匹配方法及系统

[0001]本专利技术涉及智能问答
，尤其是涉及一种基于孪生网络BERT模型的智能问答匹配方法及系统。

技术介绍

[0002]客服是一种解答顾客疑问，满足顾客合理诉求的职业。其形式以文字客服为主，如淘宝客服、京东客服等。客服是一种机械重复性高，人力密集型的工作。客服人员每天需要接收大量顾客的不同情绪，难免会影响服务质量。
[0003]基于NLP技术实现的客服问答系统，可以精准捕捉用户意图，理解用户自然语言提问，将答案直接返回给用户，能够有效减少客服的工作量。
[0004]在银行领域，有很多不同的理财产品或业务系统，用户或客户经理在操作中难免遇到很多问题，针对这些问题，如果用人工的方式进行解答将会浪费大量人力成本。另外还存在以下几点问题：1、银行已有的问答系统也只是主要基于关键字匹配，无法完全理解用户的问题，给出的答案往往不尽人意，用户体验也十分不好。2、很多问题都是来自同一产品或业务，有的问题可能只差几个字，但是问题的意思完全不相同，如果回答相同则会造成错误，导致一定的经济损失，这是传统的问答系统难以解决的问题。基于以上问题，本专利技术提出了一种针对银行业务的基于孪生网络BERT模型的智能问答匹配方法。

技术实现思路

[0005]有鉴于此，本专利技术提出了一种基于孪生网络BERT模型的智能问答匹配方法及系统，在用户输入问题后，快速准确的从问答问答数据库中匹配相似度最高的问题并显示其答案。
[0006]为实现上述目的，本...

【技术保护点】

【技术特征摘要】
1.一种基于孪生网络BERT模型的智能问答匹配方法，其特征在于，所述方法包括以下步骤：S1：收集问题和答案作为数据集；S2：对所述数据集中的问题进行分词操作，获得智能问答语料库；S3：将智能问答语料库导入数据库，在数据库中建立词语对应问题的倒排索引；S4：获取用户问题，将用户问题分词后得到的每个词语放入数据库中检索得到若干候选问题；S5：分别利用编辑距离、TF
‑
IDF和word2vec三种算法得出用户问题与每个候选问题的字面相似度得分，并利用基于孪生网络的BERT模型得出用户问题与每个候选问题的语义相似度得分；S6：将所述S5中得到的字面相似度得分和语义相似度得分输入逻辑回归模型，得到最终得分，将最终得分最高的候选问题作为最相似问题，从数据库中检索最相似问题对应的答案，完成智能问答匹配。2.根据权利要求1所述的一种基于孪生网络BERT模型的智能问答匹配方法，其特征在于，所述S1具体包括：收集问题和答案，根据关键词词典将问题和答案中的关键词别称改写为标准表述方式，将改写后的问题和答案作为数据集。3.根据权利要求1所述的一种基于孪生网络BERT模型的智能问答匹配方法，其特征在于，所述S2具体包括：利用结巴分词工具对所述数据集中的问题进行分词、过滤停用词，获得智能问答语料库，所述智能问答语料库包括词语、问题和答案。4.根据权利要求1所述的一种基于孪生网络BERT模型的智能问答匹配方法，其特征在于，所述S4具体包括：利用结巴分词工具对用户问题进行分词、过滤停用词，将用户问题分词后得到的每个词语放入数据库中检索得到若干候选问题。5.根据权利要求1所述的一种基于孪生网络BERT模型的智能问答匹配方法，其特征在于，所述S5具体包括：基于编辑距离算法获得用户问题与每个候选问题的字面相似度得分；基于TF
‑
IDF算法分别获得用户问题和每个候选问题的词频向量，将用户问题的词频向量与每个候选问题的词频向量的余弦相似度作为字面相似度得分；基于word2vec算法分别获得用户问题和每个候选问题的句向量，将用户问题的句向量与每个候选问题的句向量的余弦相似...

【专利技术属性】
技术研发人员：李振，鲍东岳，张刚，尹正，徐超，彭加欣，任鹏飞，张雨枫，马圣楠，
申请(专利权)人：民生科技有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人