一种问题回复匹配方法、系统、服务器及存储介质技术方案

技术编号：36249022 阅读：22 留言：0更新日期：2023-01-07 09:41

本发明专利技术公开了一种问题回复匹配方法、系统、服务器及存储介质，该方法包括：获取用户类别和用户提问内容；对用户提问内容进行分词，获得问题分词；根据关键词库和自定义业务词典标识问题分词中的关键词；过滤问题分词中的干扰词；匹配与用户提问内容相似度最高的N个相似问题；匹配相似问题对应的标准问答对并返回用户。本发明专利技术结合了知识库和深度学习算法模型，能有效提升问题回复匹配的效率和精准度。能有效提升问题回复匹配的效率和精准度。能有效提升问题回复匹配的效率和精准度。

全部详细技术资料下载

【技术实现步骤摘要】
一种问题回复匹配方法、系统、服务器及存储介质

[0001]本专利技术涉及人工智能咨询
，具体涉及一种问题回复匹配方法、系统、服务器及存储介质。

技术介绍

[0002]随着互联网行业的发展，各大企业对于答复用户问题的需求大幅提高，然而人工客服存在着培训和管理成本高、员工工作效率低、工作重复度高、服务质量不稳定等问题，也给企业带来了很大的压力。
[0003]人工智能技术的普及促进了智能咨询机器人的发展，智能咨询机器人能够24小时在线为用户回复问题，提高了问题回复的效率，也为企业节省了大量的人工服务成本。但现有的智能咨询机器人也同样存在着许多问题。
[0004]1.由于智能咨询机器人的问题匹配多基于分词后计算相似度，在此过程中，不常见的专业词汇可能被错误分词，从而无法正确匹配与该专业词汇有关的问答对，这也导致了智能咨询机器人在面对不同业务场景时回复准确率低。
[0005]2.问题回复匹配过程中，智能咨询机器人没有面向用户进行分类，也没有设置用户的问题匹配权限。由于不同用户群体涉及同一关键词的提问内容可能关联着不同的问题或回复，使得智能咨询机器人提供的回复并不适合用户的实际情况，影响了问题回复的准确率，在数据安全性上也存在一定问题。
[0006]3.现有的语料知识库多基于数据服务器，语料数据的调用速度较慢，回复匹配系统的计算性能低。
[0007]综上所述，现有智能咨询机器人主要面临着问题回复匹配相关性差、精确度低、计算性能低的问题。

技术实现思路

[0008]针对...

【技术保护点】

【技术特征摘要】
1.一种问题回复匹配方法，其特征在于，包括以下步骤：获取用户类别和用户提问内容；对用户提问内容进行分词，获得问题分词；根据关键词库和自定义业务词典标识问题分词中的关键词；过滤问题分词中的干扰词；匹配与用户提问内容相似度最高的N个相似问题；匹配相似问题对应的标准问答对并返回用户。2.根据权利要求1所述的方法，其特征在于，所述过滤问题分词中的干扰词包括以下步骤：将问题分词与知识库中的敏感词库进行匹配；若问题分词中存在敏感词，则向用户返回存在敏感词的提醒；若问题分词中不存在敏感词，则将问题分词与知识库中的停用词和符号库进行匹配；剔除问题分词中的停用词和符号。3.根据权利要求1所述的方法，其特征在于，所述匹配与用户提问内容相似度最高的N个相似问题包括以下步骤：识别问题分词中是否包括关键词标识；当识别到关键词标识时，通过搜索引擎根据关键词在知识库中搜索与用户提问内容相似度最高的前N个相似问题；当未识别到关键词标识时，将问题分词通过算法模型转换为向量；通过Pysparnn从知识库的相似问题索引文件中召回与用户提问内容相似度排名前N的相似问题；通过孪生神经网络计算相似问题与用户输入内容的相似度，对相似问题按相似度进行降序排列；输出相似度达到预设阈值的相似问题；所述预设阈值由预先设置、人工调整确定。4.根据权利要求3所述的方法，其特征在于，所述相似问题索引文件的生成包括以下步骤：当相似问题以字、词形式存储时，输入BM25字、词模型和Tf
‑
idf字、词模型中转化为字、词维度的向量；当相似问题以文本形式存储时，输入fasttext模型转化为文本维度的向量；将字、词、文本维度的向量输入Sentence2...

【专利技术属性】
技术研发人员：李同兵，孟祥锐，谢镇宇，温嘉敦，唐世洁，
申请(专利权)人：深圳市雁联计算系统有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人