一种基于政务机器问答系统的人机自动切换的模型与方法技术方案

技术编号:15747392 阅读:101 留言:0更新日期:2017-07-03 04:45
一种基于政务机器问答系统的人机自动切换的模型与方法,发明专利技术适用于政务机器问答系统无法准确回答用户问题的复杂场景。所述方法包括以下步骤:1)根据用户提问的问题提取语意,并与知识库中的问题集进行比对,计算其相似度;2)如果该问题与知识库中所有问题的相似度都较低,则机器问答系统拒绝回答,后台自动转到人工客服处理;3)将该问题与人工客服的回答自动加入知识库,基于主动学习思想,重新训练模型,进一步提高政务机器问答系统的性能。本发明专利技术在节省政务问答人力成本的基础上,很好的保障了机器问答的准确性。同时,通过主动学习,能够不断提高问答系统的效率与准确率。

A model and method of human machine automatic switching based on government machine question answering system

A model and method for automatic handover of human machine based on the government machine question answering system is invented, which is suitable for the complicated question of the answering question of the user of an administrative machine question answering system. The method comprises the following steps: 1) according to user questions semantic extraction, and compared with the knowledge base of the problem sets, compute the similarity; 2) if all the similarity problem and knowledge base are low, the machine refused to answer the question answering system, after Taiwan automatically transferred to the artificial customer service; 3) the question and answer automatically add artificial customer service knowledge base, active learning based on the idea of re training model, to further improve the performance of e-government machine answering system. The invention ensures the accuracy of the machine question and answer on the basis of saving the manpower cost of the government questions and answers. At the same time, through active learning, we can continuously improve the efficiency and accuracy of question answering system.

【技术实现步骤摘要】
一种基于政务机器问答系统的人机自动切换的模型与方法
本专利技术属于大数据分析范畴,更准确的讲,涉及到模糊学习和主动学习的相关技术。
技术介绍
目前的机器问答系统、以及专家系统中,问答的准确率不高,对一些特殊的问题的回答并不理想,即存在问答死角问题。同时,系统过于依赖机器系统,缺乏灵活的机制。
技术实现思路
本专利技术的目的是通过人机结合的方式提高政务机器问答的准确率。当机器不能准确回答问题的时候,系统自动转入人工服务,由人工客服亲自回答。同时,客服回答的内容,自动加入知识库,并重新训练模型,通过主动学习的方法,进一步提高机器问答系统的性能。本专利技术包含两个技术要点:1)如何判断机器无法准确回答从而需要转人工服务?假设政务机器问答系统包含N个标准答案{a1,a2,…,aN}、M个标准问题{q1,q2,…,qM},其中每个标准问题qm与标准答案集中唯一an对应。对每一个用户提问问题u,问答系统计算其与每个标准问题的相似度dist(u,qm),然后找出相似度最大的标准问题,该标准问题对应的标准答案即为机器回答结果。当问答系统不能准确回答,有两种情况:a)用户提问问题的答案不在标准答案中;b)用户提问问题存在歧义,与两个标准问题的相似度都很高。基于这两种情况,本专利技术设定两个阈值th1、th2。假设q0、q′分别为与问题u最相似和次相似的标准问题,则以下两种情况系统自从转入人工客服:a)dist(u,q0)<th1b)dist(u,q0)-dist(u,q′)<th22)如何利用客服回答的标准答案提高系统性能?主动学习的基本思想为:在机器学习中,当有类标样本较少的时候,学习器的性能可能较低;另一方面,大量的无类标样本在空间中的分布大不相同,且对于学习器的意义也不同。主动学习是通过比较无类标样本在学习器中的概率,找出最无把握、也最有信息量的无类标样本,然后将该样本进行标注并加入有类标样本集中;根据更新的样本集,重新训练学习器,直到学习器稳定。本专利技术利用前面的技术要点判断机器无法准确回答的问题(两个阈值th1、th2),该问题对于问答系统而言同样也是最有信息量的无类标样本。因此,保存人工客服回答内容,定期整理,并将整理后的结果放入标准问题集与标准答案集中,最后重新训练学习模型。附图说明图1为本专利技术的流程图。具体实施方式参见附图1,本专利技术包括以下主要步骤:1)用户提问问题,并与知识库中的标准问题集进行比对,计算其相似度;2)如果该问题与最相似的标准问题仍差别较大,则机器问答系统拒绝回答,后台自动转到人工客服处理;3)如果该问题与最相似和次相似标准问题的差别不大,则机器问答系统拒绝回答,后台自动转到人工客服处理;4)保存人工客服处理结果,定期整理,将整理的标准问题集与标准答案集加入知识库;5)基于更新的标准问题集与标准答案集,重新训练模型,进一步提高政务机器问答系统的性能。最后所应说明的是,以上实施例仅用以说明而并非限制本专利技术所描述的技术方案;因此,尽管本说明书参照上述的实施例对本专利技术已进行了详细的说明,但是,本领域的普通技术人员应当理解,仍然可以对本专利技术进行修改或者等同地替换;而一切不脱离本专利技术的精神和范围的技术方案及其改进,其均应涵盖在本专利技术的权利要求范围当中。本文档来自技高网...
一种基于政务机器问答系统的人机自动切换的模型与方法

【技术保护点】
一种提供统一资源服务的方法,其特征在于:该方法至少包括如下的步骤:步骤1:用户提问问题,并与知识库中的标准问题集进行比对,计算其相似度;步骤2:如果该问题与最相似的标准问题仍差别较大,则机器问答系统拒绝回答,后台自动转到人工客服处理;步骤3:如果该问题与最相似和次相似标准问题的差别不大,则机器问答系统拒绝回答,后台自动转到人工客服处理;步骤4:保存人工客服处理结果,定期整理,将整理的标准问题集与标准答案集加入知识库;步骤5:基于更新的标准问题集与标准答案集,重新训练模型,进一步提高政务机器问答系统的性能。

【技术特征摘要】
1.一种提供统一资源服务的方法,其特征在于:该方法至少包括如下的步骤:步骤1:用户提问问题,并与知识库中的标准问题集进行比对,计算其相似度;步骤2:如果该问题与最相似的标准问题仍差别较大,则机器问答系统拒绝回答,后台自动转到人工客服处理;步骤3:如果该问题...

【专利技术属性】
技术研发人员:李方平李扬孙兆才
申请(专利权)人:神州数码信息系统有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1