多轮智能问答方法、系统以及控制器和介质技术方案

技术编号:23161712 阅读:39 留言:0更新日期:2020-01-21 21:59
本发明专利技术涉及一种多轮智能问答方法、系统以及控制器和介质,所述方法包括:获取当前轮和先前轮的问句信息;基于所述当前轮和先前轮的问句信息获取当前轮的意图和实体,以及先前轮的意图、实体和回答模板类型;基于所获取的当前轮的意图和实体,以及先前轮的意图、实体和回答模板类型选择最优回答。本发明专利技术基于意图识别和实体抽取实现多轮问答,提高了多轮问答的准确率,降低了维护成本。

【技术实现步骤摘要】
多轮智能问答方法、系统以及控制器和介质
本专利技术涉及人机交互
,尤其涉及一种多轮智能问答方法、系统以及控制器和介质。
技术介绍
现在智能问答系统多以一问一答的方式构建,部分多轮问答系统仅是简单基于后处理判断意图实体来解决交互问题,不能有效结合当前问答之间的问答留下来的信息来处理多轮问答的机器回复。但是,对于越来越多的任务型问答需求,往往需要保存前后人机交互留下的信息,并且根据以往交互信息,机器抛出问题引导客户完成任务型问答,这样对问答系统要求比较高,以往的简单交互和基于规则的多轮不能够满足如今的任务型多轮问答,表达能力有限且不易维护。
技术实现思路
本专利技术目的在于,提供一种多轮智能问答方法、系统以及控制器和介质,基于意图识别和实体抽取实现多轮问答,提高了多轮问答的准确率,降低了维护成本。根据本专利技术第一实施例,提供了一种多轮智能问答方法,包括:获取当前轮和先前轮的问句信息;基于所述当前轮和先前轮的问句信息获取当前轮的意图和实体,以及先前轮的意图、实体和回答模板类型;基于所获取的当前轮的意图和实体,以及先前轮的意图、实体和回答模板类型选择最优回答。所述基于所获取的当前轮的意图和实体,以及先前轮的意图、实体和回答模板类型选择最优回答,包括:基于所述当前轮的意图和实体,以及先前轮的意图、实体和回答模板类型生成当前轮问答序列,基于所述当前轮问答序列选择最优回答。进一步的,所述基于所述当前轮问答序列选择最优回答,包括:将所述当前轮问答序列输入预先训练好的LSTM模型,输出当前回答模板类型,根据所述当前回答模板类型输出回答,即为所述最优回答。进一步的,还包括:获取所述LSTM模型,具体包括:采集问答序列做训练数据,每一个所述问答序列至少包括一组问句类别、问句实体、回答模板类型这三个信息;基于所述问答序列构建问答序列向量;调参并训练LSTM类别概率器得到所述LSTM模型。进一步的,获取问句信息,包括:将用户输入的问句进行分词、去除停用词和无效字符以及同一字体处理,得到文本序列。进一步的,所述基于所述问句信息确定意图和实体,包括:将所述文本序列转换为文本向量后输入至预先训练好的意图分类模型中,得到对应的意图;将所述文本序列输入预先训练好的实体提取模型中,得到对应的实体。进一步的,所述方法还包括获取所述意图分类模型和实体提取模型,具体包括:采集符合应用场景的问答数据作为训练集文本;将所述训练集文本进行分词、去停用词和无效字符、统一字体处理;构建空间向量模型,再进行特征选择,特征加权,特征降维处理;调参并训练分类器得到所述意图分类模型;将所述训练集文本进行数据清洗后进行序列标注,得到CRF的训练数据;设置特征模板和CRF的训练数据标签;调参并训练CRF实体提取器得到所述实体提取模型。进一步的,根据应用场景设定对应的意图校验规则和实体校验规则,根据所述意图校验规则和实体校验规则检测并校正所获取的意图和实体。根据本专利技术第二实施例,提供了一种多轮智能问答系统,包括:问句信息获取模块,配置为获取当前轮和先前轮的问句信息;意图实体确定模块,配置为基于所述当前轮和先前轮的问句信息获取当前轮的意图和实体,以及先前轮的意图、实体和回答模板类型;最优回答选择模块,配置为基于所获取的当前轮的意图和实体,以及先前轮的意图、实体和回答模板类型选择最优回答。进一步的,所述最优回答选择模块包括:问答序列生成单元:配置为基于所述当前轮的意图和实体,以及先前轮的意图、实体和回答模板类型生成当前轮问答序列,最优回答选择单元,配置为基于所述当前轮问答序列选择最优回答。进一步的,所述最优回答选择单元还配置为:将所述当前轮问答序列输入预先训练好的LSTM模型,输出当前回答模板类型,根据所述当前回答模板类型输出回答,即为所述最优回答。进一步的,所述系统还包括第一模型建立模块,配置为获取所述LSTM模型;所述第一模型建立模块包括:训练数据采集单元,配置为采集问答序列做训练数据,每一个所述问答序列至少包括一组问句类别、问句实体、回答模板类型这三个信息;问答序列向量构建单元,配置为基于所述问答序列构建问答序列向量;LSTM模型训练单元,配置为调参并训练LSTM类别概率器得到所述LSTM模型。进一步的,所述问句信息获取模块具体配置为:将用户输入的问句进行分词、去除停用词和无效字符以及同一字体处理,得到文本序列。进一步的,所述意图实体确定模块包括:意图判断单元,配置为将所述文本序列转换为轮文本向量后输入至预先训练好的意图分类模型中,得到对应的意图;实体提取单元,配置为将所述文本序列输入预先训练好的实体提取模型中,得到对应的实体。进一步的,所述系统还包括第二模型建立模块,配置为获取所述意图分类模型和实体提取模型,所述第二模型建立模块包括:训练集文本采集单元,配置为采集符合应用场景的问答数据作为训练集文本;训练集文本预处理单元,配置为将所述训练集文本进行分词、去停用词和无效字符、统一字体处理;特征向量处理单元,配置为构建空间向量模型,再进行特征选择,特征加权,特征降维处理;意图分类模型训练单元,配置为调参并训练分类器得到所述意图分类模型;CRF训练数据获取单元,配置为将所述训练集文本进行数据清洗后进行序列标注,得到CRF的训练数据;CRF的训练数据处理单元,配置为设置特征模板和CRF的训练数据标签;实体提取模型训练单元,配置为调参并训练CRF实体提取器得到所述实体提取模型。进一步的,所述系统还包括意图实体校验模块,配置为根据应用场景设定对应的意图校验规则和实体校验规则,根据所述意图校验规则和实体校验规则检测并校正所述获取的意图和实体。实体提取模型,所述第二模型建立模块包括根据本专利技术第三实施例,提供了一种控制器,其包括存储器与处理器,所述存储器存储有计算机程序,所述程序在被所述处理器执行时能够实现所述方法的步骤。根据本专利技术第四实施例,提供了一种计算机可读存储介质,用于存储计算机程序,所述程序在由一计算机或处理器执行时实现所述方法的步骤。本专利技术与现有技术相比具有明显的优点和有益效果。借由上述技术方案,本专利技术提供的一种多轮智能问答方法、系统以及控制器和介质可达到相当的技术进步性及实用性,并具有产业上的广泛利用价值,其至少具有下列优点:本专利技术基于当前问答之前的问答序列及当前的问答意图和实体预测当前回答最优模板,提高了多轮问答的准确率。本专利技术可通过增加相关训练数据来改善相应的模型来进一步提高多轮对话的准确率,不需要通过改动原有代码做多轮判断,降低了系统维护成本,提高了快速响应机制。此外,本专利技术通过对意图和实体的检验和校正进一步提高了多伦对话的准确率,提高了本文档来自技高网...

【技术保护点】
1.一种多轮智能问答方法,其特征在于,包括:/n获取当前轮和先前轮的问句信息;/n基于所述当前轮和先前轮的问句信息获取当前轮的意图和实体,以及先前轮的意图、实体和回答模板类型;/n基于所获取的当前轮的意图和实体,以及先前轮的意图、实体和回答模板类型选择最优回答。/n

【技术特征摘要】
1.一种多轮智能问答方法,其特征在于,包括:
获取当前轮和先前轮的问句信息;
基于所述当前轮和先前轮的问句信息获取当前轮的意图和实体,以及先前轮的意图、实体和回答模板类型;
基于所获取的当前轮的意图和实体,以及先前轮的意图、实体和回答模板类型选择最优回答。


2.根据权利要求1所述的多轮智能问答方法,其特征在于,
所述基于所获取的当前轮的意图和实体,以及先前轮的意图、实体和回答模板类型选择最优回答,包括:
基于所述当前轮的意图和实体,以及先前轮的意图、实体和回答模板类型生成当前轮问答序列,基于所述当前轮问答序列选择最优回答。


3.根据权利要求2所述的多轮智能问答方法,其特征在于,
所述基于所述当前轮问答序列选择最优回答,包括:
将所述当前轮问答序列输入预先训练好的LSTM模型,输出当前回答模板类型,根据所述当前回答模板类型输出回答,即为所述最优回答。


4.根据权利要求3所述的多轮智能问答方法,其特征在于,还包括:获取所述LSTM模型,具体包括:
采集问答序列做训练数据,每一个所述问答序列至少包括一组问句类别、问句实体、回答模板类型这三个信息;
基于所述问答序列构建问答序列向量;
调参并训练LSTM类别概率器得到所述LSTM模型。


5.根据权利要求1所述的多轮智能问答方法,其特征在于,
获取问句信息,包括:
将用户输入的问句进行分词、去除停用词和无效字符以及同一字体处理,得到文本序列。


6.根据权利要求5所述的多轮智能问答方法,其特征在于,
所述基于所述问句信息确定意图和实体,包括:
将所述文本序列转换为文本向量后输入至预先训练好的意图分类模型中,得到对应的意图;
将所述文本序列输入预先训练好的实体提取模型中,得到对应的实体。


7.根据权利要求6所述的多轮智能问答方法,其特征在于,
所述方法还包括获取所述意图分类模型和实体提取模型,具体包括:
采集符合应用场景的问答数据作为训练集文本;
将所述训练集文本进行分词、去停用词和无效字符、统一字体处理;
构建空间向量模型,再进行特征选择,特征加权,特征降维处理;
调参并训练分类器得到所述意图分类模型;
将所述训练集文本进行数据清洗后进行序列标注,得到CRF的训练数据;
设置特征模板和CRF的训练数据标签;
调参并训练CRF实体提取器得到所述实体提取模型。


8.根据权利要求1所述的多轮智能问答方法,其特征在于,所述方法还包括:
根据应用场景设定对应的意图校验规则和实体校验规则,根据所述意图校验规则和实体校验规则检测并校正所获取的意图和实体。


9.一种多轮智能问答系统,其特征在于,包括:
问句信息获取模块,配置为获取当前轮和先前轮的问句信息;
意图实体确定模块,配置为基于所述当前轮和先前轮的问句信息获取当前轮的意图和实体,以及先前轮的意图、实体和回答模板类型;
最优回答选择模块,配置为基于所获取的当前轮的意图和实体,以及先前轮的意图、实体和回答模板类型选择最优回答。


10.根据权利要求9所述的多轮智能问答系统,其特征...

【专利技术属性】
技术研发人员:黎桂林陈光伟
申请(专利权)人:易小博武汉科技有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1