一种对话中的槽提取方法、装置、电子设备及存储介质制造方法及图纸

技术编号:26971319 阅读:20 留言:0更新日期:2021-01-06 00:02
本申请提供了一种对话中的槽提取方法、装置、电子设备及存储介质,该方法包括:在确定接收到的目标语料对应的目标意图后,基于目标语料和目标意图对应的第一槽位,确定目标意图对应的待填充槽位;每一个第一槽位对应有至少一个第一槽值;基于目标意图对应的待填充槽向用户进行第一反问,在接收到用户针对该第一反问的第一回复语料后,计算第一回复语料分别与每一个第一槽值的目标相似度;根据第一回复语料分别与每一个第一槽值的目标相似度,从第一槽值中提取第一回复语料中匹配待填充槽位的第一目标槽值;这样,通过对话流程图来管理对话,提高了槽识别效率,通过相似度计算进行槽提取,动态拓展了NER模型的识别能力,提高了识别的准确度。

【技术实现步骤摘要】
一种对话中的槽提取方法、装置、电子设备及存储介质
本申请涉及游戏
,具体而言,涉及一种对话中的槽提取方法、装置、电子设备及存储介质。
技术介绍
面向任务的对话系统旨在帮助用户完成某些任务(例如查找产品,预订住宿和餐馆),一般来说往往是“多轮”的,对话系统通过与用户进行多轮基于自然语言的对话来逐步收集与目标相关的信息,辅助用户成功获得某种服务。在任务型对话系统中,现有的任务型多轮对话的平台配置方案,往往需要上传很多的标注数据来训练模型,而这在实际的工业界场景中往往很难做到,一是数据量往往很难满足需求,二是标注成本高昂,并且,当需求及数据频繁变化时,需要根据新的需求利用新的数据,重新训练模型,费时费力,识别效率低。
技术实现思路
有鉴于此,本申请的目的在于提供一种对话中的槽提取方法、装置、电子设备及存储介质,通过对话流程图来管理对话,提高了识别效率,通过相似度计算进行槽提取,动态拓展了NER模型的识别能力,提高了识别的准确度。第一方面,本申请实施例提供了一种对话中的槽提取方法,所述槽提取方法包括:在确定接收到的目标语料对应的目标意图后,基于所述目标语料以及所述目标意图对应的第一槽位,确定所述目标意图对应的待填充槽位;其中,所述目标意图对应一对话流程图,该对话流程图中包括所述目标意图对应的第一槽位,且每一个所述第一槽位对应有至少一个第一槽值;基于所述目标意图对应的待填充槽向用户进行第一反问,在接收到用户针对该第一反问的第一回复语料后,计算所述第一回复语料分别与每一个第一槽值的目标相似度;根据所述第一回复语料分别与每一个第一槽值的目标相似度,从所述第一槽值中提取所述第一回复语料中匹配所述待填充槽位的第一目标槽值。在一种可能的实施方式中,所述基于所述目标语料以及所述目标意图对应的第一槽位,确定所述目标意图对应的待填充槽位,包括:对所述目标语料进行命名实体识别处理,提取所述目标语料中的第二槽值,并确定所述第二槽值所属的第二槽位;根据所述目标意图对应的第一槽位以及所述第二槽值所属的第二槽位,确定所述目标意图对应的待填充槽位。在一种可能的实施方式中,所述计算所述第一回复语料分别与每一个第一槽值的目标相似度,包括:提取所述第一回复语料对应的第一特征向量以及每一个第一槽值对应的第二特征向量;根据所述第一回复语料对应的第一特征向量以及每一个第一槽值对应的第二特征向量,计算所述第一回复语料分别与每一个第一槽值的目标相似度。在一种可能的实施方式中,所述提取所述第一回复语料对应的第一特征向量以及每一个第一槽值对应的第二特征向量,包括:若所述第一回复语料中不包括特定类型的字符,则基于第一来自变换器的双向编码器表征量BERT模型提取所述第一回复语料中各个字符对应的第三特征向量,并基于所述第三特征向量计算所述第一回复语料对应的第一特征向量;以及,基于第二BERT模型提取每一个第一槽值中各个字符对应的第四特征向量,并基于所述第四特征向量计算每一个第一槽值对应的第二特征向量;若所述第一回复语料中包括特定类型的字符,则基于第一BERT模型提取所述第一回复语料中各个字符对应的第三特征向量,基于所述第三特征向量,计算所述第一BERT模型下所述第一回复语料对应的第一特征向量;并基于第一通用语义表示模型ELMO模型提取所述第一回复语料中各个字符对应的第五特征向量,基于所述第五特征向量,计算所述第一ELMO模型下所述第一回复语料对应的第一特征向量;以及,基于第二BERT模型提取每一个第一槽值中各个字符对应的第四特征向量,基于所述第四特征向量,计算所述第一BERT模型下每一个第一槽值对应的第二特征向量;并基于第二ELMO模型提取每一个第一槽值中各个字符对应的第六特征向量,并基于所述第六特征向量,计算所述第二ELMO模型下每一个第一槽值对应的第二特征向量。在一种可能的实施方式中,所述根据所述第一回复语料对应的第一特征向量以及每一个第一槽值对应的第二特征向量,计算所述第一回复语料分别与每一个第一槽值的目标相似度,包括:若所述第一回复语料中不包括特定类型的字符,则计算第一BERT模型下所述第一回复语料对应的第一特征向量分别与所述第二BERT模型下每一个第一槽值对应的第二特征向量的相似度,得到所述第一回复语料分别与每一个第一槽值的目标相似度。在一种可能的实施方式中,所述根据所述第一回复语料对应的第一特征向量以及每一个第一槽值对应的第二特征向量,计算所述第一回复语料分别与每一个第一槽值的目标相似度,包括:若所述第一回复语料中包括特定类型的字符,则计算所述第一BERT模型下所述第一回复语料对应的第一特征向量分别与所述第二BERT模型下每一个第一槽值对应的第二特征向量的相似度,得到所述第一回复语料分别与每一个第一槽值的第一相似度;以及,计算所述第一ELMO模型下所述第一回复语料对应的第一特征向量分别与所述第二ELMO模型下每一个第一槽值对应的第二特征向量的相似度,得到所述第一回复语料分别与每一个第一槽值的第二相似度;基于BERT模型下的第一相似度和ELMO模型下的第二相似度,确定所述第一回复语料分别与每一个第一槽值的目标相似度。在一种可能的实施方式中,计算所述第一回复语料对应的第一特征向量分别与每一个第一槽值对应的第二特征向量的相似度,包括:针对每一个第一槽值,计算所述第一回复语料对应的第一特征向量与该槽值对应的第二特征向量之间的编辑距离、所述第一特征向量的分词与所述第二特征向量的分词之间的第三相似度、所述第一特征向量的字符与所述第二特征向量的字符之间的第四相似度;对所述编辑距离、所述第三相似度以及所述第四相似度进行加权求和处理,得到所述第一回复语料与该第一槽值的相似度。在一种可能的实施方式中,所述根据所述第一回复语料分别与每一个第一槽值的目标相似度,从所述第一槽值中提取所述第一回复语料中匹配所述待填充槽位的第一目标槽值,包括:根据所述第一回复语料分别与每一个第一槽值的相似度,从所述第一槽值中选取与所述第一回复语料之间的相似度最大的候选槽值;基于所述第一回复语料的长度,确定目标阈值;若所述候选槽值大于所述目标阈值,则提取所述候选槽值为第一目标槽值。在一种可能的实施方式中,所述基于所述第一回复语料的长度,确定目标阈值,包括:在所述第一回复语料的长度小于第一长度阈值时,确定预设的第一阈值为所述目标阈值;在所述第一回复语料的长度大于第二长度阈值时,确定预设的第二阈值为所述目标阈值;其中,所述第二长度阈值大于等于所述第一长度阈值;所述第一阈值大于第二阈值。在一种可能的实施方式中,通过如下方法确定预设的第二阈值:获取所述第一回复语料中匹配任一第一槽值的第一分词的第三阈值,以及所述第一回复语料中除所述第一分词之外的第二分词与该任一第一槽值之间的第四阈值;根据所述第三阈值和所述第四阈值,计算预设的第二阈值。在一种可能的实施方式中,所述第一槽值包括规范本文档来自技高网...

【技术保护点】
1.一种对话中的槽提取方法,其特征在于,所述槽提取方法包括:/n在确定接收到的目标语料对应的目标意图后,基于所述目标语料以及所述目标意图对应的第一槽位,确定所述目标意图对应的待填充槽位;其中,所述目标意图对应一对话流程图,该对话流程图中包括所述目标意图对应的第一槽位,且每一个所述第一槽位对应有至少一个第一槽值;/n基于所述目标意图对应的待填充槽向用户进行第一反问,在接收到用户针对该第一反问的第一回复语料后,计算所述第一回复语料分别与每一个第一槽值的目标相似度;/n根据所述第一回复语料分别与每一个第一槽值的目标相似度,从所述第一槽值中提取所述第一回复语料中匹配所述待填充槽位的第一目标槽值。/n

【技术特征摘要】
1.一种对话中的槽提取方法,其特征在于,所述槽提取方法包括:
在确定接收到的目标语料对应的目标意图后,基于所述目标语料以及所述目标意图对应的第一槽位,确定所述目标意图对应的待填充槽位;其中,所述目标意图对应一对话流程图,该对话流程图中包括所述目标意图对应的第一槽位,且每一个所述第一槽位对应有至少一个第一槽值;
基于所述目标意图对应的待填充槽向用户进行第一反问,在接收到用户针对该第一反问的第一回复语料后,计算所述第一回复语料分别与每一个第一槽值的目标相似度;
根据所述第一回复语料分别与每一个第一槽值的目标相似度,从所述第一槽值中提取所述第一回复语料中匹配所述待填充槽位的第一目标槽值。


2.根据权利要求1所述的对话中的槽提取方法,其特征在于,所述基于所述目标语料以及所述目标意图对应的第一槽位,确定所述目标意图对应的待填充槽位,包括:
对所述目标语料进行命名实体识别处理,提取所述目标语料中的第二槽值,并确定所述第二槽值所属的第二槽位;
根据所述目标意图对应的第一槽位以及所述第二槽值所属的第二槽位,确定所述目标意图对应的待填充槽位。


3.根据权利要求1所述的对话中的槽提取方法,其特征在于,所述计算所述第一回复语料分别与每一个第一槽值的目标相似度,包括:
提取所述第一回复语料对应的第一特征向量以及每一个第一槽值对应的第二特征向量;
根据所述第一回复语料对应的第一特征向量以及每一个第一槽值对应的第二特征向量,计算所述第一回复语料分别与每一个第一槽值的目标相似度。


4.根据权利要求3所述的对话中的槽提取方法,其特征在于,所述提取所述第一回复语料对应的第一特征向量以及每一个第一槽值对应的第二特征向量,包括:
若所述第一回复语料中不包括特定类型的字符,则基于第一来自变换器的双向编码器表征量BERT模型提取所述第一回复语料中各个字符对应的第三特征向量,并基于所述第三特征向量计算所述第一回复语料对应的第一特征向量;以及,基于第二BERT模型提取每一个第一槽值中各个字符对应的第四特征向量,并基于所述第四特征向量计算每一个第一槽值对应的第二特征向量;
若所述第一回复语料中包括特定类型的字符,则基于第一BERT模型提取所述第一回复语料中各个字符对应的第三特征向量,基于所述第三特征向量,计算所述第一BERT模型下所述第一回复语料对应的第一特征向量;并基于第一通用语义表示模型ELMO模型提取所述第一回复语料中各个字符对应的第五特征向量,基于所述第五特征向量,计算第一ELMO模型下所述第一回复语料对应的第一特征向量;以及,基于第二BERT模型提取每一个第一槽值中各个字符对应的第四特征向量,基于所述第四特征向量,计算所述第一BERT模型下每一个第一槽值对应的第二特征向量;并基于第二ELMO模型提取每一个第一槽值中各个字符对应的第六特征向量,并基于所述第六特征向量,计算所述第二ELMO模型下每一个第一槽值对应的第二特征向量。


5.根据权利要求4所述的对话中的槽提取方法,其特征在于,所述根据所述第一回复语料对应的第一特征向量以及每一个第一槽值对应的第二特征向量,计算所述第一回复语料分别与每一个第一槽值的目标相似度,包括:
若所述第一回复语料中不包括特定类型的字符,则计算第一BERT模型下所述第一回复语料对应的第一特征向量分别与所述第二BERT模型下每一个第一槽值对应的第二特征向量的相似度,得到所述第一回复语料分别与每一个第一槽值的目标相似度。


6.根据权利要求4所述的对话中的槽提取方法,其特征在于,所述根据所述第一回复语料对应的第一特征向量以及每一个第一槽值对应的第二特征向量,计算所述第一回复语料分别与每一个第一槽值的目标相似度,包括:
若所述第一回复语料中包括特定类型的字符,则计算所述第一BERT模型下所述第一回复语料对应的第一特征向量分别与所述第二BERT模型下每一个第一槽值对应的第二特征向量的相似度,得到所述第一回复语料分别与每一个第一槽值的第一相似度;以及,计算所述第一ELMO模型下所述第一回复语料对应的第一特征向量分别与所述第二ELMO模型下每一个第一槽值对应的第二特征向量的相似度,得到所述第一回复语料分别与每一个第一槽值的第二相似度;
基于BERT模型下的第一相似度和ELMO模型下的第二相似度,确定所述第一回复语料分别与每一个第一槽值的目标相似度。


7.根据权利要求5或6所述的对话中的槽提取方法,其特征在于,计算所述第一回复语料对应的第一特征向量分别与每一个第一槽值对应的第二特征向量的相似度,包括:
针对每一个第一槽值,计算所述第一回复语料对应的第一特征向量与该槽值对应的第二特征向量之间的编辑距离、所述第一特征向量的分词与所述第二特征向量的分词之间的第三相似度、所述第一特征向量的字符与所述第二特征向量的字符之间的第四相似度;
对所述编辑距离、所述第三相似度以及所述第四相似度进行加权求和处理,得到所述第一回复语料与该第一槽值的相似度。


8.根据权利要求1所述的对话中的槽提取方法,其特征在于,所述根据所述第一回复语料分别与每一个第一槽值的目标相似度,从所述第一槽值中提取所述第一回复语料中匹配所述待填充槽位的第一目标槽值,包括:
根据所述第一回复语料分别与每一个第一槽值的相似度,从所述第一槽值中选取与所述第一回复语料之间的相似度最大的候选槽值;
基于所述第一回复语料的长度,确定目标阈值;
若所述候选槽值大于所述目标阈值,则提取所述候选槽值为第一目标槽值。


9.根据权利要求8所述的对话中的槽提取方法,其特征在于,所述基于所述第一回复语料的长度,确定目标阈值,包括:
在所述第一回复语料的长度小于第一长度阈值时,确定预设的第一阈值为所述目标阈值;
在所述第一回复语料的长度大于第二长度阈值时,确定预设的第二阈值为所述目标阈值;其中,所述第二长...

【专利技术属性】
技术研发人员:张林箭张聪衣景龙范长杰胡志鹏
申请(专利权)人:网易杭州网络有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1