一种多轮任务式对话状态追踪方法技术

技术编号：25223982 阅读：20 留言：0更新日期：2020-08-11 23:13

本发明专利技术公开了一种多轮任务式对话状态追踪方法，其特点是采用对历史对话记录进行编码，利用注意力机制为各个槽分别抽取关键信息，并根据槽之间的相似度和关联性，对关键信息进行共享与重组，生成更为精确的对话状态。本发明专利技术与现有技术相比具有多轮式对话状态追踪便于实现，成本低廉并且能够在不同的数据领域之间进行很好的迁移，能够有效从多轮长对话历史中为各个槽提取出最有价值的信息，并缓解数据不足对追踪效果的影响，有效提高对话追踪模块在订餐、旅游安排等多个任务上的追踪效果，从而有效提高智能对话系统的最终性能，具有广泛的实用意义。

全部详细技术资料下载

【技术实现步骤摘要】
一种多轮任务式对话状态追踪方法
本专利技术涉及任务式对话系统
，具体的说是一种基于槽注意力机制和信息共享技术的来优化多轮对话中用户状态的追踪方法。
技术介绍
目前，人工智能技术迅猛发展，出现了很多图像和文本的实际应用。作为自然语言领域的一大重要分支，任务式对话系统正日益获得学术界和产业界的重视。任务式对话系统是指通过与用户多个回合的自然语言交互，来帮助用户完成某项任务的系统。这些任务可以是餐馆预定、旅游安排、天气预报或者是多个子任务组合而成的复合任务。基于这些新技术，各大科技公司均推出了自己的智能对话助手，比如苹果公司的Siri、亚马逊公司的Alexa。这些智能助手大大提高了人们工作和日常生活的效率。此外，任务式对话系统也被广泛应用于智能客服领域，它不仅节省了企业在客服方面投入的人力成本，还能有效改善企业整体营运的规范性与效率。一个典型的对话系统一般都由自然语言理解(NLU)模块、对话状态追踪(DST)模块、行为策略管理(APM)模块和对话生成(NLG)模块组成。作为其中的一个核心模块，对话状态追踪模块负责在多轮对话中获取和更新用户的对话状态，它的效果影响着整个系统的最终结果。在DST任务中，对话状态指的是槽值对的组合。而槽值对可以理解为用户对需求的限制。例如，“restaurant-food:Chinese”中，“restaurant-food”就是一个槽，“Chinese”就是这个槽的值。而多个槽值对，如“restaurant-food:Chinese”,“restaurant-pricerange...

【技术保护点】
1.一种多轮任务式对话状态追踪方法，其特征用在于采用槽注意力机制提取对话中的关键信息，并基于槽之间的关联性来对这些关键特征进行信息重组，利用关联的并且训练数据充足的槽的特征来改善模型在数据不足的槽上的追踪效果，使得后续模块能生成更加准确的对话状态，其具体优化包括如下步骤：/n步骤一：多轮对话历史记录的编码/n对多轮任务式对话中的所有信息使用GRU进行数字化编码，将历史记录X

【技术特征摘要】
1.一种多轮任务式对话状态追踪方法，其特征用在于采用槽注意力机制提取对话中的关键信息，并基于槽之间的关联性来对这些关键特征进行信息重组，利用关联的并且训练数据充足的槽的特征来改善模型在数据不足的槽上的追踪效果，使得后续模块能生成更加准确的对话状态，其具体优化包括如下步骤：
步骤一：多轮对话历史记录的编码
对多轮任务式对话中的所有信息使用GRU进行数字化编码，将历史记录Xt＝[ut-l+1，rt-l+1，...，ut，rt]中的每一个词映射到一个低纬度的稠密空间中，生成隐含层表示
步骤二：从历史信息中抽取关键信息
对于一个特定的槽sj，将其槽名编码成利用注意力机制计算上下文向量cj，并通过权重赋予的方式对神经网络输出的隐含表示由下述a～c式为各个槽sj提取与其最相关的历史信息，过滤掉不相关信息：

式中：j为第j个槽；i表示该槽槽名的第i个单词；aj表示槽sj和对话历史记录之间的相关性；则是用softmax函数归一化后的aj；cj为上下文向量，代表从整个对话历史中抓取的该槽的关键信息；
步骤三：关键信息的重组与共享
根据mask矩阵对各个槽的关键信息进行重组，并将相互间有关联的槽的信息进行共享，其具体实现步骤如下：
1)关键信息的重组：分别使用基于超参数融合和基于K-means算法聚类的方法建立mask矩阵，并根据mask矩阵，对获得的各个槽的关键信息进行重组；
2)关键信息的共享：根据mask矩阵由下述h式将槽之间的信息进行选择性的共享：

式中：intj为信息重组后的槽sj的上下文向量；
步骤四：对话状态的生成
将步骤三中重组后的关键信息输入解码器，使其生成更为精确的对话状态，其具体按下述二步生成：
第一步生成：使用三类分类器将隐含层向量表示Ht映射成“ptr”、“none”和“dontcare”的概率分布，以判断原对话历史记录中用户对相关槽的需求有所限制，还是对相关槽抱有无所谓的态度，或是没有明确表明自已态度的三种对话状态，如果用户是...

【专利技术属性】
技术研发人员：胡佳颖，杨燕，贺樑，
申请(专利权)人：华东师范大学，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人