当前位置: 首页 > 专利查询>上海大学专利>正文

基于深度神经网络的场景自动切换的人机多轮对话方法技术

技术编号:18621277 阅读:30 留言:0更新日期:2018-08-08 00:24
本发明专利技术提出一种基于深度神经网络的场景自动切换的人机多轮对话方法,本方法的操作步骤是:(1)建立多轮对话问答上下文表示;(2)建立问答上下文场景聚类与场景上下文表示;(3)问题场景自动识别及应答自动生成;(4)场景与场景上下文自动更新。本发明专利技术将问答的文字表示向量化,有效且方便地保存问答的上下文信息;在对话过程中有效地抓住场景信息以及场景下的问答上下文内容;结合所匹配场景下的问答上下文信息,自动地生成合理的答复,此方法充分利用了上下文内容,且相对于传统的直接从问答库中匹配答案更为灵活有效。

Man machine multi wheel dialogue method based on deep neural network for automatic scene switching

This invention proposes a human-computer multi wheel dialogue method based on the automatic switching of scene based on deep neural network. The operation steps of this method are: (1) establishing multi wheel dialogue question and answer context representation; (2) setting up context scene clustering and scene context representation for question and answer context; (3) automatic recognition of the problem scene and automatic response generation; (4) automatic updating of scene and scene context. This invention vectorization of questions and answers, effectively and conveniently preserving the context information of questions and answers; effectively grasping the scene information and the context content of the question and answer in the process of dialogue; combining the quiz context information under the matched scene, automatically generates a reasonable reply. This method makes full use of the up and down. It is more flexible and effective than matching the answers directly from the traditional Q & a library.

【技术实现步骤摘要】
基于深度神经网络的场景自动切换的人机多轮对话方法
本专利技术涉及计算机人工智能领域,尤其涉及一种基于深度神经网络的场景自动切换的人机多轮对话方法。
技术介绍
人机对话系统作为一个非常热门且具有极大前景的应用,正逐渐被运用到许多领域。人机对话系统依托语音识别以及自然语言理解等相关技术,旨在以语音交互的形式为用户提供各类服务,如咨询、导引、日常聊天等,在未来将直接改变现有的服务提供方式。人机对话系统能否充分理解用户的语言,需要有强大的上下文感知能力。上下文感知技术,不仅需要能够抓住当前对话的重要信息,还需要对之前的对话做一定的记忆。近年来,依托深度神经网络,上下文感知技术取得了一定的进展。机器人与人的对话是一个时序过程,人机对话系统除了要理解当前正在进行的对话,还需要对之前的聊天记录有一定的理解能力。即,机器人在与人的对话过程中,需要以之前的聊天内容作为上下文依据,然后再结合当前的聊天内容的上下文,做出合理相应。然而,目前市面上的对话系统,使用简单的问答库匹配机制,大多数只能提供简单的对话以及服务,对于长时间对话却无能为力。人类在长时间的相互交流过程中,会一直记忆之前聊天涉及的内容,在多轮次的对话过程中,由于存在之前的聊天背景,因此能够保持相当高的连贯性。然而,人机对话系统由于没有良好的记录之前聊天信息的机制,在与人进行多轮交互过程中,往往会有转移话题场景、答非所问甚至无法应答等现象的发生。因此,多轮对话是当下亟待解决的重大问题。
技术实现思路
本专利技术的目的是针对现有人机对话系统的不足,提供一种基于深度神经网络的场景自动切换的人机多轮对话方法。本方法可以记录人机对话过程中的上下文信息,对于每一个问题,系统自动地识别每一轮对话的场景信息,并根据特定场景信息进行应答。充分利用深度循环神经网络的长短期记忆机制,以及场景识别的方法,以完成聊天机器人多轮对话以及场景自动切换的功能。为达到专利技术的目的,本专利技术的构思是:为了有效地记录上下文内容,提出一种问答上下文表示的训练方法,对于每一轮问答,训练其上下文表示,问答的上下文表示即一轮问答包含的重要信息。此外,多轮次的对话中会涉及多个不同的对话场景,对话过程是多个场景相互切换的过程,为了让系统能够准确地检测到场景的切换,提出对话自动场景识别的方法,可以在对话场景切换时,自动地从上下文中匹配合适的场景,根据场景中的内容进行应答。根据上述专利技术构思,本专利技术采用下述技术方案:一种基于深度神经网络的场景自动切换的人机多轮对话方法,操作步骤如下:a)构建多轮对话问答上下文表示:使用向量进行问题上下文表示;b)构建问答上下文场景聚类与场景上下文表示:使用聚类的方法自动划分场景,并训练场景上下文向量;c)问题场景自动识别及应答自动生成:自动的识别问题的所属场景,使用语言模型自动生成应答;d)场景与场景上下文自动更新:将新生成的问题添加匹配到的场景中,若未匹配到则生成新的场景。所述步骤a)构建多轮对话问答上下文表示具体为:问答上下文表示依托问答知识库为基础支持,问答知识库即多个一问一答存储的数据库;问答上下文表示使用深度循环神经网络将一问一答的文本转换为问答的上下文向量表示。所述步骤b)构建问答上下文场景聚类与场景上下文表示具体为:每一个问答上下文的向量表示在向量空间中作为一个孤立点,为了将所有的问答上下文按场景进行分类,采用聚类方法将问答知识库的所有问答上下文进行聚类,对于每一个场景类别,使用深度循环神经网络提取其场景上下文的向量表示。所述步骤c)问题场景自动识别及应答自动生成具体为:对于每一个问题,提取其问题与场景上下文表示,与当前对话前的对话内容进行场景相似度匹配,若相似度最高的场景高于阈值,则从最相似的场景中抽取上下文内容,若低于阈值则从问答知识库中匹配最相似场景,从中提取上下文内容;结合从场景中提取的上下文与当前问题,使用深度神经网络语言模型自动生成应答。所述步骤d)场景与场景上下文自动更新具体为:若新生成的问答与之前的对话内容中的某个场景相匹配,则将该问答上下文存入该场景中,使用深度循环神经网络更新该场景的上下文表示;若无法从正在进行的对话内容中准确匹配,则构建一个新的场景,训练该轮问答的场景上下文,并将该轮问答存入该场景中。本专利技术与已有技术相比较,具有如下显而易见的突出实质性特点和显著的技术进步:本专利技术将问答的文字表示向量化,有效且方便地保存问答的上下文信息;在对话过程中有效地抓住场景信息以及场景下的问答上下文内容;并结合所匹配场景下的问答上下文信息,自动地生成合理的答复,此方法充分利用了上下文内容,且相对于传统的直接从问答库中匹配答案更为灵活有效。附图说明图1是本专利技术的基于深度神经网络的问答上下文表示方法示意图。图2是本专利技术的问答场景划分示意图。图3是本专利技术的场景上下文训练方法示意图。图4是本专利技术的问题场景识别及应答自动生成方法示意图。具体实施方式下面结合附图,对本专利技术的具体实施例做进一步的说明。一种基于深度神经网络的场景自动切换的人机多轮对话方法,操作步骤如下:a)构建多轮对话问答上下文表示:使用向量进行问题上下文表示;b)构建问答上下文场景聚类与场景上下文表示:使用聚类的方法自动划分场景,并训练场景上下文向量;c)问题场景自动识别及应答自动生成:自动的识别问题的所属场景,使用语言模型自动生成应答;d)场景与场景上下文自动更新:将新生成的问题添加匹配到的场景中,若未匹配到则生成新的场景。所述步骤a)构建多轮对话问答上下文表示具体为:问答上下文提取依托问答知识库为数据,采用循环神经网络的方法将一问一答的文本转换为问答上下文的向量表示。在问答知识库中,假设每一个问答对表示一个独立的场景。基于这一独立的场景假设,使用循环神经网络技术,将问答提取为上下文向量表示。该网络结构参照图1,其相关流程如下:1)使用id表示问答字符串中的每一个字,将问答转换为id序列表示;2)采用循环神经网络算法将问答序列转换为问答上下文表示;每一个问答赋予一个场景编号;3)使用一个全连接层将问答上下文映射为总场景个数的长度;4)使用Softmax激活函数对问答上下文的全连接表示进行场景分类;5)保存问答上下文和循环神经网络参数。利用该网络对问答知识库进行训练,对所有的问答上下文的向量表示,以及循环神经网络的参数进行存储。所述步骤b)构建问答上下文场景聚类与场景上下文表示具体为:在获取了问答上下文的向量表示之后,我们把所有的问答对都映射为向量空间中的一个点。问答越相似,其上下文在空间中的表示就越接近,它们的场景也越相似。使用典型聚类方法对问答上下文进行场景聚类。距离近的问答聚类在一个场景中,这样可以将所有的问答划分为多个场景,参照图2,其中QAC表示问答上下文,SC表示场景上下文,数字表示问答和场景的id。对于每一个场景可以用向量来表示其场景上下文。典型的表示上下文的方法是使用各个聚类的中心。还可以使用循环圣经网络再训练的方法,重新训练场景上下文。使用训练的方法获取场景上下文参照图3,该网络相关流程如下:1)对于每一个类别的问答上下文序列,使用循环神经网络,提取它们的场景上下文表示;2)使用全连接的方法,将场景上下文映射为聚类个数的长度;3)使用Softmax激活函数对场景上下文进行场景分类;4)保本文档来自技高网...

【技术保护点】
1.一种基于深度神经网络的场景自动切换的人机多轮对话方法,其特征在于,操作步骤如下:a)构建多轮对话问答上下文表示:使用向量进行问题上下文表示;b)构建问答上下文场景聚类与场景上下文表示:使用聚类的方法自动划分场景,并训练场景上下文向量;c)问题场景自动识别及应答自动生成:自动的识别问题的所属场景,使用语言模型自动生成应答;d)场景与场景上下文自动更新:将新生成的问题添加匹配到的场景中,若未匹配到则生成新的场景。

【技术特征摘要】
1.一种基于深度神经网络的场景自动切换的人机多轮对话方法,其特征在于,操作步骤如下:a)构建多轮对话问答上下文表示:使用向量进行问题上下文表示;b)构建问答上下文场景聚类与场景上下文表示:使用聚类的方法自动划分场景,并训练场景上下文向量;c)问题场景自动识别及应答自动生成:自动的识别问题的所属场景,使用语言模型自动生成应答;d)场景与场景上下文自动更新:将新生成的问题添加匹配到的场景中,若未匹配到则生成新的场景。2.根据权利要求1所述的基于深度神经网络的场景自动切换的人机多轮对话方法,其特征在于,所述步骤a)构建多轮对话问答上下文表示具体为:问答上下文表示依托问答知识库为基础支持,问答知识库即多个一问一答存储的数据库;问答上下文表示使用深度循环神经网络将一问一答的文本转换为问答的上下文向量表示。3.根据权利要求1所述的基于深度神经网络的场景自动切换的人机多轮对话方法,其特征在于,所述步骤b)构建问答上下文场景聚类与场景上下文表示具体为:每一个问答上下文的向量表示在向量空间中作为一个孤立点,为了将所有的问答上...

【专利技术属性】
技术研发人员:武星杜智康
申请(专利权)人:上海大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1