经由使用组合神经网络的场景建模进行自适应对话的系统和方法技术方案

技术编号：32963960 阅读：14 留言：0更新日期：2022-04-09 11:02

本教导涉及用于自适应对话的方法、系统、介质和实施方式。接收对话场景的一个或多个图像，这些图像捕获基于对话策略进行的用户与机器之间的对话的周围情况。基于第一人工神经网络从图像中检测场景中存在的一个或多个物体。基于第二人工神经网络从图像中检测该一个或多个物体之间的空间关系。然后基于该一个或多个物体和该空间关系生成场景的场景建模信息，并将其用于自适应对话。并将其用于自适应对话。并将其用于自适应对话。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】经由使用组合神经网络的场景建模进行自适应对话的系统和方法
[0001]相关申请的交叉引用
[0002]本申请要求于2019年8月12日提交的美国临时专利申请62/885,526的优先权，其内容通过引用整体并入本文。

[0003]本教导一般而言涉及计算机。更具体而言，本教导涉及计算机化的智能代理(intelligent agent)。

技术介绍

[0004]随着人工智能技术的进步以及由于互联网连接性无处不在而导致的基于互联网的通信的爆炸式增长，计算机辅助对话系统变得越来越流行。例如，越来越多的呼叫中心部署自动对话机器人来处理客户呼叫。宾馆安装了可以回答游客或客人的问题的各种信息亭。在线预订(无论是旅游住宿还是剧院门票等)也更频繁地由聊天机器人完成。近年来，其它领域的自动化人机通信也越来越流行。
[0005]此类传统计算机辅助对话系统通常基于特定相关领域中众所周知的交谈模式(conversation pattern)而预先编程有某些问题和答案。遗憾的是，人类交谈者可能无法预测，并且有时不遵循预先计划的对话模式。此外，在某些情况下，人类交谈者可能会在该过程期间跑题，而继续固定的交谈模式可能会引起刺激或失去兴趣。当这种情况发生时，此类传统机器对话系统常常将无法继续吸引人类交谈者，因此，要么必须中止人类机器对话以将任务交给人类操作者，要么人类交谈者干脆离开对话，这是不期望的。
[0006]此外，传统的基于机器的对话系统常常不被设计为解决人类的情感因素，更不用说在与人类交谈时考虑如何解决交谈的情感...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种在至少一个机器上实现的方法，所述至少一个机器包括至少一个处理器、存储器和能够连接到网络以进行自适应对话的通信平台，所述方法包括：接收一个或多个图像，所述一个或多个图像捕获对话场景的周围情况，用户和机器在所述对话场景中参与基于对话策略进行的对话；经由第一类型的人工神经网络，从所述一个或多个图像中检测所述对话场景中存在的一个或多个物体；经由第二类型的人工神经网络，基于所述一个或多个图像检测所述一个或多个物体之间的空间关系；以及基于所述一个或多个物体和所述空间关系，生成表征所述对话场景的场景建模信息，其中所述场景建模信息被用于自适应对话。2.如权利要求1所述的方法，其中，所述第一类型的人工神经网络是卷积神经网络CNN，所述卷积神经网络是基于基于CNN的物体/特征检测模型而配置的，所述基于CNN的物体/特征检测模型是基于从训练图像检测到的标记的物体经由有监督的学习而训练的。3.如权利要求1所述的方法，其中，所述第二类型的人工神经网络是图神经网络GNN，所述图神经网络是基于基于GNN的空间关系检测模型而配置的，所述基于GNN的空间关系检测模型是基于从训练图像检测到的物体之间的标记的空间关系经由有监督的学习而训练的。4.如权利要求1所述的方法，还包括通过评估以下各项中的至少一项来确定何时调整所述对话：所述对话是否需要被调整；以及所述对话场景是否要被增强以允许在增强的对话场景中调整所述对话。5.如权利要求4所述的方法，还包括：当要增强所述对话场景时，选择要在所述对话场景中渲染的一个或多个虚拟物体；基于所述场景建模信息，确定用于渲染所述一个或多个虚拟物体的参数；以及根据所述参数，在所述对话场景中投影所述一个或多个虚拟物体，以创建所述增强的对话场景。6.如权利要求4所述的方法，还包括：根据与所述增强的对话场景一致的增强的对话策略，在所述增强的对话场景中调整所述对话。7.如权利要求6所述的方法，其中，在所述增强的对话场景中调整所述对话的步骤包括：基于所述增强的对话场景和所述对话策略，生成所述增强的对话策略；以及基于所述增强的对话策略，在所述增强的对话场景中进行所述对话。8.一种机器可读和非暂态介质，其上记录有用于自适应对话的信息，其中，所述信息在被机器读取时使所述机器执行以下步骤：接收一个或多个图像，所述一个或多个图像捕获对话场景的周围情况，用户和机器在所述对话场景中参与基于对话策略进行的对话；经由第一类型的人工神经网络，从所述一个或多个图像中检测所述对话场景中存在的一个或多个物体；经由第二类型的人工神经网络，基于所述一个或多个图像检测所述一个或多个物体之间的空间关系；以及
基于所述一个或多个物体和所述空间关系，生成表征所述对话场景的场景建模信息，其中所述场景建模信息被用于自适应对话。9.如权利要求8所述的介质，其中，所述第一类型的人工神经网络是卷积神经网络CNN，所述卷积神经网络是基于基于CNN的物体/特征检测模型而配置的，所述基于CNN的物体/特征检测模型是基于从训练图像检测到的标记的物体经由有监督的学习而训练的。10.如权利要求8所述的介质，其中，所述第二类型的人工神经网络是图神经网络GNN，所述图神经网络是基于基于GNN的空间关系检测模型而配置的，所述基于GNN的空间关系检测模型是基于从训练图像检测到的物体之间的标记的空间关系经由有监督的学习而训练的。11.如权利要求8所述的介质，其中...

【专利技术属性】
技术研发人员：S，
申请(专利权)人：得麦股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人