一种用于智能机器人的人机交互方法及装置,其中,该方法包括:交互信息获取步骤,获取用户输入的多模态交互信息;情感信息生成步骤,对多模态交互信息进行解析,生成用户情感参量;数据输出步骤,根据用户情感参量生成与用户情感参量匹配的音乐,结合音乐生成多模态输出数据并输出。该方法能够在播放响应多模态输出数据的同时,输出与用户当前情绪相匹配的音乐,从而使得用户感知到智能机器人能够真正地理解用户当前的情境与情绪,并在理解用户当前情境与情绪的基础上有趣地给予反馈,进而极大地满足了用户对智能机器人的情感需求,这也使得智能机器人更加人性化。
【技术实现步骤摘要】
本专利技术涉及机器人
,具体地说,涉及一种用于智能机器人的人机交互方法及装置。
技术介绍
随着科学技术的不断发展,信息技术、计算机技术以及人工智能技术的引入,机器人的研究已经逐步走出工业领域,逐渐扩展到了医疗、保健、家庭、娱乐以及服务行业等领域。而人们对于机器人的要求也从简单重复的机械动作提升为具有拟人问答、自主性及与其他机器人进行交互的智能机器人,人机交互也就成为决定智能机器人发展的重要因素。在人机交互过程中,用户对智能机器人的交互需求日益增多,需要智能机器人不断提高自身的交互能力,实现与用户的多方面交互,满足用户的多种多样的用户需求。
技术实现思路
为解决上述问题,本专利技术提供了一种用于智能机器人的人机交互方法,其包括:交互信息获取步骤,获取用户输入的多模态交互信息;情感信息生成步骤,对所述多模态交互信息进行解析生成用户情感参量;数据输出步骤,根据所述用户情感参量生成与所述用户情感参量匹配的音乐,结合所述音乐生成多模态输出数据并输出。根据本专利技术的一个实施例,在所述数据输出步骤中,还生成对应于所述多模态交互信息的反馈信息,并将所述音乐作为所述反馈信息的背景音进行输出。根据本专利技术的一个实施例,在所述数据输出步骤中,根据所述用户情感参量生成与所述用户情感参量匹配的音乐,具体包括:根据所述用户情感参量确定当前情感场景;获取与所述当前情感场景相对应的音乐。根据本专利技术的一个实施例,在所述情感信息生成步骤中,利用预设情感引擎来根据所述多模态交互信息生成所述用户情感参量。根据本专利技术的一个实施例,所述多模态交互信息包括以下所列项中的任一项或几项:图像信息、语音信息和文本信息。本专利技术还提供了一种用于智能机器人的人机交互装置,其包括:交互信息获取模块,其用于获取用户输入的多模态交互信息;情感信息生成模块,其用于对所述多模态交互信息进行解析生成用户情感参量;数据输出模块,其用于根据所述用户情感参量生成与所述用户情感参量匹配的音乐,结合所述音乐生成多模态输出数据并输出。根据本专利技术的一个实施例,所述数据输出模块配置为还生成对应于所述多模态交互信息的反馈信息,并将所述音乐作为所述反馈信息的背景音进行输出。根据本专利技术的一个实施例,所述数据输出模块根据所述用户情感参量生成与所述用户情感参量匹配的音乐,具体包括:根据所述用户情感参量确定当前情感场景;获取与所述当前情感场景相对应的音乐。根据本专利技术的一个实施例,所述情感信息生成模块配置为利用预设情感引擎来根据所述多模态交互信息生成所述用户情感参量。根据本专利技术的一个实施例,所述多模态交互信息包括以下所列项中的任一项或几项:图像信息、语音信息和文本信息。本专利技术所提供的用于智能机器人的人机交互方法能够在播放响应多模态输出数据的同时,输出与用户当前情绪相匹配的音乐,从而使得用户感知到智能机器人能够真正地理解用户当前的情境与情绪,并在理解用户当前情境与情绪的基础上有趣地给予反馈,进而极大地满足了用户对智能机器人的情感需求,这也使得智能机器人更加人性化。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要的附图做简单的介绍:图1是根据本专利技术一个实施例的用于智能机器人的人机交互方法的实现流程图;图2是根据本专利技术另一个实施例的用于智能机器人的人机交互方法的实现流程图;图3是根据本专利技术一个实施例的用于智能机器人的人机交互装置的结构示意图。具体实施方式以下将结合附图及实施例来详细说明本专利技术的实施方式,借此对本专利技术如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明的是,只要不构成冲突,本专利技术中的各个实施例以及各实施例中的各个特征可以相互结合,所形成的技术方案均在本专利技术的保护范围之内。同时,在以下说明中,出于解释的目的而阐述了许多具体细节,以提供对本专利技术实施例的彻底理解。然而,对本领域的技术人员来说显而易见的是,本专利技术可以不用这里的具体细节或者所描述的特定方式来实施。另外,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。在机器人技术的发展过程中,人们对机器人的交互需求越来越高,这也就需要机器人能够更为生动、智能地与用户进行交互。然而,现有的用于智能机器人的人机交互方法通常只会与用户进行单一的语音交互或文本交互,这显然无法满足现有的交互需求。针对现有技术中所存在的问题,本专利技术提供了一种新的用于智能机器人的人交互方法,该方法使得智能机器人能够在输出相关数据的同时,还能够输出与当前情境氛围相适应的音乐。为了更加清楚地阐述本专利技术所提供的人机交互方法的实现原理、实现过程以及优点,以下分别结合不同的实施例来对该方法作进一步地说明。实施例一:图1示出了本实施例所提供的用于智能机器人的人机交互方法的实现路程图。如图1所示,本实施例所提供给的人机交互方法首先在步骤S101中获取用户输入的多模态交互信息。需要指出的是,上述多模态交互信息可以是诸如语音信息、文本信息、肢体信息、动作信息和视觉信息(即图像信息)等信息中的某一项或某几项,本专利技术不限于此。其中,该方法可以通过智能机器人所配置的音频传感器(例如麦克风)来获取用户输入的语音信息,可以通过智能机器人所配置的文本输入设备(例如键盘)来获取用户输入的文本信息,可以通过智能机器人所配置的视频传感器(例如摄像头)来获取用户输入的视觉信息和/或肢体信息,可以通过配置在智能机器人壳体或内部的相应传感器(例如压力传感器等)来用户用户输入的动作信息。在得到多模态交互信息后,该方法会在步骤S102中对步骤S101中所得到的多模态交互信息进行解析,从而得到用户情感参量。本实施例中,该方法在步骤S102中优选地利用预设情感引擎来根据上述多模态交互信息生成用户情感参量。具体地,对应于多模态交互信息所包含的信息的不同,预设情感引擎可以采用不同的方式来生成用户情感参量。需要指出的是,在本专利技术的不同实施例中,该方法在对获取到的多模态交互信息进行解析过程中所使用的预设情感引擎既可以是本地情感引擎,也可以是云端情感引擎,还可以是本地情感引擎与云端情感引擎的结合,本专利技术不限于此。语音既是人的发声器官发出的一种声波,它就像其他各种声音一样,也具有声音的物理属性。每一种音都具有一定的音色、音调、音强和音长。音色也称为音质,是一种声音区别于其他声音的基本特征。音调是指声音的高低,它取决于声波的频率。而声波频率又与发音体长短、厚薄以及松紧程度有关。声音的强弱叫做音强,它是由声波振动幅度决定的。声音的长短叫做音长,它取决于发音时间的长短,一个多音节的词,各个音节的轻重不同,其长短就不一样,此外不同音长还可以表达不同的语气和情态。因此,本实施例所提供的方法所采用的情感引擎便可以通过提取获取到的语音信息的相关特征参数(例如音色、音调、音强和音长等),并通过对这些特征参数进行解析来确定出用户情感参量。对于获取到的文本信本文档来自技高网...
【技术保护点】
一种用于智能机器人的人机交互方法,其特征在于,包括:交互信息获取步骤,获取用户输入的多模态交互信息;情感信息生成步骤,对所述多模态交互信息进行解析,生成用户情感参量;数据输出步骤,根据所述用户情感参量生成与所述用户情感参量匹配的音乐,结合所述音乐生成多模态输出数据并输出。
【技术特征摘要】
1.一种用于智能机器人的人机交互方法,其特征在于,包括:交互信息获取步骤,获取用户输入的多模态交互信息;情感信息生成步骤,对所述多模态交互信息进行解析,生成用户情感参量;数据输出步骤,根据所述用户情感参量生成与所述用户情感参量匹配的音乐,结合所述音乐生成多模态输出数据并输出。2.如权利要求1所述的方法,其特征在于,在所述数据输出步骤中,还生成对应于所述多模态交互信息的反馈信息,并将所述音乐作为所述反馈信息的背景音进行输出。3.如权利要求1或2所述的方法,其特征在于,在所述数据输出步骤中,根据所述用户情感参量生成与所述用户情感参量匹配的音乐,具体包括:根据所述用户情感参量确定当前情感场景;获取与所述当前情感场景相对应的音乐。4.如权利要求1所述的方法,其特征在于,在所述情感信息生成步骤中,利用预设情感引擎来根据所述多模态交互信息生成所述用户情感参量。5.如权利要求1所述的方法,其特征在于,所述多模态交互信息包括以下所列项中的任一项或几项:图像信息、语音信息和文本信息。6.一...
【专利技术属性】
技术研发人员:石琰,
申请(专利权)人:北京光年无限科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。