基于人工智能的拟人机器人控制方法、系统及拟人机器人技术方案

技术编号:12385831 阅读:149 留言:0更新日期:2015-11-25 18:00
本发明专利技术提出了一种基于人工智能的拟人机器人控制方法、系统及拟人机器人,其中,该方法包括:接收用户输入的语音信号和/或图像信号;根据语音信号和/或图像信号确定用户的意图;对用户的意图进行处理,并将处理结果以多模态的输出方式反馈给用户,多模态的输出方式包括拟人机器人的动作输出方式、图像或视频输出方式以及音频输出方式中的一种或多种。该方法可以根据采集到的用户的语音信号和/或图像信号经过人工智能的分析后自主地控制拟人机器人以多种方式与用户进行交互,更加直观有效地对人工智能的成果进行展示,在宣传、演示和服务领域具有非常亲和有效的作用。

【技术实现步骤摘要】

本专利技术涉及智能终端
,特别涉及一种基于人工智能(ArtificialIntelligence,简称:AI)的拟人机器人控制方法、控制系统及拟人机器人。
技术介绍
人工智能的载体通常是电脑或是移动终端等设备,然而,受限于电脑和移动终端本身的结构特点,不能够很好地实现与人类的交互,为了体现人工智能的优势,搭载有人工智能的大型拟人机器人孕育而生,现有的大型拟人机器人在与人类的交互性上比电脑和移动终端等直观,可是这些拟人机器人通常只具备一些有限的运动能力和简单的交互手段,其交互方式单一,例如:使用者通过遥控等简单的交互手段控制拟人机器人做简单的动作,又或者根据预先设定好的程序执行单一且简单的动作。现有的拟人机器人不具备类似人类的组织构成和交互方式,其交互方式单一且通常是被动的交互方式,例如:根据用户的遥控指令执行相应的动作,并不能够发挥人工智能的优势,“拟人性”较差,即:并不能够真正意义上使拟人机器人具有类似人类的思维或者主动的交互方式。综上,相关技术中的拟人机器人的人工智能部分与运动结构等硬件部分关系剥离,并没有建立一个有机的整体且不能进行更加丰富的表达,与人类之间没有更加多样的交互。
技术实现思路
本专利技术的目的旨在至少解决所述技术缺陷之一。为此,本专利技术的一个目的在于提出一种基于人工智能的拟人机器人控制方法。该方法可以根据采集到的用户的语音信号和/或图像信号经过人工智能的分析后自主地控制拟人机器人以多种方式与用户进行交互,更加直观有效地对人工智能的成果进行展示,在宣传、演示和服务领域具有非常亲和有效的作用。本专利技术的另一个目的在于提出一种基于人工智能的拟人机器人控制系统。本专利技术的再一个目的在于提出一种拟人机器人。为达到上述目的,本专利技术的第一方面的实施例公开了一种基于人工智能的拟人机器人控制方法,包括以下步骤:接收用户输入的语音信号和/或图像信号;根据所述语音信号和/或图像信号确定所述用户的意图;以及对所述用户的意图进行处理,并将处理结果以多模态的输出方式反馈给所述用户,所述多模态的输出方式包括所述拟人机器人的动作输出方式、图像或视频输出方式以及音频输出方式中的一种或多种。根据本专利技术实施例的基于人工智能的拟人机器人控制方法,能够实时的采集用户的语音信号和/或图像信号,经过人工智能的分析后自主地控制拟人机器人进行相应的动作、或者显示与用户意图相关的图像、或者播放与用户意图相关的音频等,与用户的交互手段丰富,可以更加直观有效地对人工智能的成果进行展示。此外,拟人机器人的运动完全是基于视觉和听觉的反馈方式实现,具有拟人的自主运动的意识,易于用户操作,同时更加全面地体现拟人机器人的智能性,提升用户的使用体验,在宣传、演示和服务领域具有非常亲和有效的作用。本专利技术第二方面的实施例公开了一种基于人工智能的拟人机器人控制系统,包括:接收模块,用于接收用户输入的语音信号和/或图像信号;人工智能模块,用于根据所述语音信号和/或图像信号确定所述用户的意图;以及控制模块,用于对所述用户的意图进行处理;反馈模块,用于将所述处理模块的处理结果以多模态的输出方式反馈给所述用户,所述多模态的输出方式包括所述拟人机器人的动作输出方式、图像或视频输出方式以及音频输出方式中的一种或多种。根据本专利技术实施例的基于人工智能的拟人机器人控制系统,能够实时的采集用户的语音信号和/或图像信号,经过人工智能的分析后自主地控制拟人机器人进行相应的动作、或者显示与用户意图相关的图像、或者播放与用户意图相关的音频等,与用户的交互手段丰富,可以更加直观有效地对人工智能的成果进行展示。此外,拟人机器人的运动完全是基于视觉和听觉的反馈方式实现,具有拟人的自主运动的意识,易于用户操作,同时更加全面地体现拟人机器人的智能性,提升用户的使用体验,在宣传、演示和服务领域具有非常亲和有效的作用。本专利技术第三方面的实施例公开了一种拟人机器人,包括:根据上述的第二方面实施例所述的基于人工智能的拟人机器人控制系统。该拟人机器人能够实时的采集用户的语音信号和/或图像信号,经过人工智能的分析后自主地控制拟人机器人进行相应的动作、或者显示与用户意图相关的图像、或者播放与用户意图相关的音频等,与用户的交互手段丰富,可以更加直观有效地对人工智能的成果进行展示。此外,拟人机器人的运动完全是基于视觉和听觉的反馈方式实现,具有拟人的自主运动的意识,易于用户操作,同时更加全面地体现拟人机器人的智能性,提升用户的使用体验,在宣传、演示和服务领域具有非常亲和有效的作用。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术所述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1是根据本专利技术一个实施例的基于人工智能的拟人机器人控制方法的流程图;以及图2是根据本专利技术一个实施例的基于人工智能的拟人机器人控制方法的确定所述用户的意图的详细流程图;图3是根据本专利技术另一个实施例的基于人工智能的拟人机器人控制方法的确定所述用户的意图的详细流程图;图4是根据本专利技术一个实施例的基于人工智能的拟人机器人控制方法控制拟人机器人移动至用户面前的流程图;图5是根据本专利技术一个实施例的基于人工智能的拟人机器人控制系统的结构框图;以及图6是根据本专利技术一个实施例的基于人工智能的拟人机器人的框架图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能解释为对本专利技术的限制。在本专利技术的描述中,需要理解的是,术语“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利技术的限制。在本专利技术的描述中,需要说明的是,除非另有规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是机械连接或电连接,也可以是两个元件内部的连通,可以是直接相连,也可以通过中间媒介间接相连,对于本领域的普通技术人员而言,可以根据具体情况理解所述术语的具体含本文档来自技高网...

【技术保护点】
一种基于人工智能的拟人机器人控制方法,其特征在于,包括以下步骤:接收用户输入的语音信号和/或图像信号;根据所述语音信号和/或图像信号确定所述用户的意图;以及对所述用户的意图进行处理,并将处理结果以多模态的输出方式反馈给所述用户,所述多模态的输出方式包括所述拟人机器人的动作输出方式、图像或视频输出方式以及音频输出方式中的一种或多种。

【技术特征摘要】
1.一种基于人工智能的拟人机器人控制方法,其特征在于,包括以下步骤:
接收用户输入的语音信号和/或图像信号;
根据所述语音信号和/或图像信号确定所述用户的意图;以及
对所述用户的意图进行处理,并将处理结果以多模态的输出方式反馈给所述用户,
所述多模态的输出方式包括所述拟人机器人的动作输出方式、图像或视频输出方式以
及音频输出方式中的一种或多种。
2.根据权利要求1所述的基于人工智能的拟人机器人控制方法,其特征在于,在
所述根据所述语音信号和/或图像信号确定所述用户的意图之前,还包括:
检测用户是否呼叫所述拟人机器人;
如果是,则激活所述拟人机器人,并根据所述用户的呼叫进行声源定位以确定所
述用户的位置,以及控制所述拟人机器人移动至所述用户的面前。
3.根据权利要求2所述的基于人工智能的拟人机器人控制方法,其特征在于,在
控制所述拟人机器人移动至所述用户的面前时,还包括:将所述拟人机器人的摄像头
转向面对所述用户的方向,以对用户进行拍照,并根据所述用户的图像信号进行人脸
识别,以确定所述用户的身份信息。
4.根据权利要求2所述的基于人工智能的拟人机器人控制方法,其特征在于,当
激活所述拟人机器人之后,还包括:显示所述拟人机器人的激活表情。
5.根据权利要求1所述的基于人工智能的拟人机器人控制方法,其特征在于,所
述根据所述语音信号和/或图像信号确定所述用户的意图,具体包括:
对所述语音信号进行语音识别,并对识别结果进行自然语言理解、语义分析、情
感分析中的一种或多种,以确定所述用户的意图;或者
对所述语音信号进行语音识别,并对识别结果进行自然语言理解、语义分析、情
感分析中的一种或多种,以及结合所述图像信号确定所述用户的意图。
6.根据权利要求1所述的基于人工智能的拟人机器人控制方法,其特征在于,所
述根据所述语音信号和/或图像信号确定所述用户的意图,具体包括:
对所述图像信号进行图像识别,确定所述图像信号中的用户,并根据所述图像信
号中多帧图像之间的用户的动作差异确定所述用户的肢体动作,以及根据所述用户的
肢体动作确定所述用户的意图;或者
对所述图像信号进行图像识别,确定所述图像信号中的用户,并根据所述图像信

\t号中多帧图像之间的用户的动作差异确定所述用户的肢体动作,以及根据所述用户的
肢体动作和/或所述语音信号确定所述用户的意图。
7.根据权利要求1所述的基于人工智能的拟人机器人控制方法,其特征在于,所
述将处理结果以多模态的输出方式反馈给所述用户,具体包括:
控制所述拟人机器人执行与所述用户的意图对应的动作;和/或;
显示与所述用户的意图相关的表情;和/或
进行与所述用户的意图相关的图像演示或视频演示;和/或
播放与所述用户的意图相关的音频。
8.一种基于人工智能的拟人机器人控制系统,其特征在于,包括:
接收模块,用于接收用户输入的语音信号和/或图像信号;
人工智能模...

【专利技术属性】
技术研发人员:王志昊葛行飞李福祥孟超超孙艳虎
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1