本发明专利技术是一种以卷积式神经网络实现阶层式语意地图的服务型机器人,该机器人包括有:语音单元,用来输入语音指令;视觉单元,用来记录环境图像;图形数据库,包括有记录路径节点的网格地图、拓朴式地图或合并该网格地图、该拓朴式地图的混合式地图;语义数据库,包括有根据该图形数据库产生的语义地图;计算单元,连接该语音单元、该视觉单元、该图形数据库与该语义数据库,通过卷积式神经网络,判别该语音指令的语义,并比对当前的该环境图像与该路径节点的特征,引导该机器人移往目的地;控制单元,连接该计算单元,根据计算结果移动该机器人。器人。器人。
【技术实现步骤摘要】
以卷积式神经网络实现阶层式语意地图的服务型机器人
[0001]本专利技术属于机器人的导航领域。
技术介绍
[0002]随着服务机器人普遍应用于在酒店和医院等公共场所,机器人与人们互动的方式也发生了转变,它必须自主地与公众互动,而不是由受过训练的人员进行控制,为了实现有意义且成功的人机互动,服务机器人需要了解其周围环境的几何形状和语义属性。
[0003]例如,在医院中,服务机器人被告知向病房A中的患者B送药,如此,服务机器人不仅需要了解如何导航到不同的病房,还要了解哪位患者在哪个病房。如果服务机器人不理解环境的语义属性,则必须系统地浏览每个区域以及访问每个患者,有鉴于任何环境都可以拥有众多区域和人员,现有系统搜索方法对于人机互动的需求显然是不足的。
[0004]为此,要促进人机互动的最佳方式,乃是通过口语的方式,这是最符合人类直观的沟通方法。
[0005]为了让机器人能够理解人类的语义,需要使用相同的空间和语义概念来感知世界,当前的语义映像工作仅能够识别单一级别的抽象概念,例如区分门道、走廊和房间,不仅无法应对复杂的环境空间,且必须具备强大的计算器脱机执行运算,对于资源有线的机器人,无法法提供足够的语义信息来达成人机互动。
技术实现思路
[0006]本专利技术的目的在于提供一种以卷积式神经网络实现阶层式语意地图的服务型机器人,其利用卷积神经网络(Convolutional Neural Networks)进行房室空间分割方法(Spatial Room Segmentation Method)获得分层语义组织结构的语义地图,实现基于语义输入的机器人导航控制。
[0007]为了达到以上目的,本专利技术采用的技术方案是:
[0008]一种以卷积式神经网络实现阶层式语意地图的服务型机器人,该机器人包括有:语音单元,用来输入语音指令;视觉单元,用来记录环境图像;图形数据库,包括有记录路径节点的网格地图(Grid Map)、拓朴式地图(Topological Map)或合并该网格地图、该拓朴式地图的混合式地图;语义数据库,包括有根据该图形数据库产生的语义地图;计算单元,连接该语音单元、该视觉单元、该图形数据库与该语义数据库,通过卷积式神经网络,判别该语音指令的语义,并比对当前的该环境图像与该路径节点的特征,引导该机器人移往目的地;控制单元,连接该计算单元,根据计算结果移动该机器人。
附图说明
[0009]图1为本专利技术的系统架构图;
[0010]图2为本专利技术的阶层式语意地图的示意图;以及
[0011]图3为本专利技术实现阶层式语意地图的建立步骤图。
[0012]附图标记说明:3
‑
1~3
‑4‑
步骤;100
‑
机器人;110
‑
语音单元;120
‑
视觉单元;130
‑
图形数据库;140
‑
语义数据库;150
‑
计算单元;160
‑
控制单元;170
‑
卷积式神经网络;200
‑
语义地图;210
‑
实际空间占用层;220
‑
拓朴层;230
‑
超路径节点层。
具体实施方式
[0013]参见附图1所示,本专利技术提供一种以卷积式神经网络实现阶层式语意地图的服务型机器人100,该机器人100包括有:
[0014]语音单元110,例如麦克风,用来输入语音指令;
[0015]视觉单元120,例如照相机或摄影机,用来记录环境图像;
[0016]图形数据库130,包括有记录路径节点的网格地图、拓朴式地图或合并该网格地图、该拓朴式地图的混合式地图;
[0017]语义数据库140,包括有根据该图形数据库130产生的语义地图200;
[0018]计算单元150,连接该语音单元110、该视觉单元120、该图形数据库130与该语义数据库140,用以规划路径;以及
[0019]控制单元160,连接该计算单元150,根据计算结果移动该机器人100。
[0020]前述系统中,该计算单元150连接有卷积式神经网络170,可以深层分析该语音指令的语义,然后比对当前的该环境图像与该路径节点的特征,引导该机器人100移往目的地。
[0021]请参阅图2所示,本专利技术所述的语义地图200根据包含的语义抽象水平规划为阶层式,由抽象水平最低至最高区分为实际空间占用层210、拓朴层220、超路径节点层(Supernode Layer)230。该实际空间占用层210标示最明确的空间,例如第1室、第2室
…
;该拓朴层220则定义符合人类判别的名称,例如客厅、卧室、厨房
…
;该超路径节点层230则进行更上位的定义,例如公寓
…
;当然,亦可视需要在中间增加其它层。
[0022]如此,愈明确的该语意指令可以最快进入该实际空间占用层210以进行导航,对于较为抽象的该语意指令,则需由该超路径节点层230进入该拓朴层依序判别后再取得正确位置。
[0023]请参阅图3所示,本专利技术实现阶层式语意地图的建立步骤如下:
[0024]3‑
1.输入当前环境的该环境图像;
[0025]3‑
2.利用该卷积式神经网络进行房室空间分割规划;
[0026]3‑
3.输出该当前环境的混合拓朴图(Hybrid Topological Map);
[0027]3.4.完成最后的该语意地图。
[0028]以上实施方式只为说明本专利技术的技术构思及特点,其目的在于让熟悉此项技术的人了解本专利技术的内容并加以实施,并不能以此限制本专利技术的保护范围,凡根据本专利技术精神实质所做的等效变化或修饰,都应涵盖在本专利技术的保护范围内。
本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种以卷积式神经网络实现阶层式语意地图的服务型机器人,其特征在于,该机器人包括有:语音单元,用来输入语音指令;视觉单元,用来记录环境图像;图形数据库,包括有记录路径节点的网格地图、拓朴式地图或合并该网格地图、该拓朴式地图的混合式地图;语义数据库,包括有根据该图形数据库产生的语义地图;计算单元,连接该语音单元、该视觉单元、该图形数据库与该语义数据库,...
【专利技术属性】
技术研发人员:罗仁权,颜炳郎,
申请(专利权)人:颜炳郎,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。