一种应用于机器人交互的多模态数据处理方法技术

技术编号：31792574 阅读：17 留言：0更新日期：2022-01-08 10:51

本发明专利技术公开了一种应用于机器人交互的多模态数据处理方法，其中方法包括获取目标视觉信息数据，并获取目标触觉信息数据；基于多模态数据融合模型对所述目标视觉信息数据和所述目标触觉信息数据进行融合处理，得到融合后的指令信息数据，其中，所述多模态数据融合模型通过对能够反映机器人动作指令的视觉信息样本数据和触觉信息样本数据进行训练得到；识别所述指令信息数据，输出所述指令信息数据至与所述指令信息数据相关联的机器人的动作构件中。本发明专利技术实施例提供的应用于机器人交互的多模态数据处理方法，通过对视觉数据和触觉数据进行多模态的融合，提高了数据处理的精度，推进了机器人的智能化进程。推进了机器人的智能化进程。推进了机器人的智能化进程。

全部详细技术资料下载

【技术实现步骤摘要】
一种应用于机器人交互的多模态数据处理方法

[0001]本专利技术涉及机器人
，尤其是涉及一种应用于机器人交互的多模态数据处理方法、装置、设备及存储介质。

技术介绍

[0002]随着人工智能技术的不断发展，智能家居机器人凭借着灵活的机械爪，高灵敏度的各种传感器，不仅可以识别三维物体，而且能够执行各种复杂的动作，逐渐受到了消费者的青睐。
[0003]为了实现“人与物”之间的信息交互，进而达到家居机器人控制的智能化，如何对接收到的数据进行处理就显得尤为重要，在现有技术中，主要依靠图像识别和神经网络等相关技术，通过将摄像头采集到的图像信号输入至训练好的神经网络模型中，得到能够反映目标用户需求的数据，再将数据传递至机器人的控制器中以生成对应的动作信号，由机器人的动作构件执行动作。
[0004]但是，当智能家居机器人在复杂的诸如遮挡物较多的环境下时，图像信号的获取不可避免地会受到影响，导致数据的处理精度降低，难以反映真实的用户需求，不利于机器人的智能化发展。

技术实现思路

[0005]本专利技术提供了一种应用于机器人交互的多模态数据处理方法、装置、设备及存储介质，以解决现有的机器人仅依靠视觉数据，导致数据的处理精度较低的技术问题，通过对视觉数据和触觉数据进行多模态的融合，提高了数据处理的精度，推进了机器人的智能化进程。
[0006]为了解决上述技术问题，本专利技术实施例提供了一种应用于机器人交互的多模态数据处理方法，包括：
[0007]获取目标视觉信息数据，并获取目标触觉信息...

【技术保护点】

【技术特征摘要】
1.一种应用于机器人交互的多模态数据处理方法，其特征在于，包括：获取目标视觉信息数据，并获取目标触觉信息数据；基于多模态数据融合模型对所述目标视觉信息数据和所述目标触觉信息数据进行融合处理，得到融合后的指令信息数据，其中，所述多模态数据融合模型通过对能够反映机器人动作指令的视觉信息样本数据和触觉信息样本数据进行训练得到；识别所述指令信息数据，输出所述指令信息数据至与所述指令信息数据相关联的机器人的动作构件中。2.如权利要求1所述的应用于机器人交互的多模态数据处理方法，其特征在于，所述多模态数据融合模型的构建，具体包括：将所述视觉信息样本数据转换为高维视觉数据，并将所述触觉信息样本数据转换为高维触觉数据；分别提取所述高维视觉数据的视觉特征和所述高维触觉数据的触觉特征；基于CNN卷积神经网络技术，由卷积神经网络的全连接层输出对所述视觉特征和所述触觉特征进行特征共性融合后得到的融合特征；对所述融合特征进行识别，根据识别出的与所述融合特征相关联的机器人动作指令构建多模态数据融合模型。3.如权利要求2所述的应用于机器人交互的多模态数据处理方法，其特征在于，所述分别提取所述高维视觉数据的视觉特征和所述高维触觉数据的触觉特征，具体包括：基于C3D三维卷积网络提取所述高维视觉数据的视觉特征，并基于TCN时间卷积网络提取所述高维触觉数据的触觉特征。4.如权利要求1所述的应用于机器人交互的多模态数据处理方法，其特征在于，所述方法还包括：基于CNN卷积神经网络中的反向传播算法对所述多模态数据融合模型进行训练。5.一种应用于机器人交互的多模态数据处理装置，其特征在于，包括：数据获取模块，用于获取目标视觉信息数据，并获取目标触觉信息数据；模型处理模块，用于根据多模态数据融合模型对所述目标视觉信息数据和所述目标触觉信息数据进行融合处理，得到融合后的指令信息数据，其中，所述多模态数据融合模型通过对能够反映机器人动...

【专利技术属性】
技术研发人员：石光明，张凡，李旭阳，谢雪梅，
申请(专利权)人：西安电子科技大学广州研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人