视觉语言室内导航方法、装置、设备及存储介质制造方法及图纸

技术编号：34521749 阅读：21 留言：0更新日期：2022-08-13 21:11

本申请实施例提供视觉语言室内导航方法、装置、设备及存储介质，其中的方法包括：基于预设的课程设计原则对预获取的R2R训练集进行重新设置，以得到融合有人类先验知识且适用于课程学习的CLR2R训练集；应用课程学习方式根据所述CLR2R训练集训练得到视觉语言室内导航模型以使虚拟机器人根据该视觉语言室内导航模型执行对应的室内导航任务。本申请能够有效且持续提高视觉语言室内导航过程的准确性、可靠性及效率，且能够在不增加模型复杂度的情况下显著提高导航机器人的性能、泛化性和训练效率。率。

全部详细技术资料下载

【技术实现步骤摘要】
视觉语言室内导航方法、装置、设备及存储介质

[0001]本申请涉及数据处理
，具体涉及视觉语言室内导航方法、装置、设备及存储介质。

技术介绍

[0002]基于视觉
‑
语言的导航任务VLN(Vision
‑
and
‑
Language Navigation)是一项虚拟机器人在人类指令下在一个具体的室内环境中执行导航的任务。然而，现有的视觉和语言导航方式大多忽略了样本难度的分布，因此易导致视觉和语言导航过程中的虚拟机器人的性能下降。

技术实现思路

[0003]针对现有技术中的问题，本申请提供一种视觉语言室内导航方法、装置、设备及存储介质，能够有效且持续提高视觉语言室内导航过程的准确性、可靠性及效率，且能够在不增加模型复杂度的情况下显著提高导航机器人的性能、泛化性和训练效率。
[0004]为解决上述技术问题，本申请提供以下技术方案：
[0005]第一方面，本申请提供一种视觉语言室内导航方法，包括：
[0006]基于预设的课程设计原则对预获取的R2R训练集进行重新设置，以得到融合有人类先验知识且适用于课程学习的CLR2R训练集；
[0007]应用课程学习方式根据所述CLR2R训练集训练得到视觉语言室内导航模型以使虚拟机器人根据该视觉语言室内导航模型执行对应的室内导航任务。
[0008]进一步地，在所述基于预设的课程设计原则对预获取的R2R训练集进行重新设置，以得到融合有人类先验知识且适用于课程学习的CLR2R训练...

【技术保护点】

【技术特征摘要】
1.一种视觉语言室内导航方法，其特征在于，包括：基于预设的课程设计原则对预获取的R2R训练集进行重新设置，以得到融合有人类先验知识且适用于课程学习的CLR2R训练集；应用课程学习方式根据所述CLR2R训练集训练得到视觉语言室内导航模型以使虚拟机器人根据该视觉语言室内导航模型执行对应的室内导航任务。2.根据权利要求1所述的视觉语言室内导航方法，其特征在于，在所述基于预设的课程设计原则对预获取的R2R训练集进行重新设置，以得到融合有人类先验知识且适用于课程学习的CLR2R训练集之前，还包括：获取针对视觉语言室内导航的人类先验知识数据，该人类先验知识数据包括：房间长度与导航任务的难度之间存在正相关关系，其中，所述房间长度为导航路径覆盖的房间数量。3.根据权利要求2所述的视觉语言室内导航方法，其特征在于，所述基于预设的课程设计原则对预获取的R2R训练集进行重新设置，以得到融合有人类先验知识且适用于课程学习的CLR2R训练集，包括：基于所述人类先验知识数据将预获取的R2R训练集对应的各个样本重新进行布局，以形成适用于课程学习的CLR2R训练集，其中，该CLR2R训练集包括由易至难排列的多个子集。4.根据权利要求3所述的视觉语言室内导航方法，其特征在于，所述基于所述人类先验知识数据将预获取的R2R训练集对应的各个样本重新进行布局，以形成适用于课程学习的CLR2R训练集，包括：根据所述人类先验知识数据将预获取的R2R训练集划分为由易至难排列的五个各自包含有不同样本的子集，且五个所述子集中样本对应的房间长度不同。5...

【专利技术属性】
技术研发人员：魏忠钰，张霁雯，
申请(专利权)人：复旦大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人