针对多视频帧的标注方法、装置、设备和存储介质制造方法及图纸

技术编号：29220414 阅读：27 留言：0更新日期：2021-07-10 00:59

本申请提供一种针对多视频帧的标注方法、装置、设备和存储介质，涉及图像处理技术领域。其中，一种针对多视频帧的标注方法，包括：获取针对相同区域采集的多个视频帧；根据所述多个视频帧进行三维重建，得到所述区域对应的三维重建场景；基于所述三维重建场景进行标注，得到所述三维重建场景中的标注信息；将所述三维重建场景中的标注信息投影至多个所述视频帧中，得到多个所述视频帧中的标注信息。上述方法能够实现视频帧的批量化标注，可以有效提高多视频帧的标注效率，以及降低标注工作的人力成本。成本。成本。

全部详细技术资料下载

【技术实现步骤摘要】
针对多视频帧的标注方法、装置、设备和存储介质

[0001]本申请涉及图像处理
，尤其涉及一种针对多视频帧的标注方法、装置、设备和存储介质。

技术介绍

[0002]在无人驾驶
中，图像感知算法作为核心算法得到广泛应用，其能够基于无人驾驶设备采集的连续图像帧，采用机器学习的方式进行定位和障碍物的识别等。在机器学习的训练过程中，需要对训练样本数据所对应的图像帧中的目标物体进行标注。
[0003]目前，大多数用于图像感知算法中的标注都来源于人工标注，并且标注人员只在单帧图像上进行标注。这样的标注方式会耗费大量的人力物力，并且自动驾驶领域需要进行连续帧的标注，这样又大幅增加了标注工作量和标注成本。
[0004]鉴于上述问题，需要提供一种能够提高多视频帧的标注效率的方案。

技术实现思路

[0005]本申请实施例的目的是提供一种针对多视频帧的标注方法、装置、设备和存储介质，以至少解决如何提高多视频帧的标注效率的问题。
[0006]为解决上述技术问题，本申请实施例提供如下技术方案：
[0007]本申请第一方面提供一种针对多视频帧的标注方法，所述方法包括：
[0008]获取针对相同区域采集的多个视频帧；
[0009]根据所述多个视频帧进行三维重建，得到所述区域对应的三维重建场景；
[0010]基于所述三维重建场景进行标注，得到所述三维重建场景中的标注信息；
[0011]将所述三维重建场景中的标注信息投影至多个所述视频帧中，得到多个所述视频帧中的...

【技术保护点】

【技术特征摘要】
1.一种针对多视频帧的标注方法，其特征在于，包括：获取针对相同区域采集的多个视频帧；根据所述多个视频帧进行三维重建，得到所述区域对应的三维重建场景；基于所述三维重建场景进行标注，得到所述三维重建场景中的标注信息；将所述三维重建场景中的标注信息投影至多个所述视频帧中，得到多个所述视频帧中的标注信息。2.根据权利要求1所述的方法，其特征在于，所述根据所述多个视频帧进行三维重建，得到所述区域对应的三维重建场景，包括：确定每个所述视频帧分别对应的相机位置信息；根据每个所述视频帧分别对应的相机位置信息和所述视频帧进行三维重建，得到所述区域的三维重建场景。3.根据权利要求2所述的方法，其特征在于，所述根据每个所述视频帧分别对应的相机位置信息和所述视频帧进行三维重建，得到所述区域的三维重建场景，包括：根据每个所述视频帧分别对应的相机位置信息和所述视频帧中各像素点的像素位置信息，采用稠密重建算法确定每个所述像素点对应于世界坐标系中的三维点的位置信息，并根据所述三维点构成的三维点云确定所述区域的三维重建场景。4.根据权利要求1所述的方法，其特征在于，所述基于所述三维重建场景进行标注，得到所述三维重建场景中的标注信息，包括：确定每个所述视频帧中的像素点与所述三维重建场景中三维点的对应关系；响应于用户针对所述视频帧中像素点的第一标注操作，根据所述对应关系将所述第一标注操作转换为针对所述三维重建场景中三维点的第二标注操作，并根据所述第二标注操作生成所述三维重建场景中的标注信息。5.根据权利要求1所述的方法，其特征在于，所述方法所标注的对象位于地面，所述视频帧包括相机俯向地面拍摄的俯视图；所述基于所述三维重建场景进行标注，得到所述三维重建场景中的标注信息，包括：响应于用户针对所述俯视图中像素点的第三标注操作，根据拍摄所述俯视图的相机对应的相机坐标系与所述三维重建场景对应的世界坐标系之间的坐标转换关系，将所述第三标注操作转换为针对所述三维重建场景中三维点的第四标注操作，并根据所述第四标注操作生成所述三维重建场景中的标注信息。6.根据权利要求1所述的方法，其特征在于，所述将所述三维重建场景中的标注信息投影至多个所述视频帧中，得到多个所述视频帧中的标注信息，包括：将所述三维重建场景中的标注信息，根据每个所述视频帧分别对应的相机位置信息和拍摄时间信息，投影至多个所述视频帧中，得到多个所述视频帧中的标注信息，其中，投影的每个所述视频帧中包含的拍摄对象包括所述标注信息所标注的对象。7.根据权利要求1所述的方法，其特征在于，所述获取针对相同区域采集的多个视频帧，包括：获取多个车辆在相同车道采集的多组连续视频帧；所述根据所述多个视频帧进行三维重建，得到所述区域对应的三维重建场景，包括：根据所述多组连续视频帧对所述车道上的静态物体进行三维重建，得到所述车道的三
维重建场景；所述基于所述三维重建场景进行标注，得到所述三维重建场景中的标注信息，包括：基于所述三维重建场景，对所述三维重建场景中的静态物体进行标注，得到所述三维重建场景中静态物体的标注信息。8.一种针对多视频帧的标注装置，其特征在于，包括：视频帧获取模块，用于获取针对相同区域采集的多个视频帧；三维重...

【专利技术属性】
技术研发人员：石佳，侯文博，李翔，李俊桥，
申请(专利权)人：北京车和家信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人