单目视觉跟踪方法、装置及存储介质制造方法及图纸

技术编号:19345887 阅读:46 留言:0更新日期:2018-11-07 15:18
本发明专利技术实施例提出一种单目视觉跟踪方法、装置及计算机可读存储介质。其中单目视觉跟踪方法包括:使用无线追踪器采集第一相机位姿;使用摄像装置拍摄标定板图像,根据所拍摄的标定板图像,计算出第二相机位姿;获取第一相机位姿和第二相机位姿之间的转换参数;在摄像装置进行场景拍摄时,通过转换参数将第一相机位姿转换为第二相机位姿;其中,在采集第一相机位姿、拍摄标定板图像以及进行场景拍摄的过程中,无线追踪器和摄像装置的相对位置保持不变。本发明专利技术实施例通过摄像装置和无线追踪器进行单目视觉相机跟踪数据库的采集和相机位姿真值构建,所用设备造价低,适用于普通预研或者初步评测,且能够很好的模拟用户使用场景。

Monocular vision tracking method, device and storage medium

The embodiment of the invention provides a monocular vision tracking method, a device and a computer readable storage medium. The monocular vision tracking method includes: acquiring the first camera pose by wireless tracker; taking calibration plate image by camera device and calculating the second camera pose based on the captured calibration plate image; acquiring the conversion parameters between the first camera pose and the second camera pose; and taking scene shooting in camera device. The position of the first camera is converted to that of the second camera by changing the parameters, in which the relative position of the wireless tracker and the camera remains unchanged during the acquisition of the position of the first camera, the shooting of the calibration plate image and the scene shooting. The embodiment of the present invention collects the monocular vision camera tracking database and constructs the true value of the camera position and posture through the camera device and wireless tracker. The equipment used is low in cost, suitable for general pre-research or preliminary evaluation, and can well simulate the user's use scene.

【技术实现步骤摘要】
单目视觉跟踪方法、装置及存储介质
本专利技术涉及信息
,尤其涉及一种单目视觉跟踪方法、装置及计算机可读存储介质。
技术介绍
单目视觉跟踪是三维物体重建、AR(AugmentedReality,增强现实)相机跟踪等计算机视觉应用的底层核心技术。客观评价其跟踪精度是衡量算法优劣的核心指标。目前视觉跟踪技术,类似SLAM(simultaneouslocalizationandmapping,即时定位与地图构建)或者VO(VisualOdometry,视觉里程计)几乎都采用ATE(absolutetranslationerror,绝对位移误差)及RPE(relativeposeerror,相对位姿误差)衡量。目前构建单目视觉相机跟踪数据库的方式主要有:引入3Dlasertracker(激光跟踪仪)、IMU(Inertialmeasurementunit,惯性测量单元)、stereocamera(立体摄影机),或者Vicon(威康)用于确定相机真实姿态。一般来说是利用基于3Dlaser的ICP(IterativeClosestPoint,迭代最近点算法)、stereocamera的SFM(structurefrommotion,运动恢复结构)或者Vicon的跟踪sensor(传感器)获取相机真实姿态。其中,3Dlasertracker和Vicon造价高,不适合普通实验室的预研工作;IMU和stereocamera在达到较高的性能要求的情况下也需要较高的造价。一些常用的公开数据集采用的场景比较集中,如车载拍摄数据,或单一的几个室内场景,针对大规模多场景应用的技术,比如AR相机跟踪,用这些数据测试,不能很好的模拟用户使用场景。现有技术的缺点主要包括以下几个方面:1)所用设备造价高,不适用于普通预研或者初步评测;2)所用采集设备基于硬件进行时间同步,针对一般开发者较难实现;3)假定相机成像模型不变,而现实情况下在移动平台上由于手机硬件防抖模块使得相机焦距无法固定,由此降低相机位姿真值估计精度。
技术实现思路
本专利技术实施例提供一种单目视觉跟踪方法、装置及计算机可读存储介质,以至少解决现有技术中的一个或多个技术问题。第一方面,本专利技术实施例提供了一种单目视觉跟踪方法,包括:使用所述无线追踪器采集第一相机位姿;使用所述摄像装置拍摄标定板图像,根据所拍摄的标定板图像,计算出第二相机位姿;获取所述第一相机位姿和所述第二相机位姿之间的转换参数;在所述摄像装置进行场景拍摄时,通过所述转换参数将所述第一相机位姿转换为所述第二相机位姿;其中,在采集所述第一相机位姿、拍摄所述标定板图像以及进行场景拍摄的过程中,所述无线追踪器和所述摄像装置的相对位置保持不变。结合第一方面,本专利技术实施例在第一方面的第一种实现方式中,根据所拍摄的标定板图像,计算出第二相机位姿,包括:将所述摄像装置拍摄的标定板图像进行相机内参归一化处理,将基于不同时刻成像模型参数的标定板图像转化成具有相同的成像模型参数;以及根据相机内参归一化处理后的标定板图像,使用相机标定算法计算出第二相机位姿。结合第一方面、第一方面的第一种实现方式,本专利技术实施例在第一方面的第二种实现方式中,根据所拍摄的标定板图像,计算出第二相机位姿,还包括:根据图像清晰度和相机位姿差异度从拍摄的所述标定板图像中选取一组图像序列;根据选取的所述图像序列,使用相机标定算法计算出第二相机位姿。结合第一方面、第一方面的第一种实现方式,本专利技术实施例在第一方面的第三种实现方式中,获取所述第一相机位姿和所述第二相机位姿之间的转换参数,包括:根据设定的摄像装置的系统时间与无线追踪器的系统时间的时间差,获取所述第一相机位姿和所述第二相机位姿的对应数据,利用手眼标定进行配准,获取所述时间差下的最优转换矩阵和最优重投影误差,其中,所述最优转换矩阵是所述时间差下的重投影误差最小时对应的转换矩阵,所述最优重投影误差是所述最优转换矩阵对应的重投影误差;调整所述时间差,将所述最优重投影误差值最小时对应的时间差确定为系统时间差;将系统时间差下的所述最优转换矩阵确定为所述第一相机位姿和所述第二相机位姿之间的转换参数;其中,所述转换矩阵包括摄像装置位姿坐标系与无线追踪器位姿坐标系之间的转换矩阵、标定板坐标系与基站坐标系之间的转换矩阵;所述基站用于跟踪所述无线追踪器的位置;在所述摄像装置进行场景拍摄时,通过所述转换参数将所述第一相机位姿转换为所述第二相机位姿,包括:在使用场景中通过所述转换参数以及所述系统时间差,将所述第一相机位姿转换为所述第二相机位姿。结合第一方面的第三种实现方式,本专利技术实施例在第一方面的第四种实现方式中,获取所述第一相机位姿和所述第二相机位姿的对应数据,包括:按照设定的所述时间差,采用插值法从所述第一相机位姿的数据中抽取采集时间差小于预定时间差阈值的数据,所述采集时间差是所述第一相机位姿与所述第二相机位姿的采集时间的差值;将抽取出的所述第一相机位姿的数据和对应的所述第二相机位姿的数据,作为所述第一相机位姿和所述第二相机位姿的对应数据。结合第一方面的第三种实现方式,本专利技术实施例在第一方面的第五种实现方式中,利用手眼标定进行配准,获取当前时间差下最优转换矩阵,包括:根据所述第一相机位姿和所述第二相机位姿的对应数据,以及所述第一相机位姿和所述第二相机位姿的转换关系,基于奇异值分解方法获取所述转换矩阵的初始值;根据重投影误差公式以及所述第一相机位姿和所述第二相机位姿的转换关系公式,采用高斯牛顿法优化重投影误差,获取当前时间差下最优转换矩阵;其中,所述第一相机位姿和所述第二相机位姿的转换关系公式为AX=ZB,A表示所述第一相机位姿,X表示摄像装置位姿坐标系与无线追踪器位姿坐标系之间的转换矩阵,B表示所述第二相机位姿,Z表示标定板坐标系与基站坐标系之间的转换矩阵;所述重投影误差公式为:其中,为第i帧图像对应的所述第二相机位姿,Ki|i∈[0,n-1]为相机内参,以及,为标定板上角点在标定板坐标系下的位置,为在图像i上角点检测的位置,N是标定板上的角点数目。结合第一方面的第五种实现方式,本专利技术实施例在第一方面的第六种实现方式中,在基于奇异值分解方法获取所述转换矩阵的初始值之前,还包括:将摄像装置位姿坐标系与无线追踪器位姿坐标系转换为统一的坐标系。结合第一方面的第六种实现方式,本专利技术实施例在第一方面的第七种实现方式中,将摄像装置位姿坐标系与无线追踪器位姿坐标系变换为统一的坐标系,包括:将无线追踪器位姿坐标系变换为右手坐标系。第二方面,本专利技术实施例提供了一种单目视觉跟踪装置,包括:第一位姿获取单元,用于使用无线追踪器采集第一相机位姿;第二位姿获取单元,用于使用摄像装置拍摄标定板图像,根据所拍摄的标定板图像,计算出第二相机位姿;转换参数获取单元,用于获取所述第一相机位姿和所述第二相机位姿之间的转换参数;转换单元,用于在所述摄像装置进行场景拍摄时,通过所述转换参数将所述第一相机位姿转换为所述第二相机位姿;其中,在采集所述第一相机位姿、拍摄所述标定板图像以及进行场景拍摄的过程中,所述无线追踪器和所述摄像装置的相对位置保持不变。结合第二方面,本专利技术实施例在第二方面的第一种实现方式中,所述第二位姿获取单元包括归一化子单元,用于:将所述摄像装本文档来自技高网
...

【技术保护点】
1.一种单目视觉跟踪方法,其特征在于,包括:使用无线追踪器采集第一相机位姿;使用摄像装置拍摄标定板图像,根据所拍摄的标定板图像,计算出第二相机位姿;获取所述第一相机位姿和所述第二相机位姿之间的转换参数;在所述摄像装置进行场景拍摄时,通过所述转换参数将所述第一相机位姿转换为所述第二相机位姿;其中,在采集所述第一相机位姿、拍摄所述标定板图像以及进行场景拍摄的过程中,所述无线追踪器和所述摄像装置的相对位置保持不变。

【技术特征摘要】
1.一种单目视觉跟踪方法,其特征在于,包括:使用无线追踪器采集第一相机位姿;使用摄像装置拍摄标定板图像,根据所拍摄的标定板图像,计算出第二相机位姿;获取所述第一相机位姿和所述第二相机位姿之间的转换参数;在所述摄像装置进行场景拍摄时,通过所述转换参数将所述第一相机位姿转换为所述第二相机位姿;其中,在采集所述第一相机位姿、拍摄所述标定板图像以及进行场景拍摄的过程中,所述无线追踪器和所述摄像装置的相对位置保持不变。2.根据权利要求1所述的方法,其特征在于,根据所拍摄的标定板图像,计算出第二相机位姿,包括:将所述摄像装置拍摄的标定板图像进行相机内参归一化处理,将基于不同时刻成像模型参数的标定板图像转化成具有相同的成像模型参数;以及根据相机内参归一化处理后的标定板图像,使用相机标定算法计算出第二相机位姿。3.根据权利要求1或2所述的方法,其特征在于,根据所拍摄的标定板图像,计算出第二相机位姿,还包括:根据图像清晰度和相机位姿差异度从拍摄的所述标定板图像中选取一组图像序列;根据选取的所述图像序列,使用相机标定算法计算出第二相机位姿。4.根据权利要求1或2所述的方法,其特征在于,获取所述第一相机位姿和所述第二相机位姿之间的转换参数,包括:根据设定的摄像装置的系统时间与无线追踪器的系统时间的时间差,获取所述第一相机位姿和所述第二相机位姿的对应数据,利用手眼标定进行配准,获取所述时间差下的最优转换矩阵和最优重投影误差,其中,所述最优转换矩阵是所述时间差下的重投影误差最小时对应的转换矩阵,所述最优重投影误差是所述最优转换矩阵对应的重投影误差;调整所述时间差,将所述最优重投影误差值最小时对应的时间差确定为系统时间差;将系统时间差下的所述最优转换矩阵确定为所述第一相机位姿和所述第二相机位姿之间的转换参数;其中,所述转换矩阵包括摄像装置位姿坐标系与无线追踪器位姿坐标系之间的转换矩阵、标定板坐标系与基站坐标系之间的转换矩阵;所述基站用于跟踪所述无线追踪器的位置;在所述摄像装置进行场景拍摄时,通过所述转换参数将所述第一相机位姿转换为所述第二相机位姿,包括:在使用场景中通过所述转换参数以及所述系统时间差,将所述第一相机位姿转换为所述第二相机位姿。5.根据权利要求4所述的方法,其特征在于,获取所述第一相机位姿和所述第二相机位姿的对应数据,包括:按照设定的所述时间差,采用插值法从所述第一相机位姿的数据中抽取采集时间差小于预定时间差阈值的数据,所述采集时间差是所述第一相机位姿与所述第二相机位姿的采集时间的差值;将抽取出的所述第一相机位姿的数据和对应的所述第二相机位姿的数据,作为所述第一相机位姿和所述第二相机位姿的对应数据。6.根据权利要求4所述的方法,其特征在于,利用手眼标定进行配准,获取当前时间差下最优转换矩阵,包括:根据所述第一相机位姿和所述第二相机位姿的对应数据,以及所述第一相机位姿和所述第二相机位姿的转换关系公式,基于奇异值分解方法获取所述转换矩阵的初始值;根据重投影误差公式以及所述第一相机位姿和所述第二相机位姿的转换关系,采用高斯牛顿法优化重投影误差,获取当前时间差下最优转换矩阵;其中,所述第一相机位姿和所述第二相机位姿的转换关系公式为AX=ZB,A表示所述第一相机位姿,X表示摄像装置位姿坐标系与无线追踪器位姿坐标系之间的转换矩阵,B表示所述第二相机位姿,Z表示标定板坐标系与基站坐标系之间的转换矩阵;所述重投影误差公式为:其中,为第i帧图像对应的所述第二相机位姿,Ki|i∈[0,n-1]为相机内参,以及,为标定板上角点在标定板坐标系下的位置,为在图像i上角点检测的位置,N是标定板上的角点数目。7.根据权利要求6所述的方法,其特征在于,在基于奇异值分解方法获取所述转换矩阵的初始值之前,还包括:将摄像装置位姿坐标系与无线追踪器位姿坐标系转换为统一的坐标系。8.根据权利要求7所述的方法,其特征在于,将摄像装置位姿坐标系与无线追踪器位姿坐标系变换为统一的坐标系,包括:将无线追踪器位姿坐标系变换为右手坐标系。9.一种单目视觉跟踪装置,其特征在于,包括:第一位姿获取单元,用于使用无线追踪器采集第一相机位姿;第二位姿获取单元,用于使用摄像装置拍摄标定板图像,根据所拍摄的标定板图像,计算出第二相机位姿;转换参数获取...

【专利技术属性】
技术研发人员:林源张永杰李颖超吴中勤
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1