【技术实现步骤摘要】
基于深度变分模型的空间显著性区域提取方法
本专利技术属于计算机视觉领域,涉及一种基于深度变分模型的空间显著性区域提取方法。
技术介绍
在日常生活中,我们观察图像时,通常只对整幅图像或整段视频中很小的较为显著的一部分感兴趣。因此,计算机模拟人类视觉系统时,主要通过检测图像中显著性区域进行模拟。显著性检测已逐渐成为计算机视觉领域非常重要的一门技术。在这个领域中,如何运用高效的方法从大场景中准确地检测、重构出空间显著性区域,是一个非常关键的技术。传统的显著性检测方法有多种,但对于某些图像,如图像中存在近景和远景,且远景距离观察者较远的图像,对于这类图像的显著性检测,结果不太符合人类视觉系统,检测结果还不太准确,也无法快速、准确建立目标物体的空间几何信息。申请号为201310658853.X的专利提出了一种基于显著性的快速场景分析方法,借鉴人类视觉系统神经机制来设计计算机视觉模型,提出了自底而上、各个特征图可并行的机制,并且将多个特征在多尺度下进行融合,最后合成一张综合的视觉显著性图。通过两层的胜者为王神经网络得到显著性区域,最后通过禁止返回机制,抑制当前显著性区域,转而寻找下一个显著性区域,直到遍历所有显著性区域。在一幅图像中快速提取人眼所能观察到的引人注意的区域。该方法只是针对二维场景的显著性区域提取,不能够提供空间显著性区域深度信息。因此,如何在整体场景深度图中自动提取显著性区域,并重建出三维显著性区域,仍存在很大的技术问题。三维重建技术是当今视觉方面十分重要的一项应用,但是现有技术大多侧重于整体场景重建。为了更加真实模拟人眼视觉对空间显著性区域的感知,对空 ...
【技术保护点】
基于深度变分模型的空间显著性区域提取方法,其特征在于包括以下步骤: 步骤1,进行相机校正; 在世界坐标系中,相机位姿Tcw可以表示为如下矩阵: Tcw=[Rcw,tcw] (1) 式中,下标cw表示从世界坐标系到当前相机坐标系,Tcw∈SE(3),且SE(3):={[R,t]|R∈SO(3),t∈R3}。tcw、Rcw由六元组ξ=(μ1,μ2,μ3,μ4,μ5,μ6)表示,即: 式中,μ1,μ2,μ3为相机在世界坐标系下的坐标,μ4,μ5,μ6分别为世界坐标系下相机沿x,y,z方向上的旋转向量,ξ的数学表达式如下: 相机的位姿Tcw建立了相机坐标系下点Pc到世界坐标系下点Pw的变换关系,即: Pc=TcwPw (4) 在相机坐标系下,三维空间点到像平面上的投影定义为: π(p)=K(x/z,y/z,1)T (5) 式中,P∈R3的三维空间点,x,y,z为该点的坐标值,K为相机的内参矩阵,fu,fv为相机焦距,u0,v0为像平面中心坐标;根据当前坐标的深度值d,利用逆向投影法确定当前空间三维点坐标p,其坐标关系表示为: 式中,为u的齐次表达式;采 ...
【技术特征摘要】
1.基于深度变分模型的空间显著性区域提取方法,其特征在于包括以下步骤:步骤1,进行相机校正;在世界坐标系中,相机位姿Tcw可以表示为如下矩阵:Tcw=[Rcw,tcw](1)式中,下标cw表示从世界坐标系到当前相机坐标系,Tcw∈SE(3),且SE(3):={[R,t]|R∈SO(3),t∈R3},tcw、Rcw由六元组ξ=(μ1,μ2,μ3,μ4,μ5,μ6)表示,即:式中,μ1,μ2,μ3为相机在世界坐标系下的坐标,μ4,μ5,μ6分别为世界坐标系下相机沿x,y,z方向上的旋转向量,ξ的数学表达式如下:相机的位姿Tcw建立了相机坐标系下点Pc到世界坐标系下点Pw的变换关系,即:Pc=TcwPw(4)在相机坐标系下,三维空间点到像平面上的投影定义为:π(p)=K(x/z,y/z,1)T(5)式中,P∈R3的三维空间点,x,y,z为该点的坐标值,K为相机的内参矩阵,fu,fv为相机焦距,u0,v0为像平面中心坐标;根据当前坐标的深度值d,利用逆向投影法确定当前空间三维点坐标p,其坐标关系表示为:式中,为u的齐次表达式;采用FOV模型实现对单目相机的矫正,其数学描述如下:ru=||xu||式中,xu为像素归一化坐标,ud为畸变后像素坐标,ω为畸变系数,rd,ru分别为矫正前后归一化坐标到坐标系中心的距离;利用上述相机模型,将图像像素坐标映射到归一化坐标平面,同时结合相机内参数矩阵K,实现图像畸变矫正,即:u=Kxn(9)步骤2,基于变分模型的深度图的建立与求解;步骤3,显著性粗提取;原图像经显著性滤波器算法处理,获得初始显著性图OSM和亮度特征图IFM;步骤4,显著性精细提取;步骤5,显著性区域三维重建;将提取的显著性区域范围反投影到深度图,获取显著性区域的深度图,结合相机投影模型实现当前环境下三维显著性区域的重建;步骤2所述基于变分模型的深度图的建立与求解方法包括以下步骤:步骤2.1,建立基于深度模型的能量函数;其表达式如下:式中,λ为数据惩罚项Edata和变分规则项Ereg间的权重系数,Ω∈R2为深度图的取值范围;能量函数的求解:步骤2.2,计算数据惩罚项;在相机精确定位的基础上,根据极线几何关系可获取当前环境的稠密深度信息;利用关键帧Ir及其邻近图像序列I={I1,I2,…In},结合投影模型建立数据项Edata:式中,Ir为当前图像序列中与参考帧具有重合信息的图像帧数量,x'是在深度值为d时,图像Ii中参考帧Ir中x对应的像素坐标,即:步骤2.3,计算变分规则项;在深度图平滑性假设前提下,为确保场景中界处的不连续性,引入加权Hubert算子作为变分规则项;Hubert算子定义如下:式中,α为常量;基于加权的Hubert算子的变分规则项为:式中,为深度图的梯度,g(u)=exp[-α||Ir(u)||]为像素梯度权重系数,用以抑制规则项的过平滑作用;步骤2.4,求解能量函数;通过引入变量h来求解能量函数(10),能量函数化简为:式中,θ为常量;引入变量h后,能量函数的求解过程转化为凸优化问题,随着能量函数的不断优化,使h≈d;根据Legendre-Fenchel变换,Huber算子等效为:式中,将(16)式带入能量方程,深度优化函数表示为:采用交替下降法实现对上述能量函数的最小化,具体过程如下:(1)固定h求解:式中,根据拉格朗日极值法,该能量函数达到最小值的条件为:式中,div(q)为q的散度;结合偏导数离散化描述,上述极值条件表示为:式中,div(p)为p的散度...
【专利技术属性】
技术研发人员:贾松敏,徐涛,张鹏,李秀智,宣璇,
申请(专利权)人:北京工业大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。