本发明专利技术公开了一种基于L1正则化的图像显著性检测方法,该方法包括以下步骤:对待检测图像进行傅立叶变换,对其频域幅度谱进行不同尺度的高斯滤波,构建频域的尺度空间;设计基于全变分的稀疏优化问题,利用SplitBregman方法求解该问题,得到一组候选显著性图像;使用图像二维熵作为选取标准,从候选显著性图像中选取二维熵最小的图像并进行空域的高斯滤波,得到最终的显著性图像;本发明专利技术结合了显著性图像的空域和频域的特性,有效地消除了复杂背景的影响,并且可以高效的求解,与以往频域分析的显著性检测方法相比,在人眼注视点检测和物体分割检测方面取得了更好的效果。
【技术实现步骤摘要】
基于L1正则化的图像显著性检测方法
本专利技术属于图像处理
,具体涉及一种基于L1正则化的图像显著性检测方法。
技术介绍
基于图像的目标检测是计算机视觉和模式识别领域的重要课题,在图像分割,图像检索和机器人自主感知等领域中有着广泛的应用。在各类目标检测方法中,显著性方法以其对人类视觉注意机制的探索和模拟吸引了大量研究者的关注。人类视觉机制能够从观察到的大量场景信息中快速地检索出感兴趣物体,从而极大地提升了人类对场景的理解效率和反应速度。显著性检测方法基于这个原理,通过分析图像内容,将图像中与周围区域差异明显的部分标示出来,即“显著性区域”,以便后续进行高效的图像处理。显著性检测方法计算模型分为自上而下和自下而上两类,自上而下的方法依赖于特定的检测任务和内容,而自下而上的方法则完全通过对输入图像的分析进行检测。在自下而上的方法中,空域检测通过对图像局部颜色,方向,纹理等特征或者全局对比度的统计,寻找与周边特征差异明显的区域作为显著性区域,频域分析则根据变换域理论,对图像频谱进行处理,突出显著区域对应分量,抑制非显著区域对应分量。频域分析方法无需对目标的特征进行设计和统计,具有实现方便高效的优点。几种典型的频域处理方法,如频谱残差法(SR),相位谱傅立叶变换法(PFT)和四元数傅立叶变换(HFT)对大多数简单自然场景目标具有良好的检测效果。然而,由于没有考虑空域的信息,当图像场景结构复杂,存在较多高频细节成分时,传统的频域分析方法会受到复杂背景的极大干扰,产生许多杂乱的噪声点,这样一方面会造成显著区域的误检,另一方面也会影响基于二维熵的尺度选择的准确性。因此,如何实现复杂场景中的目标检测,是频域显著性检测面临的难题。
技术实现思路
本专利技术的目的在于针对频域显著性检测方法的不足,提供一种基于L1正则化的图像显著性检测方法,该方法同时考虑空域和频域的稀疏性,有效地消除了复杂及高频细节背景的影响,在人眼注视点检测和物体分割检测方面取得了更好的效果。本专利技术的目的是通过以下技术方案来实现的:(1)输入待检测图像;待检测图像为彩色图像,由红、蓝、绿三个颜色通道组成;(2)将步骤1输入的图像分解为三个颜色特征图(RG,BY,I),对每个颜色特征图进行傅里叶变换,并且计算傅里叶变换的对数幅度谱L(u,v)和相位谱P(u,v),其中u,v为频谱的坐标值;(3)在每一个颜色特征图上,使用8个不同方差大小的高斯滤波器hk(u,v),k=1~8,对对数幅度谱L(u,v)进行卷积滤波,得到滤波后的8个不同尺度的傅里叶对数幅度谱,结合相位谱P(u,v),得到一组不同尺度的傅里叶变换Fk,其描述如下:Fk=exp(L(u,v)*hk(u,v)+i·P(u,v)),k=1~8(1)其中L(u,v)表示颜色特征图对数幅度谱,hk(u,v)表示不同方差大小的高斯滤波器,i表示虚数单位,P(u,v)表示颜色特征图相位谱,*表示卷积运算符,下标k表示尺度序号;(4)在每一个颜色特征图上,构建基于TVnorm正则化的L1优化问题并采用SplitBregman方法求解,得到该颜色特征图上的8张不同尺度的显著性图像在3个颜色特征图上共得到24个显著性图像其描述如下:其中||||1表示L1范数,||||2表示L2范数,表示二维梯度算子,S表示显著性图像,F(·)表示傅里叶变换,c为颜色特征图的序号,μ为保真项权重;(5)在同一尺度上,根据步骤4得到的显著性图像的二维熵计算权重,加权求和得到一张显著性图像,在8个尺度上共得到8张显著性图像其描述如下:其中H2D(·)表示计算图像二维熵的函数;K为使得权重之和为1的常数;(6)计算步骤5得到的8张不同尺度显著性图像的二维熵,选取二维熵最小的显著性图像,平方后进行高斯滤波得到最终的显著性图像S,其描述如下:其中g表示高斯滤波器。所述式(1)中对数幅度谱L(u,v)的求解方法具体为:对待检测图像的三个颜色特征图的傅里叶变换采用快速傅里叶变换(FFT),并将其零频成分移动到频谱图像中心位置得到傅里叶幅度谱A(u,v)相位谱P(u,v),求取对数得到对数幅度谱L(u,v),其描述如下:L(u,v)=log(A(u,v)+1)。所述式(1)中8个不同方差大小的高斯滤波器hk(u,v)具体如下:式中hk(u,v)为频域二维高斯低通滤波器,D表示距离傅里叶变换原点的欧式距离,σk=2k-2,k=1~8为高斯滤波器的方差。所述式(2)中的L1正则化优化问题,采用SplitBregman方法求解,具体为:其中设fk,c=exp(Lc*hk+i·Pc),使用SplitBregman方法,则(2)式可转化为:其中,λ为惩罚项权重,bx和by为求解过程中的变量。本专利技术具有的有益效果是:本专利技术结合了显著性图像的空域和频域的特性,有效地消除了图像复杂背景和高频细节对显著性检测的影响,达到了良好的检测准确率。同时,本算法可以使用SplitBregman方法进行高效的求解。本专利技术在物体检测和识别,人眼视点预测等领域有着广泛应用。附图说明图1为实施例1采用现有频域图像显著性检测方法与本专利技术方法进行图像显著性检测后的图像对比图;(a)为待检测图像,(b)为人眼标示的显著性图像,(c)GBVS算法得到的显著性图像,(d)SR算法得到的显著性图像,(e)HFT算法得到的显著性图像,(f)本专利技术方法得到的显著性图像;图2为实施例2采用现有频域图像显著性检测方法与本专利技术方法进行图像显著性检测后的图像对比图;(a)为待检测图像,(b)为人眼标示的显著性图像,(c)GBVS算法得到的显著性图像,(d)SR算法得到的显著性图像,(e)HFT算法得到的显著性图像,(f)本专利技术方法得到的显著性图像;图3为实施例3采用现有频域图像显著性检测方法与本专利技术方法进行图像显著性检测后的图像对比图;(a)为待检测图像,(b)为人眼标示的显著性图像,(c)GBVS算法得到的显著性图像,(d)SR算法得到的显著性图像,(e)HFT算法得到的显著性图像,(f)本专利技术方法得到的显著性图像;图4为实施例4采用现有频域图像显著性检测方法与本专利技术方法进行图像显著性检测后的图像对比图;(a)为待检测图像,(b)为人眼标示的显著性图像,(c)GBVS算法得到的显著性图像,(d)SR算法得到的显著性图像,(e)HFT算法得到的显著性图像,(f)本专利技术方法得到的显著性图像;图5为不同显著性检测方法在ASD数据集上PR(准确率,召回率)曲线结果图。具体实施方式下面结合附图与实施例对本专利技术进行进一步说明。本专利技术一种基于L1正则化的图像显著性检测方法,包括如下步骤:(1)输入待检测图像。待检测图像为彩色图像,由红、蓝、绿三个颜色通道组成。为了降低计算量,我们对待检测图像进行尺寸的调整,调整后的图像的宽度和高度均设定为128像素。(2)从步骤1调整后的图像提取三个颜色特征图(RG,BY,I)。首先分离颜色通道,得到红(r)、绿(g)、蓝(b)三个颜色通道,对这三个颜色通道进行计算获得R,G,B,Y颜色特征基,具体描述如下:使用颜色特征基计算得到两个颜色特征图:RG=R-G(2)BY=B-Y计算调整后图像对应的灰度图作为第三个颜色特征图:对RG,BY和I三个颜色特征图分别进行傅里叶变换,将零本文档来自技高网...
【技术保护点】
一种基于L1正则化的图像显著性检测方法,其特征在于,包括如下步骤:(1)输入待检测图像;待检测图像为彩色图像,由红、蓝、绿三个颜色通道组成;(2)将步骤1输入的图像分解为三个颜色特征图(RG,BY,I),对每个颜色特征图进行傅里叶变换,并且计算傅里叶变换的对数幅度谱L(u,v)和相位谱P(u,v),其中u,v为频谱的坐标值;(3)在每一个颜色特征图上,使用8个不同方差大小的高斯滤波器hk(u,v),k=1~8,对对数幅度谱L(u,v)进行卷积滤波,得到滤波后的8个不同尺度的傅里叶对数幅度谱,结合相位谱P(u,v),得到一组不同尺度的傅里叶变换Fk,其描述如下:Fk=exp(L(u,v)*hk(u,v)+i·P(u,v)),k=1~8 (1)其中L(u,v)表示颜色特征图对数幅度谱,hk(u,v)表示不同方差大小的高斯滤波器,i表示虚数单位,P(u,v)表示颜色特征图相位谱,*表示卷积运算符,下标k表示尺度序号;(4)在每一个颜色特征图上,构建基于TV norm正则化的L1优化问题并采用Split Bregman方法求解,得到该颜色特征图上的8张不同尺度的显著性图像在3个颜色特征图上共得到24个显著性图像其描述如下:S^k,c=argmins||▿S||1+μ2||F(S)-exp(Lc*hk+i·Pc)||22,k=1~8,c=1~3---(2)]]>其中||||1表示L1范数,||||2表示L2范数,表示二维梯度算子,S表示显著性图像,F(·)表示傅里叶变换,c为颜色特征图的序号,μ为保真项权重;(5)在同一尺度上,根据步骤4得到的显著性图像的二维熵计算权重,加权求和得到一张显著性图像,在8个尺度上共得到8张显著性图像其描述如下:S^k=Σc=131K1H2D(S^k,c)S^k,c---(3)]]>其中H2D(·)表示计算图像二维熵的函数;K为使得权重之和为1的常数;(6)计算步骤5得到的8张不同尺度显著性图像的二维熵,选取二维熵最小的显著性图像,平方后进行高斯滤波得到最终的显著性图像S,其描述如下:kopt=argmink(H2D(S^k))---(4)]]>S=g*|S^kopt|2---(5)]]>其中g表示高斯滤波器。...
【技术特征摘要】
1.一种基于L1正则化的图像显著性检测方法,其特征在于,包括如下步骤:(1)输入待检测图像;待检测图像为彩色图像,由红、蓝、绿三个颜色通道组成;(2)将步骤(1)输入的图像分解为三个颜色特征图RG,BY,I,对每个颜色特征图进行傅里叶变换,并且计算傅里叶变换的对数幅度谱L(u,v)和相位谱P(u,v),其中u,v为频谱的坐标值;(3)在每一个颜色特征图上,使用8个不同方差大小的高斯滤波器hk(u,v),k=1~8,对对数幅度谱L(u,v)进行卷积滤波,得到滤波后的8个不同尺度的傅里叶对数幅度谱,结合相位谱P(u,v),得到一组不同尺度的傅里叶变换Fk,其描述如下:Fk=exp(L(u,v)*hk(u,v)+i·P(u,v)),k=1~8(1)其中L(u,v)表示颜色特征图对数幅度谱,hk(u,v)表示不同方差大小的高斯滤波器,i表示虚数单位,P(u,v)表示颜色特征图相位谱,*表示卷积运算符,下标k表示尺度序号;(4)在每一个颜色特征图上,构建基于TVnorm正则化的L1优化问题并采用SplitBregman方法求解,得到该颜色特征图上的8张不同尺度的显著性图像在3个颜色特征图上共得到24个显著性图像其描述如下:其中||||1表示L1范数,||||2表示L2范数,表示二维梯度算子,S表示显著性图像,F(·)表示傅里叶变换,c为颜色特征图的序号,μ为保真项权重,Pc为第c个颜色特征图的相位谱,Lc为第c个颜色特征图的对数幅度谱;(5)在同一尺度上,根据步骤(4)得到的显著性图像的二维熵计算权重,加权求和得到一张显著性图像,在8个尺度上共得到8张显著性图像其描述如下:其中H2D(·)表示计算图像二维熵的函数;K为使...
【专利技术属性】
技术研发人员:任健强,龚小谨,
申请(专利权)人:浙江大学,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。