一种基于稀疏表示和标签传播的显著性检测方法技术

技术编号:14189930 阅读:138 留言:0更新日期:2016-12-15 01:55
一种基于稀疏表示和标签传播的显著性检测方法,利用稀疏表示定义了一种新的邻接矩阵,不仅将具有共同边界的区域称为相邻区域,更是把处在同一子空间中的数据点定义为邻居,其次通过图像中每个区域间的相似度计算权值矩阵,然后选取部分边缘区域作为背景标签,最后通过上述方法获得的权值矩阵和背景标签,应用标签传播算法预测未标记区域的标签信息,进而获得最终的显著性图。本发明专利技术有益效果:本发明专利技术同时考虑了图像的全局信息和局部区域联系,构建了新的邻接矩阵,融合了稀疏表示理论和标签传播算法的优势,具有较高的准确率和回归率,且误差较低。

A saliency detection method based on sparse representation and label propagation

A sparse representation method and saliency detection based on label propagation, using sparse representation defines a new adjacency matrix, not only have the common boundary area is called the adjacent regions, even in the same subspace of data points is defined as neighbors, followed by image similarity between each region calculate the weight matrix, and then select the part of the edge region as the background label, finally obtained by the methods of weight matrix and background label, application of label propagation algorithm predict unlabeled regions of label information, and finally obtains the significant figure. The invention has the advantages that the invention also considers the global information and local area image, construct the adjacency matrix of the new fusion, sparse representation theory and label propagation algorithm, and has high accuracy and low error rate of return, and.

【技术实现步骤摘要】

本专利技术涉及图像显著性检测领域,具体地说是一种基于稀疏表示和标签传播的显著性检测方法
技术介绍
近年来, 显著性检测已经成为计算机视觉领域的热门话题之一,吸引了大量学者的兴趣。该领域已经出现了很多优秀的算法,但想要开发出一种简洁实用的显著性模型仍存在较大的难度。目前,显著性检测已经被广泛应用于视觉跟踪,图像分类和图像分割等相关领域。根据检测模型和功能的不同,显著性检测算法可以分为视觉注意力检测和显著性目标检测。其中视觉注意力检测是估计人眼观察一副图像时注视点的变化轨迹,在神经系统学中被广泛研究,而显著性目标检测则是提取整个显著目标区域,同时抑制背景噪声。根据数据处理方式不同,显著性检测还可以被分为自底向上模型,和自顶向下模型。自顶向下模型[17, 19, 20, 28]是针对训练样本中有代表性的特征,因此能检测某些固定大小以及类别的目标。相反,自底向上模型[1, 2, 3, 5, 7, 9, 13, 14, 15, 16, 18, 21, 22, 23, 24, 25, 26, 29, 30]由数据驱动,无需先验知识,受到底层视觉信息的直接刺激而产生。显然,自底向上模型的计算复杂度通常要低于自顶向下模型。本专利技术提出了一种基于稀疏表示和标签传播的显著性检测方法。首先,为了获得图像中各个区域间的潜在联系,本专利技术应用稀疏表示理论构建稀疏矩阵;同时,将具有紧密联系且处在同一子空间的数据集定义为邻居,这样就增加了图像全局的连续性,在不降低复杂目标准确性的前提下,更好的识别大范围或多目标显著物;其次,本文通过平均颜色特征(CIELab)计算相邻区域的相似度作为边的权值,构建权值矩阵;然后标记部分边界区域作为背景标签,最后通过标签传播算法预测其它未标记区域的标签信息,得到最终的显著图。
技术实现思路
本专利技术所要解决的技术问题是提供一种基于稀疏表示和标签传播的显著性检测方法,同时考虑了图像的全局信息和局部区域联系,融合稀疏表示理论和标签传播算法的优势,具有较高的准确率和回归率,误差较低,优于现有的方法。本专利技术为解决上述技术问题所采用的技术方案是:一种基于稀疏表示和标签传播的显著性检测方法,包括以下步骤:步骤一:构建邻接矩阵采用SLIC算法,将图像分割成N 个超像素点,将这N 个超像素视作N 个数据,然后对这个由N 个数据组成的数据集进行稀疏表示,数据集中每个点的稀疏表示由式(1)得到: (1)其中是N 个超像素点组成的数据集,式(1)的最优解;令矩阵为数据集除去第i 列得到的新矩阵,,D 为数据维度,考虑噪声影响及信号对过完备数据矩阵的敏感性,得到点相对于矩阵的稀疏表示,如式(2)所示: (2)其中,,是一个常量,为第i 个超像素的特征向量;F 为约束矩阵,C是由系数向量组成的矩阵,L 是约束矩阵F 的拉普拉斯矩阵,,H 是一个对角矩阵,其每个元素是F 矩阵中一行之和,即,参数是权重系数,在向量的第i 行插入一个零值,得到N 维的向量;对每个超像素中的像素点,用一个9维的向量S 表示,如式(3)所示: (3)其中,分别表示CIELAB色彩空间的值,分别表示图像的灰度值在水平和竖直方向对应的一阶和二阶导数,代表图像的纹理信息,x,y表示图片的空间位置,,是一个常数,用于调整颜色、纹理特征与空间位置特征的比例;对每个超像素,根据式(4)-(5)计算一个9*9的协方差矩阵M ; (4) (5)其中,表示超像素第i 个特征的平均值,表示超像素内第k 个像素的第i 个特征值,K 表示超像素内像素的个数;任意两个给定超像素的不相似性如公式(6)所示: (6)其中,为两个超像素协方差的广义特征值,由计算而得;由此,可计算两个超像素之间的关联,得到其约束矩阵;约束矩阵任意两个超像素之间值的计算如式(7)所示,其中,是一个常数: (7)得到约束矩阵后,计算其对应的拉普拉斯矩阵L ,把L 和U 代入式(4),优化计算每个稀疏编码,得到由各个稀疏系数组成的稀疏矩阵,通过式(8)将不对称的稀疏矩阵改写成对称矩阵: (8)在对称矩阵的基础上,添加相邻区域的联系,即:假如超像素i 和超像素j 有共同的边界,则令,添加相邻区域联系后所得到的稀疏C 矩阵就是所求的邻接矩阵;步骤二:计算权值矩阵通过式(9)计算邻接矩阵中非零节点的权值大小,其中和分别表示两个超像素的平均特征向量,是控制权值大小的常量,由此得到相似度矩阵; (9)计算度矩阵,其中,即相似度矩阵中每列的和;将相似度矩阵归一化后得到权值矩阵:;步骤三:选取边界标签对图像的边界区域进行筛选,根据步骤二中得到的相似度矩阵,筛选出30%颜色差异较大的边界点,将剩下的区域设置为背景区域,标记为1;步骤四:利用标签传播算法进行显著性预测给定一个数据集,其中前个数据已经被标记,D 是数据的特征维度;定义一个函数,其中表示每一个数据点与标签的相似度,函数的计算公式如式(10)所示: (10)其中是权值矩阵中元素值,t 是递归计算的次数;每次计算完相似度后,重新将初始选中的标签赋值为1并保持不变;其它未标记区域初始值设置为0;经过迭代计算,得到最终结果V ,代表每个待测超像素与标签间相似度,值越大相似度越高,反之相似度低;最后定义显著值sal=(1-V),得到每个超像素区域的显著值,再还原到每个像素点,即可获得最终的显著图。本专利技术所述步骤一中r 的取值范围为(0,1)。本专利技术所述步骤一中权重系数的取值为0.2。本专利技术所述步骤一中的取值为0.5。本专利技术所述步骤一中常数取值为0.5。本专利技术所述步骤二中的取值为0.1。本专利技术的有益效果是:首先,为了获得图像中各个区域间的潜在联系,本专利技术应用稀疏表示理论构建稀疏矩阵,同时,将具有紧密联系且处在同一子空间的数据集定义为邻居,这样就增加了图像全局的连续性,在不降低复杂目标准确性的前提下,更好的识别大范围或多目标显著物;其次,本专利技术通过平均颜色特征(CIELab)计算相邻区域的相似度作为边的权值,构建权值矩阵;然后标记部分边界区域作为背景标签,最后通过标签传播算法预测其它未标记区域的标签信息, 得到最终的显著图。由于稀疏表示理论可以探索出图像中处于同一子空间的各个区域,并用稀疏矩阵表达,这样可以很好的获得基于全局的图像信息。所以本专利技术在稀疏理论的基础上,定义了新的邻接矩阵,再用标签传播算法进行显著性检测;标签传播算法更考究相连区域的联系,依靠邻接区域特性进行计算,会忽视全局信息,稀疏表示很好的弥补了这个缺点,使得到效果更好的显著性图。本专利技术对多目标显著物体仍有较好的效果,另外,对于出现在边缘,或是复杂背景下的显著物,也有较高的准确率。附图说明图1为本专利技术方法生成效果图与其它算法生成效果图的对比示例图;图2为经典算法和近年先进算法共9种模型生成的显著图与本文方法的定性对比示例图;图3为图库SED1中本专利技术方法与近年先进算法的PR曲线对比图;图4为图库DUT-OMRON本专利技术方法与近年先进算法的PR曲线对比图;图5为图库ASD PR本专利技术方法与近年先进算法的PR曲线对比图;图6为图库PASCAL PR本专利技术方法与近年先进算法的PR曲线对比图;图7本文档来自技高网
...
一种基于稀疏表示和标签传播的显著性检测方法

【技术保护点】
一种基于稀疏表示和标签传播的显著性检测方法,其特征在于:包括以下步骤:步骤一:构建邻接矩阵采用SLIC算法,将图像分割成N 个超像素点,将这N 个超像素视作N 个数据,然后对这个由N 个数据组成的数据集进行稀疏表示,数据集中每个点的稀疏表示由式(1)得到:(1)其中是N 个超像素点组成的数据集,式(1)的最优解;令矩阵为数据集除去第i 列得到的新矩阵,,D 为数据维度,考虑噪声影响及信号对过完备数据矩阵的敏感性,得到点相对于矩阵的稀疏表示,如式(2)所示:(2)其中,,是一个常量,为第i 个超像素的特征向量;F 为约束矩阵,C 是由系数向量组成的矩阵,L 是约束矩阵F 的拉普拉斯矩阵,,H 是一个对角矩阵,其每个元素是F 矩阵中一行之和,即,参数是权重系数,在向量的第i 行插入一个零值,得到N 维的向量;对每个超像素中的像素点,用一个9维的向量S 表示,如式(3)所示:(3)其中,分别表示CIELAB色彩空间的值,分别表示图像的灰度值在水平和竖直方向对应的一阶和二阶导数,代表图像的纹理信息,x,y表示图片的空间位置,,是一个常数,用于调整颜色、纹理特征与空间位置特征的比例;对每个超像素,根据式(4)‑(5)计算一个9*9的协方差矩阵M ;(4)(5)其中,表示超像素第i 个特征的平均值,表示超像素内第k 个像素的第i 个特征值,K 表示超像素内像素的个数;任意两个给定超像素的不相似性如公式(6)所示:(6)其中,为两个超像素协方差的广义特征值,由计算而得;由此,可计算两个超像素之间的关联,得到其约束矩阵;约束矩阵任意两个超像素之间值的计算如式(7)所示,其中,是一个常数:(7)得到约束矩阵后,计算其对应的拉普拉斯矩阵L ,把L 和U 代入式(4),优化计算每个稀疏编码,得到由各个稀疏系数组成的稀疏矩阵,通过式(8)将不对称的稀疏矩阵改写成对称矩阵:(8)在对称矩阵的基础上,添加相邻区域的联系,即:假如超像素i 和超像素j 有共同的边界,则令,添加相邻区域联系后所得到的稀疏C 矩阵就是所求的邻接矩阵;步骤二:计算权值矩阵通过式(9)计算邻接矩阵中非零节点的权值大小,其中和分别表示两个超像素的平均特征向量,是控制权值大小的常量,由此得到相似度矩阵;(9)计算度矩阵,其中,即相似度矩阵中每列的和;将相似度矩阵归一化后得到权值矩阵:;步骤三:选取边界标签对图像的边界区域进行筛选,根据步骤二中得到的相似度矩阵,筛选出30%颜色差异较大的边界点,将剩下的区域设置为背景区域,标记为1;步骤四:利用标签传播算法进行显著性预测给定一个数据集,其中前个数据已经被标记,D 是数据的特征维度;定义一个函数,其中表示每一个数据点与标签的相似度,函数的计算公式如式(10)所示:(10)其中是权值矩阵中元素值,t 是递归计算的次数;每次计算完相似度后,重新将初始选中的标签赋值为1并保持不变;其它未标记区域初始值设置为0;经过迭代计算,得到最终结果V ,代表每个待测超像素与标签间相似度,值越大相似度越高,反之相似度低;最后定义显著值sal=(1‑V),得到每个超像素区域的显著值,再还原到每个像素点,即可获得最终的显著图。...

【技术特征摘要】
1.一种基于稀疏表示和标签传播的显著性检测方法,其特征在于:包括以下步骤:步骤一:构建邻接矩阵采用SLIC算法,将图像分割成N 个超像素点,将这N 个超像素视作N 个数据,然后对这个由N 个数据组成的数据集进行稀疏表示,数据集中每个点的稀疏表示由式(1)得到: (1)其中是N 个超像素点组成的数据集,式(1)的最优解;令矩阵为数据集除去第i 列得到的新矩阵,,D 为数据维度,考虑噪声影响及信号对过完备数据矩阵的敏感性,得到点相对于矩阵的稀疏表示,如式(2)所示: (2)其中,,是一个常量,为第i 个超像素的特征向量;F 为约束矩阵,C是由系数向量组成的矩阵,L 是约束矩阵F 的拉普拉斯矩阵,,H 是一个对角矩阵,其每个元素是F 矩阵中一行之和,即,参数是权重系数,在向量的第i 行插入一个零值,得到N 维的向量;对每个超像素中的像素点,用一个9维的向量S 表示,如式(3)所示: (3)其中,分别表示CIELAB色彩空间的值,分别表示图像的灰度值在水平和竖直方向对应的一阶和二阶导数,代表图像的纹理信息,x,y表示图片的空间位置,,是一个常数,用于调整颜色、纹理特征与空间位置特征的比例;对每个超像素,根据式(4)-(5)计算一个9*9的协方差矩阵M ; (4) (5)其中,表示超像素第i 个特征的平均值,表示超像素内第k 个像素的第i 个特征值,K 表示超像素内像素的个数;任意两个给定超像素的不相似性如公式(6)所示: (6)其中,为两个超像素协方差的广义特征值,由计算而得;由此,可计算两个超像素之间的关联,得到其约束矩阵;约束矩阵任意两个超像素之间值的计算如式(7)所示,其中,是一个常数: (7)得到约束矩阵后,计算其对应的拉普拉斯矩阵L ,把L 和U 代入式(4),优化计算每个稀疏编码,得到由各个稀疏系数组成的稀疏矩阵,通过式(8)将不对称的稀疏矩阵改写成对称矩阵: ...

【专利技术属性】
技术研发人员:张晓煜林晓刘喜玲王春香史军勇李玲玲刘丽
申请(专利权)人:郑州航空工业管理学院
类型:发明
国别省市:河南;41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1