基于卷积神经网络的区域和像素级融合的显著性检测方法技术

技术编号：14058536 阅读：457 留言：0更新日期：2016-11-27 11:36

本发明专利技术公开了一种基于卷积神经网络的区域和像素级融合的显著性检测方法，该方法研究的对象是静态图像，其中图像的内容可以是任意的，研究的目标是从图像中找出吸引人眼注意力的目标，并为其赋予不同的显著性值。本发明专利技术主要提出了一种自适应的区域生成技术，并设计了两个CNN网络结构，分别用于像素级显著性预测和显著性融合。这两个CNN网络模型以图像作为输入，以图像的真实结果作为监督信号用于网络模型的训练，并最终输出与输入图像大小一致的显著性图。本发明专利技术能有效地进行区域级显著性估计和像素级显著性预测，得到两个显著性图，最后使用进行显著性融合的CNN将两个显著性图及原始图像进行融合得到最终的显著性图。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种基于深度学习的图像处理方法，具体涉及一种基于卷积神经网络的区域和像素级融合的显著性检测方法。
技术介绍
随着深度学习的发展和兴起，基于深度学习的显著性检测技术也不断发展。显著性检测可分为自底向上的数据驱动模型和自顶向下的任务驱动模型两大类。自底向上的显著性检测是指对于给定的任意一幅图像，找出图中引人注意的目标，该目标可为任何类别的事物。而自顶向下的显著性检测方法通常从给定图片中找出给定类别的目标，并赋予不同的显著性值。目前，对自底向上的显著性检测方法的研究最多。已有的自底向上的显著性检测方法可分为两类，分别为基于手工设计特征的方法和基于卷积神经网络的方法。由于基于手工设计特征的方法通常利用图像中的表面信息（比如颜色、纹理等）来进行特征提取，而提取的这些手工特征不能捕捉显著性目标的深层特性和多尺度信息，从而不能取得很好的性能。最近随着深度学习的兴起，有部分研究者开始使用卷积神经网络来进行显著性目标检测。目前已有的大部分基于卷积神经网络（CNN）的显著性目标检测方法首先将图像分割成多个区域，然后对每个区域用训练好的CNN模型来预测其显著性值。但这些方法不能得到精确的像素级的显著性预测结果。
技术实现思路
为了克服上述问题，本专利技术提出了一种新的基于CNN的显著性检测方法，即基于卷积神经网络的区域和像素级融合的显著性检测方法。该方法包含三个阶段，分别为区域级显著性估计、像素级显著性预测和显著性融合，每个阶段都涉及到一个CNN模型。该方法可得到精确的像素级的显著性图，从而能更有效地推动基于显著性的相关应用的发展。本专利技术的目的是通过以下技术方案...
基于卷积神经网络的区域和像素级融合的显著性检测方法

【技术保护点】
一种基于卷积神经网络的区域和像素级融合的显著性检测方法，其特征在于所述方法步骤如下：一、区域级显著性估计第一步、采用自适应的区域生成技术对输入图像I进行分割（1）使用SLIC算法对输入图像I进行超像素分割，得到n个超像素；（2）从每个超像素中提取一个简单的特征向量，用来表征该超像素的特性；（3）使用一个基于图的合并聚类算法对超像素进行聚类得到不同的区域；第二步、使用Clarifai网络模型进行区域显著性估计（1）从每个区域的中心线周围随机选取m个超像素；（2）设置m个超像素的中心作为窗口的中心构建m个窗口，且这些窗口包含整个图像；（3）将构造的m个窗口图像经过CNN模型，得到m个显著性值；（4）计算m个显著性值的均值并将其作为该区域的显著性值；二、像素级显著性预测（1）以模型VGGNet作为预训练模型，将VGGNet中的最后一个模块移除，对第四和第五模块的输出进行去卷积操作，并在特征通道方向将它们进行拼接，用于多尺度特征学习；然后采用大小为1* 1的卷积核对拼接后的特征图进行卷积得到一个概率图；（2）在像素级CNN模型训练阶段，使用叉熵损失函数计算概率图和真实结果图之间的误差，并将误差...

【技术特征摘要】
1.一种基于卷积神经网络的区域和像素级融合的显著性检测方法，其特征在于所述方法步骤如下：一、区域级显著性估计第一步、采用自适应的区域生成技术对输入图像I进行分割（1）使用SLIC算法对输入图像I进行超像素分割，得到n个超像素；（2）从每个超像素中提取一个简单的特征向量，用来表征该超像素的特性；（3）使用一个基于图的合并聚类算法对超像素进行聚类得到不同的区域；第二步、使用Clarifai网络模型进行区域显著性估计（1）从每个区域的中心线周围随机选取m个超像素；（2）设置m个超像素的中心作为窗口的中心构建m个窗口，且这些窗口包含整个图像；（3）将构造的m个窗口图像经过CNN模型，得到m个显著性值；（4）计算m个显著性值的均值并将其作为该区域的显著性值；二、像素级显著性预测（1）以模型VGGNet作为预训练模型，将VGGNet中的最后一个模块移除，对第四和第五模块的输出进行去卷积操作，并在特征通道方向将它们进行拼接，用于多尺度特征学习；然后采用...

【专利技术属性】
技术研发人员：邬向前，卜巍，唐有宝，
申请(专利权)人：哈尔滨工业大学，
类型：发明
国别省市：黑龙江;23

全部详细技术资料下载我是这个专利的主人