一种交互式自然图像抠图方法技术

技术编号：24172755 阅读：191 留言：0更新日期：2020-05-16 03:31

本发明专利技术属于计算机视觉技术领域，提供了一种交互式自然图像抠图方法，实现一种用户友好地简单交互式图像抠图框架，分为超像素划分、信息区域选取、用户划线、马尔科夫传播和CNN传播5个阶段。整体框架通过简单的用户交互实现准确、高效的图像蒙版生成，一些图像细节都可以准确地预测。马尔科夫链与深度学习的结合在有限邻域和全图上进行有效的标签传播与扩散，实现有限用户交互的最大化标注。本发明专利技术得到更为精准的抠图蒙版，同时又比依赖于三分图的抠图算法节省大量的运算时间，实现了图像抠图准确度与代价之间的有效平衡。

全部详细技术资料下载

【技术实现步骤摘要】
一种交互式自然图像抠图方法
本专利技术属于计算机视觉
，涉及马尔可夫链与深度学习的交互式自然图像抠图的方法。
技术介绍
近年来，随着互联网与移动设备的不断发展，图像越来越成为人类生活中不可或缺的一部分，相应一些图像相关的处理技术也伴随着大众的需求而在研究领域逐渐发展起来。图像分类、语义分割等技术一直是图像处理领域的热门话题，但伴随着电影制作、在线直播、人像美化等工业、生活应用水平的提高，传统的图像分割已经不能满足人们对于前景精细化的要求，而对应的图像抠图得到了更多的重视与关注。相比于图像分割，抠图技术不仅仅要求将图像中的物体分割出来，更要求一些头发丝、动物毛发，植物枝干等精细化的图像细节，都能在分割结果中精确的展示。这样精细化的分割更能满足人们对于高质量生活的追求，对于一些工业、研究等领域更具有吸引力和挑战性。图像抠图要求精确到像素的准确分割，对应的出发点是最基本的图像合成公式：Iz＝αFz+(1-α)Bz,α∈[0,1](1)其中z表示图像中的一个像素点，而I表示我们实际观测到的z点，F和B分别表示z点出的前景值和背景值，α表示前景和背景所占的比例，也可以看作是前景到背景的透明度。图像合成公式定义了最基本的图像成像的像素级解释：图像中的每一个像素点都是由前景和背景组成的，α＝1表示z点为前景，即完全不透明，α＝0表示z点为背景，即完全透明。α∈(0,1)的区域表示该像素点处于前景和背景的临界区域(如人的头发，植物密密麻麻的枝干，半透明区域等)，这些区域是由前景和背景混合在一起形成的，这...

【技术保护点】
1.一种交互式自然图像抠图方法，其特征在于，综合考虑蒙版计算的准确度和时间要求，实现用户劳动和蒙版精度之间的平衡，所采用的模型包含五个阶段，具体技术方案如下：/n(1)超像素划分阶段/n超像素划分阶段主要对于输入图像进行超像素的划分；超像素是表示颜色和文理特征的像素块；/n(2)信息区域的选取阶段/n将输入图像平均划分成16个区域，根据区域内部的超像素信息来计算每一个区域的信息量，信息量的计算综合考虑每个区域内部的颜色、文理、标签熵和对象边界信息：/nInfo＝I+J+E+S (2)/n式中：I、J、E和S分别表示该区域与其他区域之间的相似度、内部超像素的多样性、已有的标签熵以及内部包含的对象边界信息；等式(2)中的变量都是以超像素为单位进行计算的，其中I和J参考的是超像素的颜色和文理信息，具体定义如下：/n

【技术特征摘要】
1.一种交互式自然图像抠图方法，其特征在于，综合考虑蒙版计算的准确度和时间要求，实现用户劳动和蒙版精度之间的平衡，所采用的模型包含五个阶段，具体技术方案如下：
(1)超像素划分阶段
超像素划分阶段主要对于输入图像进行超像素的划分；超像素是表示颜色和文理特征的像素块；
(2)信息区域的选取阶段
将输入图像平均划分成16个区域，根据区域内部的超像素信息来计算每一个区域的信息量，信息量的计算综合考虑每个区域内部的颜色、文理、标签熵和对象边界信息：
Info＝I+J+E+S(2)
式中：I、J、E和S分别表示该区域与其他区域之间的相似度、内部超像素的多样性、已有的标签熵以及内部包含的对象边界信息；等式(2)中的变量都是以超像素为单位进行计算的，其中I和J参考的是超像素的颜色和文理信息，具体定义如下：

其中，cmi、chi和thi分别是对应超像素i的颜色均值、颜色直方图和文理直方图，θ是为了防止被除数为0的偏置，λ1，λ2和λ3为平衡系数，在实际运行中分别取0.4，0.35和0.25；

J的计算整体取负数；I考虑的是该区域与其他区域之间的相似度，与其他区域相似度高的区域更能表达图像整体的特征；J考虑的是该区域内部超像素之间的差异性，内部差异较大的区域更有可能位于前景和背景之间的过渡区域，对于用户划线标注的过程更有意义；
标签熵的定义如下：

其中，pbi、pui和pfi分别表示超像素i属于背景、过渡区域或前景的概率，已经标记过或经过传播后可明确类别的超像素显然没有再进行标记的必要，对应的E计算肯定比较低，那些没有被用户标记而且传播过程也无法处理的区域，对应的都是初始较大的类别概率，通过标签熵的约束有更大的可能被选出来进行下...

【专利技术属性】
技术研发人员：乔羽，杨鑫，魏小鹏，张强，尹宝才，
申请(专利权)人：大连理工大学，
类型：发明
国别省市：辽宁;21

全部详细技术资料下载我是这个专利的主人