一种基于显著性检测的图像三元图生成方法技术

技术编号：28054423 阅读：37 留言：0更新日期：2021-04-14 13:21

一种基于显著性检测的图像三元图生成方法涉及计算机视觉领域。三元图即trimap图。该方法能够自动捕捉输入图像的显著物体，并通过级联网络来逐渐生成并优化最终的trimap图像。该方法步骤：1)数据合成；2)数据增强处理；3)将数据送入级联网络进行预测，第一个级联网络得到粗略的显著性掩码图，第二个级联网络得到优化的显著性掩码图，第三个级联网络得到精细化的trimap图。本发明专利技术解决问题是全自动生成图像trimap分割图，提出了采用显著性检测的方法并设计级联网络来实现trimap图分割的处理，为全自动化抠图技术提供良好先验信息。本发明专利技术产生的trimap精确度高、鲁棒性强、泛化性强，适用于多种前景物体。多种前景物体。多种前景物体。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于显著性检测的图像三元图生成方法

[0001]本专利技术涉及计算机视觉领域，针对Image Matting子任务中先验trimap条件的获取问题，此处特指一种基于显著性检测的图像三元图生成方法。

技术介绍

[0002]数字图像合成与抠图的概念最早在1984年由Porter Thomas与DuffTom提出。该研究团队首次提出了数字图像合成模型。该研究组通过引入四通道数字图像的概念(即红、绿、蓝及alpha通道)，将观测图像建模为前景与背景的凸线性组合(convex combination)。在所提出的模型中，对于彩色图像中任意像素其观测到的像素颜色I是由前景颜色fg与背景颜色bg的凸线性组合所得。
[0003]I＝fg
×
α+bg
×
(1
‑
α)
[0004]自然图像抠图(Image Matting)是指从自然图像中精确地提取出前景，分离前景与背景。自然图像抠图也可以依靠上面公式来解释，首先给定一张自然图像，自然图像抠图的目标是获取公式中的alpha通道信息，该alpha 通道控制前景与背景的融合比例。然而，根据以上公式可以看出，自然图像抠图是一个高欠定的任务，因为它存在已知三个已知项，七个未知项。因此，想要求解出alpha通道信息就需要额外的先验信息。应运而生的就是trimap图像，所谓trimap图像是一张单通道的灰度图，包含三类信息，绝对的前景信息、绝对的背景信息、以及绝对背景与绝对前景的过渡信息。引入trimap之后，自然图像抠图的目...

【技术保护点】

【技术特征摘要】
1.一种基于显著性检测的图像三元图生成方法，其特征在于，包括如下步骤：1)获取原始图像数据与其alpha掩码数据；2)依靠alpha掩码数据生成显著性掩码标签数据以及trimap标签数据；3)搭建深度级联网络，实现全自动trimap分割目标；4)将原始图像数据输入显著性检测分支中进行训练；其中，显著性检测分支包括粗略显著性检测子分支以及优化显著性检测子分支；首先，通过粗略显著性检测子分支初步得到粗略的显著性掩码数据；然后，将网络得到的低层的特征信息与粗略的显著性掩码数据进行自适应融合，优化边缘信息，从而获取优化的显著性掩码数据；5)将显著性掩码图像数据输入trimap预测分支中进行训练；将步骤4)得到的优化的显著性掩码数据以及低层的特征信息也进行自适应融合，优化边缘信息，突出高权重物体信息，抑制无关物体信息；并将输出送入trimap预测分支中，实现从显著性掩码到trimap分割图的过渡，最终得到trimap分割掩码图；2.根据权利要求1所述方法，其特征在于，包括如下步骤：第一步，获取开源Image Matting数据集以及背景数据集第二步，依靠alpha掩码数据生成显著性掩码标签数据以及Trimap标签数据；第三步，搭建深度级联网络，实现全自动Trimap分割目标所述深度级联网络构建包括三个部分：第一个部分是公用特征提取网络；第二个部分是显著性检测分支网络；第三个部分是trimap预测分支网络；第一个部分公用特征提取网络为其余两个部分提供公用浅层特征信息，从而实现最大程度的特征复用；其余两个部分各司其职，分别获得显著性检测掩码图以及trimap分割图；三个部分循序渐进，前一个部分的输出作为下一个部分的输入，协作完成trimap分割任务；公用特征提取网络选取VGG16作为特征提取网络，对于一张输入尺寸H
×
W的输入图片I，通过VGG16网络之后，提取到五个层级的特征信息，将其表示为{f
i
，i＝1，
…
，5}，在普遍的显著性检测网络中，会将前五个层级输出的特征信息全部聚合输入到之后的解码器网络中去，该部分表示为：D
T
＝g(f1，f2，f3，f4，f5)其中g(
·
)表示多层级信息聚合操作；只将后三层特征进行聚合，保留了三个卷积操作，另外两个卷积操作独立存在于之后的每个分支中；第四步，将原始图像数据输入显著性检测分支中进行训练该阶段是显著性检测阶段，输入是原始RGB自然图像，输出是一张只包含...

【专利技术属性】
技术研发人员：刘博，井海鹏，张雷，
申请(专利权)人：北京工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人