一种人像抠图方法及计算机可读存储介质技术

技术编号：26035497 阅读：32 留言：0更新日期：2020-10-23 21:13

本发明专利技术提供一种人像抠图方法及计算机可读存储介质，方法包括：获取人像数据，所述人像数据包括人像图片或人像视频；基于训练好的深度学习网络计算得到所述人像数据中人像的透明度为第一透明度；利用所述第一透明度与所述人像数据得到第一人像前景；调整所述人像的透明度为第二透明度；利用所述第二透明度得到第二人像前景，完成人像抠图。通过深度学习网络自动实现人像抠取；在得到自动人像抠取的结果后，提供了交互式抠图功能，容许用户在自动人像抠图的结果上通过交互操作进一步修缮抠图效果，以实现更高质量的抠图结果。运行速度快，占用内存少，可以部署在多种智能设备上进行实时性的人像抠图处理。

全部详细技术资料下载

【技术实现步骤摘要】
一种人像抠图方法及计算机可读存储介质
本专利技术涉及人像抠图
，尤其涉及一种人像抠图方法及计算机可读存储介质。
技术介绍
抠图是一项基础的图像编辑技术，有着广泛的应用和重要的经济价值。抠图是视觉特效、艺术设计和影视后期等工作中的基础操作。在我们的日常生活中，可以接触到很多用于抠图或集成了抠图功能的商业化产品。目前的抠图技术主要有两类：第一类是以设计软件“Photoshop”为代表的交互式抠图方法。该类方法需要用户通过交互操作引导抠图算法完成抠图。该类方法的抠图效果好，但交互操作十分繁琐，需要耗费使用者大量的时间，对使用者也有着一定的学习成本和技巧要求。抠图是个不适定问题。为了求解该问题可以引入额外的交互信息。从交互信息中算法可以得知部分前景和部分背景。采样建模法基于数理统计的方法，对已知前景和已知背景分别采样，建立前景分布模型和背景分布模型。未知区域的分布模型是前景模型和背景模型的混合模型。具体包括Ruzon和Tomasi抠图算法与贝叶斯抠图算法等参数法，以及频数直方图个性化表示数据分布模型的非参数法。基于亲和性度量的方法将前景的透明度理解为未知区域像素相对图像背景与图像前景的亲和性，如泊松抠图法、随机行走法、测地距离法和闭式法。然而，当交互信息的形式较为粗糙时，样本信息不足会引起较大的误差；当图像纹理较为复杂时，模型的估计误差较大。第二类是以智能证件照类应用为代表的全自动人像抠图方法。该类方法无需用户交互引导，可以自动实现人像抠取。该类方法操作简单快捷，但抠图的效果差。全自动人像抠图方...

【技术保护点】
1.一种人像抠图方法，其特征在于，包括如下步骤：/nS1：获取人像数据，所述人像数据包括人像图片或人像视频；/nS2：基于训练好的深度学习网络计算得到所述人像数据中人像的透明度为第一透明度；/nS3：利用所述第一透明度与所述人像数据得到第一人像前景；/nS4：调整所述人像的透明度为第二透明度；/nS5：利用所述第二透明度得到第二人像前景，完成人像抠图。/n

【技术特征摘要】
1.一种人像抠图方法，其特征在于，包括如下步骤：
S1：获取人像数据，所述人像数据包括人像图片或人像视频；
S2：基于训练好的深度学习网络计算得到所述人像数据中人像的透明度为第一透明度；
S3：利用所述第一透明度与所述人像数据得到第一人像前景；
S4：调整所述人像的透明度为第二透明度；
S5：利用所述第二透明度得到第二人像前景，完成人像抠图。

2.如权利要求1所述的人像抠图方法，其特征在于，所述深度学习的网络结构包括编码器单元和解码器单元；
每个所述编码器单元包括两条支路：编码分支和空间注意力分支；
所述编码分支用于编码并将结果输入到下一个所述编码器单元；
所述空间注意力分支用于生成空间注意力分布图，以点对点对应相加的方式融合进对应的解码器单元；
每个所述解码器单元只有一条支路，先对输入特征作上采样，然后按照对应元素相加的操作融合来自对应的所述编码器单元输出的空间注意力分布图，然后进行解码，最后输出到下一解码器单元；
所述解码器单元的输出数据通过Sigmoid函数归一化到0～1，即得到所述人像的所述第一透明度。

3.如权利要求2所述的人像抠图方法，其特征在于，所述编码器单元的编码分支依序包括：二维卷积层、批归一化层、修正的线性激活层、二维卷积层、批归一化层、修正的线性激活层、最大池化层；
所述空间注意力分支依序包括：二维卷积层、批归一化层、修正的线性激活层；
所述解码器单元包括：2倍上采样层、二维卷积层、批归一化层、修正的线性激活层、二维卷积层、批归一化层、修正的线性激活层。

4.如权利要求3所述的人像抠图方法，其特征在于，所述编码器单元为5个，所述解码器单元为5个。

5.如权利要求4所述的人像抠图方法，其特征在于，采用数据集训练深度学习网络，所述数据集包括人像图片或人像视频以及对应的标签，训练时的损失函数为：
L(A，Agt)＝γLmse(A，Agt)+tLrgb(A，Agt)+wLgrad(A，Agt)
其中，Lmse(A,Agt)是均方差损失，Lrgb(A,Agt)是合成损失，Lgrad(A,Agt)是梯度损失，γ,t,w分别为均方差损失，合成损失和梯度损失的权重系数；
所述均方差损失为：

所述合成损失为：

所述梯度损...

【专利技术属性】
技术研发人员：董宇涵，王克，张凯，李志德，
申请(专利权)人：清华大学深圳国际研究生院，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人