【技术实现步骤摘要】
一种图像增强方法、装置、介质及设备
本专利技术涉及图像处理
,尤其涉及一种图像增强方法、装置、介质及设备。
技术介绍
日常经常需要用到证件照,随着带拍照功能的设备的普及,很多人喜欢自行拍摄照片后采用做图软件处理出证件照。在做图软件中通过依次执行选择抠图、选择抠图方式、选择删除和保留区域、生成透明底层图片操作后,再选择填充底色进行证件照更换背景颜色操作。在证件照背景颜色与目标物颜色比较接近、深色头发中存在白头发、披肩发蓬松情况下采用自动抠图效果不好,针对图片中颜色比较乱且区分不明显的情况下只能采用手动抠图,比较耗时,而且背景与目标物不太融洽。因此,提出一种避免图像中目标对象与背景边界不太融洽的图像增强方法显得尤为重要。
技术实现思路
基于此,有必要针对上述问题,提出了一种图像增强方法、装置、介质及设备。第一方面,本专利技术提出了一种图像增强方法,所述方法包括:获取待增强图像;将所述待增强图像作为已训练的图像增强模型的输入,所述已训练的图像增强模型用于对所述待增强图像进行增强,所述已训练的图像增强模型是基于第一生成网络、第二生成网络、第三生成网络、第四生成网络、第一判别网络和第二判别网络训练得到的,所述已训练的图像增强模型为训练完成的第一生成网络;获取所述已训练的图像增强模型输出的目标增强图像;其中,所述第一生成网络的输出分别为所述第二生成网络的输入和第二判别网络的输入,所述第二生成网络用于对所述第一生成网络的输出进行还原,所述第二判别网络用于对所述第一生 ...
【技术保护点】
1.一种图像增强方法,所述方法包括:/n获取待增强图像;/n将所述待增强图像作为已训练的图像增强模型的输入,所述已训练的图像增强模型用于对所述待增强图像进行增强,所述已训练的图像增强模型是基于第一生成网络、第二生成网络、第三生成网络、第四生成网络、第一判别网络和第二判别网络训练得到的,所述已训练的图像增强模型为训练完成的第一生成网络;/n获取所述已训练的图像增强模型输出的目标增强图像;/n其中,所述第一生成网络的输出分别为所述第二生成网络的输入和第二判别网络的输入,所述第二生成网络用于对所述第一生成网络的输出进行还原,所述第二判别网络用于对所述第一生成网络的输出进行判断识别,所述第一生成网络和所述第二判别网络为对抗性训练网络;/n所述第三生成网络的输出分别为所述第四生成网络的输入和第一判别网络的输入,所述第四生成网络用于对所述第三生成网络的输出进行还原,所述第一判别网络用于对所述第三生成网络的输出进行判断识别,所述第三生成网络和所述第一判别网络为对抗性训练网络。/n
【技术特征摘要】
1.一种图像增强方法,所述方法包括:
获取待增强图像;
将所述待增强图像作为已训练的图像增强模型的输入,所述已训练的图像增强模型用于对所述待增强图像进行增强,所述已训练的图像增强模型是基于第一生成网络、第二生成网络、第三生成网络、第四生成网络、第一判别网络和第二判别网络训练得到的,所述已训练的图像增强模型为训练完成的第一生成网络;
获取所述已训练的图像增强模型输出的目标增强图像;
其中,所述第一生成网络的输出分别为所述第二生成网络的输入和第二判别网络的输入,所述第二生成网络用于对所述第一生成网络的输出进行还原,所述第二判别网络用于对所述第一生成网络的输出进行判断识别,所述第一生成网络和所述第二判别网络为对抗性训练网络;
所述第三生成网络的输出分别为所述第四生成网络的输入和第一判别网络的输入,所述第四生成网络用于对所述第三生成网络的输出进行还原,所述第一判别网络用于对所述第三生成网络的输出进行判断识别,所述第三生成网络和所述第一判别网络为对抗性训练网络。
2.根据权利要求1所述的方法,其特征在于,所述已训练的图像增强模型采用如下方式训练得到:
获取多个图像对,所述图像对中包括源图像、目标图像,所述源图像为待增强图像,目标图像为目标增强图像;
将所述源图像输入第一生成网络得到第一源图像生成数据,将所述第一源图像生成数据输入第二生成网络得到第二源图像生成数据,将所述目标图像输入第三生成网络得到第一目标图像生成数据,将所述第一目标图像生成数据输入第四生成网络得到第二目标图像生成数据,所述第一生成网络、所述第二生成网络、所述第三生成网络、所述第四生成网络采用相同结构的图像生成网络;
将所述源图像输入第一判别网络得到第一源图像期望数据,将所述第一源图像生成数据输入第二判别网络得到第二源图像期望数据,将所述目标图像输入第二判别网络得到第一目标图像期望数据,将所述第一目标图像生成数据输入第一判别网络得到第二目标图像期望数据,所述第一判别网络、所述第二判别网络采用相同结构的图像判别网络且包括多个基础块、全连接层;
根据所述第一源图像期望数据、所述第二源图像期望数据、所述第一目标图像期望数据、所述第二目标图像期望数据、所述第一源图像生成数据、所述第二源图像生成数据、所述第一目标图像生成数据、所述第二目标图像生成数据采用梯度下降优化方法进行训练,得到已训练的图像增强模型。
3.根据权利要求2所述的方法,其特征在于,所述第一判别网络包括依次相连的输入层、第一基础块、第二基础块、第三基础块、第四基础块、第五基础块、第六基础块、全连接层;
所述第一基础块包括第一基础卷积层、第一激活层、第一正则化层,所述第一基础卷积层采用3×3卷积核、对称填充、步长为2、通道数为16,所述第一激活层采用LRelu激活函数,所述第一正则化层用于对单个输入图像进行正则化;
所述第二基础块包括第二基础卷积层、第二激活层、第二正则化层,所述第二基础卷积层采用3×3卷积核、不填充、步长为2、通道数为32,所述第二激活层采用LRelu激活函数,所述第二正则化层用于对单个输入图像进行正则化;
所述第三基础块包括第三基础卷积层、第三激活层、第三正则化层,所述第三基础卷积层采用3×3卷积核、不填充、步长为2、通道数为64,所述第三激活层采用LRelu激活函数,所述第三正则化层用于对单个输入图像进行正则化;
所述第四基础块包括第四基础卷积层、第四激活层、第四正则化层,所述第四基础卷积层采用3×3卷积核、不填充、步长为2、通道数为128,所述第四激活层采用LRelu激活函数,所述第四正则化层用于对单个输入图像进行正则化;
所述第五基础块包括第五基础卷积层、第五激活层、第五正则化层,所述第五基础卷积层采用3×3卷积核、不填充、步长为2、通道数为128,所述第五激活层采用LRelu激活函数,所述第五正则化层用于对单个输入图像进行正则化;
所述第六基础块包括第六基础卷积层、第六激活层、第六正则化层,所述第六基础卷积层采用3×3卷积核、不填充、步长为2、通道数为128,所述第六激活层采用LRelu激活函数,所述第六正则化层用于对单个输入图像进行正则化。
4.根据权利要求2所述的方法,其特征在于,所述获取多个图像对,还包括:采集源图像,所述源图像为人物证件照,根据所述源图像进行增强处理生成与源图像对应的目标图像,所述增强处理包括保留想要的目标对象的特征的标准化处理。
5.根据权利要求2所述的方法,其特征在于,所述第一生成网络包括特征提取子网、特征还原子网、特征嵌入子网;
所述特征提取子网用于对所述源图像进行提取得到表层特征,对所述表层特征进行压缩得到第一特征图像,所述表层特征包括轮廓;
所述特征还原子网用于把所述第一特征图像进行放大还原得到第二特征图像;
所述特征嵌入子网用于把所述第一特征图像、所述第二特征图像、所述源图像进行融合处理得到第一源图像生成数据。
6.根据权利要求5所述的方法,其特征在于,所述特征提取子网包括依次相连的多个第一卷积块;
所述第一卷积块包括依次相连的第七卷积层、第七激活层、第一分批归一化层;
所述第七卷积层采用3×3卷积核或5×5卷积核,且采用对称填充;
所述第七激活层采用selu激活函数。
7.根据权利要求5所述的方法,其特征在于,所述特征还原子网包括依次相连的多个第二卷积块、一个第三卷积块;
所述第二卷积块包括依次相连的第八卷积层、第八激活层、第二分批归一化层,所述第八卷积层采用3×3卷积核且采用对称填充,所述第八激活层采用selu激活函数;
所述第三卷积块包括第九卷积层、第九激活层、第一单元卷积层,所述第九卷积层包括采用8×8卷积核、步长为1、采用对称填充,所述第九激活层采用selu激活函数,所述第一单元卷积层包括采用1×1卷积核、步长为1、不进行填充。
8.根据权利要求5所...
【专利技术属性】
技术研发人员:高亚南,
申请(专利权)人:深圳市雄帝科技股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。