System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于计算机视觉和图像处理,特别是涉及一种基于改进hdnet(层次动态网络模型)的图像协调方法。
技术介绍
1、图像协调是指利用计算机视觉技术,通过调整前景图像的颜色和光照信息,使其与背景图像看起来更和谐,目的是使协调后的图像与真实图像难以区分,以便在虚拟现实、电影特效等应用领域中提供更好的用户体验和更逼真的视觉效果。
2、深度学习是当下解决图像协调任务的常用方法,深度学习模型可以自动地从大量的训练数据中学习到特征表示,从而避免了手工设计特征所带来的问题;另一方面,深度学习模型具有良好的可扩展性和适应性,能够处理不同形状和大小的前景图像,并且在性能上通常优于传统机器学习方法。此外,随着深度学习技术的不断发展,越来越多的架构和算法被提出和改进,使得神经网络在图像协调任务中表现出更加卓越的性能。
3、然而,尽管深度学习技术在图像协调任务已经取得了一定的进展,但是现有的网络模型在处理图像时仍然存在一些问题,如计算量大、训练时间长、合成图像质量不佳等。因此作为近几年新提出的图像协调任务,其研究仍有较大的提升空间。
技术实现思路
1、为了解决上述问题,本专利技术的目的在于提供一种基于改进hdnet的图像协调方法,旨在提高合成图像的质量与和谐程度。
2、为了达到上述目的,本专利技术提供的基于改进hdnet的图像协调方法包括按顺序进行的下列步骤:
3、步骤1:选取公开数据集作为图像协调数据集t,然后对图像协调数据集t中的图像进行预处理,之后
4、步骤2:构建基于改进hdnet的图像协调模型;
5、步骤3:设置步骤2中构建的基于改进hdnet的图像协调模型的超参数,使用步骤1中获得的训练集t1对基于改进hdnet的图像协调模型进行训练,获得训练后的基于改进hdnet的图像协调模型;
6、步骤4:使用步骤1中获得的测试集t2对上述训练后的基于改进hdnet的图像协调模型进行测试,获得最终的基于改进hdnet的图像协调模型;
7、步骤5:将随机选取的真实合成图像输入上述最终的基于改进hdnet的图像协调模型进行协调处理,最终的基于改进hdnet的图像协调模型的输出即为协调后的合成图像。
8、在步骤1中,所述选取公开数据集作为图像协调数据集t,然后对图像协调数据集t中的图像进行预处理,之后按比例分成训练集t1和测试集t2的方法如下:
9、选取hflickr、hday2night、hvidit、ccharmony在内的公开数据集作为图像协调数据集t,然后对图像协调数据集t中的图像进行随机水平翻转、随机旋转和随机裁剪在内的预处理,之后按9:1的比例分成训练集t1和测试集t2。
10、在步骤2中,所述基于改进hdnet的图像协调模型处理图像的方法如下:
11、2.1、首先将步骤1中获得的训练集t1输入已构建的基于改进hdnet的图像协调模型;
12、2.2、之后对训练集t1中的图像进行编码操作,编码操作过程共包含六次下采样,具体过程如下:首先使训练集t1中的图像经过步长为1,填充为1的3x3的卷积核,得到通道数为64,尺寸为256x256的特征图p0;第一次下采样是将特征图p0通过由4x4卷积层、批量归一化层和leakyrelu函数组成的序列后,使用步长为2,填充为1的4x4的池化核进行最大池化,得到通道数为64,尺寸为128x128的特征图p1;第二次下采样是将第一次下采样得到的特征图p1通过由3x3卷积层、批量归一化层和leakyrelu函数组成的序列,使用步长为1,填充为1的3x3的池化核进行最大池化,得到通道数为128,尺寸为128x128的特征图p2;第三次下采样是将第二次下采样得到的特征图p2通过由4x4卷积层、批量归一化层和leakyrelu函数组成的序列后,使用步长为2,填充为1的4x4的池化核进行最大池化,得到通道数为128,尺寸为64x64的特征图p3;第四次下采样是将第三次下采样得到的特征图p3通过由3x3卷积层、批量归一化层和leakyrelu函数组成的序列,使用步长为1,填充为1的3x3的池化核进行最大池化,得到通道数为256,尺寸为64x64的特征图p4;第五次下采样是将第四次下采样得到的特征图p4通过由4x4卷积层、批量归一化层和leakyrelu函数组成的序列后,使用步长为2,填充为1的4x4的池化核进行最大池化,得到通道数为256,尺寸为32x32的特征图p5;第六次下采样是将第五次下采样得到的特征图p5通过由3x3卷积层、批量归一化层和leakyrelu函数组成的序列,使用步长为1,填充为1的3x3的池化核进行最大池化,得到通道数为512,尺寸为32x32的特征图p6;
13、2.3、然后将第六次下采样得到的特征图p6通过由空洞空间池化金字塔结构和双重注意力机制构成的da_aspp特征融合模块生成新的特征图m;所述da_aspp特征融合模块按顺序进行分支、融合操作:其中分支操作首先使用一个1x1的卷积层来降低输入的特征图的通道维度,然后通过采样率分别为6、12、18的3x3并行空洞卷积层从不同尺度提取特征图;最后经过融合操作聚合来自不同尺度的特征图,将不同尺度的特征图融合后得到特征图p6’;随后将特征图p6’分别通过位置注意力模块和通道注意力模块,在位置注意力模块中,将特征图p6’送入卷积层中分别生成新的特征矩阵b、c、d,之后将特征矩阵b、c相乘并通过softmax层得到注意力矩阵s,随后将注意力矩阵s与特征矩阵d相乘后得到特征图p61’;通道注意力模块的操作类似,得到特征图p62’,最后将两个注意力模块输出的特征图p61’、p62’相加融合,得到通道数为512,尺寸为32x32的特征图m;
14、2.4、随后进行解码操作,解码操作过程是通过多次重复的卷积和上采样操作来实现的,具体方法如下:将步骤2.3中得到的特征图m作为第一次上采样的输入,通过由3x3反卷积层、批量归一化层和relu函数组成的序列,使用步长为1,填充为1的3x3的卷积核进行上采样操作,得到与跳跃连接特征融合后的通道数为1024,尺寸为32x32的特征图m1;将特征图m1作为第二次上采样的输入,通过由4x4反卷积层、批量归一化层和relu函数组成的序列,使用步长为2,填充为1的4x4的卷积核进行上采样操作,得到与跳跃连接特征融合后的通道数为512,尺寸为32x32的特征图m2;将特征图m2作为第三次上采样的输入,通过由3x3反卷积层、批量归一化层和relu函数组成的序列,使用步长为1,填充为1的3x3的卷积核进行上采样操作,得到与跳跃连接特征融合后的通道数为512,尺寸为64x64的特征图m3;将特征图m3作为第四次上采样的输入,通过由4x4反卷积层、批量归一化层和relu函数组成的序列,使用步长为2,填充为1的4x4的卷积核进行上采样操作,得到与跳跃连接特征融合后的通道数为256,尺寸为64x64的特征图m4;再将特征图m4本文档来自技高网...
【技术保护点】
1.一种基于改进HDNet的图像协调方法,其特征在于:所述基于改进HDNet的图像协调方法包括按顺序进行的下列步骤:
2.根据权利要求1所述的基于改进HDNet的图像协调方法,其特征在于:在步骤1中,所述选取公开数据集作为图像协调数据集T,然后对图像协调数据集T中的图像进行预处理,之后按比例分成训练集T1和测试集T2的方法如下:
3.根据权利要求1所述的基于改进HDNet的图像协调方法,其特征在于:在步骤2中,所述基于改进HDNet的图像协调模型处理图像的方法如下:
4.根据权利要求1所述的基于改进HDNet的图像协调方法,其特征在于:在步骤3中,所述使用步骤1中获得的训练集T1对基于改进HDNet的图像协调模型进行训练的方法如下:
5.根据权利要求1所述的基于改进HDNet的图像协调方法,其特征在于:在步骤4中,所述使用步骤1中获得的测试集T2对上述训练后的基于改进HDNet的图像协调模型进行测试,获得最终的基于改进HDNet的图像协调模型的方法如下:
6.根据权利要求1所述的基于改进HDNet的图像协调方法,其特征在
...【技术特征摘要】
1.一种基于改进hdnet的图像协调方法,其特征在于:所述基于改进hdnet的图像协调方法包括按顺序进行的下列步骤:
2.根据权利要求1所述的基于改进hdnet的图像协调方法,其特征在于:在步骤1中,所述选取公开数据集作为图像协调数据集t,然后对图像协调数据集t中的图像进行预处理,之后按比例分成训练集t1和测试集t2的方法如下:
3.根据权利要求1所述的基于改进hdnet的图像协调方法,其特征在于:在步骤2中,所述基于改进hdnet的图像协调模型处理图像的方法如下:
4.根据权利要求1所述的基于改进hdnet的图像协调方法,其特征在于:在步骤3中...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。