System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于分支增强的Transformer图像高分辨率重建方法技术_技高网
当前位置: 首页 > 专利查询>西北大学专利>正文

一种基于分支增强的Transformer图像高分辨率重建方法技术

技术编号:43712782 阅读:0 留言:0更新日期:2024-12-18 21:26
一种基于分支增强的Transformer图像超分辨率重建方法,包括:图像超分辨率重建,设计了BET基础模块框架,其中主要引入并行注意力融合模块,PAFM核心由并行分支构成,包括窗口多头自注意力分支,和卷积分支。采用并列融合的网络结构形式进行图像的超分辨率重建。又引入CNN分支其中的SE和CA模块,在激活更多像素进行重建的同时,能够利用相似的自注意力在获得高效的全局依赖建模的同时增强必要的信息之间的交互从而增强细节特征的提取和整体特征的融合。通过多种注意力机制和特征融合操作,使得PAFM可以有效增强重要特征的表示能力,提升网络性能。使其在图像超分重建过程中分支协同地进行优势互补。

【技术实现步骤摘要】

本专利技术属于计算机视觉,涉及图像超分辨率重建,具体涉及一种基于分支增强的transformer图像高分辨率重建方法。


技术介绍

1、超分辨率(super-resolution,sr)是一个长期存在且具有重要意义的问题,旨在从给定的低分辨率(low-resolution,lr)图像恢复出高分辨率(high-resolution,hr)图像。这一问题在现实生活中普遍存在,并且受限于多种因素。例如,在成像条件不佳的情况下,摄像设备可能无法捕捉到足够清晰的图像。此外,存储空间的限制也常常导致图像在存储过程中被压缩,从而损失了细节信息。在图像通过网络传输时,由于需要在信道前后进行编解码,往往会引入噪声,同时加剧图像的模糊程度。以上这些因素都会导致图像质量的不同程度损失。在计算机视觉领域,图像分辨率是影响下游任务处理结果的关键因素之一。低分辨率图像往往只能保证整体的结构一致性,但却缺乏高频细节信息,从而影响了后续任务的精度和效果。例如,在表情识别、目标检测、图像修复等应用中,较低的分辨率会大大降低算法的性能。表情识别需要捕捉人脸的细微变化,目标检测依赖于清晰的边缘信息,而图像修复则需要恢复出尽可能多的原始细节。

2、早期传统的图像超分辨率重建方法主要有以下三种:基于插值的超分算法,如双三次插值、最近邻插值等;基于退化模型的超分算法,如迭代反投影法、凸集投影法等;基于学习的超分算法,包括稀疏编码方法等。传统的超分算法已经取得了很大的成功,但随着尺度因子的放大,从x2到x3、x4甚至x8,用于超分重建所需要的信息越来越多,人为定义的先验知识已经不能满足需求,很难实现重建高质量图像的目的。基于卷积神经网络的超分辨率方法因其强大的提取图像高频细节的能力而备受欢迎。从最早的srcnn方法到srgan方法再到如今的各种优化方法。然而,使用基于cnn的方法建立全局连通性往往需要设计复杂的网络结构,整体过程较为困难的。作为一种替代方法,基于transformer的方法利用强大的自注意力(self-attention,sa)对输入数据的全局依赖进行建模,并显示出更好的性能。但是,一些研究发现transformer在局部区域内缺乏信息聚合的局部性机制。有研究又提出swin transformer方法,其中引入窗口自注意力,并且通过滑动窗口机制和层次化结构,在保证高性能的同时,大大降低了计算复杂度和内存占用,使得其在处理高分辨率图像时更加高效。但是,此类网络只能利用有限的输入信息空间范围,窗口之间信息交互较少,导致跨窗口信息融合不够充分。这意味着现有网络中transformer的潜力仍未得到充分发挥。


技术实现思路

1、为了克服上述现有技术的不足,本专利技术的目的提供一种基于分支增强的transformer图像超分辨率重建方法,结合卷积神经网络(convolutional neuralnetwork,cnn)和视觉transformer的图像高分辨率算法,实现更高质量的图像超分辨率重建。

2、为了实现上述目的,本专利技术采用的技术方案是:

3、一种基于分支增强的transformer图像超分辨率重建方法,其特征在于,包括以下步骤:

4、步骤1、浅层特征提取:

5、给定一个低分辨率输入图像ilr(h×w×cin)h、w和cin分别为图像的高度、宽度和输入通道数,采用3×3的卷积层hsf(·)提取浅层特征f0,见公式(1);

6、f0=hsf(ilr)  (1);

7、步骤2、深度特征提取;

8、从浅层特征f0中提取深度特征fdf(h×w×c),见公式(2);

9、fdf=hdf(f0)  (2);

10、其中hdf(·)由m个残差bet模块级联构成,用hbet(·)表示,残差连接通过直接将输入传递到后续层,加速收敛速度,见公式(3);

11、hdf(i)=hbet(fi-1)i=1,2…k  (3);

12、bet是由n个pafm模块叠加最后接入一个3x3conv构成,分别由hpafm(·)和hconv(·)表示,见公式(4);

13、hbet(fi-1)=hpafm(fi-1)+hconv(fi-1)i=1,2…k  (4);

14、其中的pafm由cnn辅助分支hcnn(·)(包括se(squeeze and excitation)模块和channel attention模块,w-msa分支hw-msa(·)两分路构成,α为cnn分支的权重因子,因此;

15、hpafm(fj-1)=α·hcnn(fj-1)+hw-msa(fj-1)j=1,2…k  (5);

16、步骤3、高分辨率图像重建;

17、通过聚合浅层特征和深层特征来重建高质量的图像isr,其中hre(·)是重建模块的函数,浅层特征主要包含低频信息,深层特征包含恢复丢失的高频信息,同时使用亚像素卷积对特征进行上采样,重建高质量的图像isr见公式(6);

18、isr=hre(f0+fdf)  (6)。

19、进一步,损失函数对于超分辨率重建图像sr,通过最小化l1像素损失,来优化网络参数和分别为第i张重建图像和高分辨原图像;

20、

21、其中,l1损失函数计算的是实际值与目标值之间绝对差值的总和,在此类有监督的图像超分辨率任务中,目标是使得生成的超分辨率重建图像(sr)尽可能接近真实的高分辨率图像(hr),使用l1损失计算的则是sr和hr对应像素位置的值的误差。

22、进一步,所述的浅层特征提取模块主要包括一个3x3的卷积和relu激活函数,通过滑动卷积核在输入图像上,计算卷积核与输入图像局部区域的点积,卷积运算的结果,表示为一个新的特征图。卷积运算后,通过relu激活函数进行非线性变换,增加模型的表达能力。

23、进一步,深层特征提取的主体结构包括若干个bet模块的级联以及每个模块的残差连接,每个bet内部主要由若干个pafm模块级联,最后接入3x3的卷积模块和残差连接。

24、进一步,pafm模块是一个并行的图像处理模块,包括卷积支路和w-msa支路,用来提取和增强图像特征,提高模型对不同类型输入的适应性。

25、进一步,pafm模块中:

26、首先,经过layer norm(层归一化)使特征的均值为0、标准差为1,有助于加速网络的训练;

27、之后,输入图像被复制到两个并行路径,每个路径执行不同的特征处理任务,对于卷积支路主要包括squeeze and excitation(se)模块和channel attention(ca)模块;

28、se模块调整图像特征的通道权重,增加重要通道的权重,减少不重要通道的权重,使网络更专注于重要特征,其中主要包括两个3x3conv层,中间加入一个glue激活函数;

29、ca模块进一步提升对重要通道特征的本文档来自技高网...

【技术保护点】

1.一种基于分支增强的Transformer图像超分辨率重建方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于分支增强的Transformer图像超分辨率重建方法,其特征在于,损失函数对于超分辨率重建图像SR,通过最小化L1像素损失,来优化网络参数和分别为第i张重建图像和高分辨原图像;

3.根据权利要求1所述的一种基于分支增强的Transformer图像超分辨率重建方法,其特征在于,所述的浅层特征提取模块主要包括一个3x3的卷积和ReLU激活函数,通过滑动卷积核在输入图像上,计算卷积核与输入图像局部区域的点积,卷积运算的结果,表示为一个新的特征图。卷积运算后,通过ReLU激活函数进行非线性变换,增加模型的表达能力。

4.根据权利要求1所述的一种基于分支增强的Transformer图像超分辨率重建方法,其特征在于,深层特征提取的主体结构包括若干个BET模块的级联以及每个模块的残差连接,每个BET内部主要由若干个PAFM模块级联,最后接入3x3的卷积模块和残差连接。

5.根据权利要求1所述的一种基于分支增强的Transformer图像超分辨率重建方法,其特征在于,PAFM模块是一个并行的图像处理模块,包括卷积支路和W-MSA支路,用来提取和增强图像特征,提高模型对不同类型输入的适应性。

6.根据权利要求5所述的一种基于分支增强的Transformer图像超分辨率重建方法,其特征在于,PAFM模块中:

7.根据权利要求1所述的一种基于分支增强的Transformer图像超分辨率重建方法,其特征在于,所述的高分辨率图像重建将浅层特征、深层特征以及最初的输入特征通过残差连接融合,确保了低频信息和高频细节的有效结合,融合后的特征经过亚像素卷积进行上采样,提升分辨率。

8.根据权利要求7所述的一种基于分支增强的Transformer图像超分辨率重建方法,其特征在于,所述的亚像素卷积通过增加通道数,然后使用像素重组(PixelShuffle)操作将特征图从较低分辨率上采样到较高分辨率,PixelShuffle操作是一种特殊的变换,将多个通道中的相同空间位置的像素重新排列成更大的空间维度。

...

【技术特征摘要】

1.一种基于分支增强的transformer图像超分辨率重建方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于分支增强的transformer图像超分辨率重建方法,其特征在于,损失函数对于超分辨率重建图像sr,通过最小化l1像素损失,来优化网络参数和分别为第i张重建图像和高分辨原图像;

3.根据权利要求1所述的一种基于分支增强的transformer图像超分辨率重建方法,其特征在于,所述的浅层特征提取模块主要包括一个3x3的卷积和relu激活函数,通过滑动卷积核在输入图像上,计算卷积核与输入图像局部区域的点积,卷积运算的结果,表示为一个新的特征图。卷积运算后,通过relu激活函数进行非线性变换,增加模型的表达能力。

4.根据权利要求1所述的一种基于分支增强的transformer图像超分辨率重建方法,其特征在于,深层特征提取的主体结构包括若干个bet模块的级联以及每个模块的残差连接,每个bet内部主要由若干个pafm模块级联,最后接入3x3的卷积模块和残差连接。

5.根据权利...

【专利技术属性】
技术研发人员:胡建龙李鹏飞
申请(专利权)人:西北大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1