卷积神经网络与Transformer相结合的轻量级单图像超分辨率重建方法技术

技术编号：38328521 阅读：26 留言：0更新日期：2023-07-29 09:11

本发明专利技术提供了一种卷积神经网络与Transformer相结合的轻量级单图像超分辨率重建方法，属于计算机视觉及图像处理领域。首先，对图像超分辨率重建训练集中的原始数据进行预处理，构建出成对的LR

全部详细技术资料下载

【技术实现步骤摘要】
卷积神经网络与Transformer相结合的轻量级单图像超分辨率重建方法

[0001]本专利技术涉及计算机视觉
及图像处理领域，具体涉及一种将卷积神经网络与Transformer相结合的轻量级单图像超分辨率重建方法。

技术介绍

[0002]图像超分辨率重建技术指的是将给定的低分辨率图像通过一定的算法恢复成与之对应的高分辨率图像。图像分辨率是一组用于评估图像中蕴含细节信息丰富程度的性能参数，高分辨率图像中往往包含更丰富的纹理细节，并且具有更高的可信赖度。在现实生活中具有广泛的运用，如：对视频监控的图像进行超分辨率重建，可以更好的复原出视频监控中的人和物，从而能够准确的找到所需要的目标。然而，以往的方法虽然取得了令人满意的结果，但是模型大小以及计算复杂度的增加限制了它们在现实世界中的应用。因此，如何实现图像超分辨率重建模型大小和性能之间的平衡成为了一项重要且艰巨的任务。
[0003]目前来说，图像超分辨率重建的方法主要分为三种：基于插值的方法、基于重构的方法以及基于学习的方法。在早期，大多数重建方法都是采用的基于插值的方法，最常见的包含双线性插值以及双三次插值法，这类方法计算较为简单、易于理解并且便于实现，但是在最终的重建结果会出现振铃效应以及高频信息丢失严重的问题。在这之后，出现了很多基于重构的方法，这类方法从图像的降质退化模型出发，结合图像的先验知识来约束超分辨率图像的生成。而基于学习的方法则是通过学习过程获得先验知识，来指导高分辨率图像生成。
[0004]随着深度学习的流行，出现了很多基于深度...

【技术保护点】

【技术特征摘要】
1.一种卷积神经网络与Transformer相结合的轻量级单图像超分辨率重建方法，其特征在于，该方法包括以下步骤：步骤1：对单图像超分辨率重建训练数据集中的原始数据进行预处理，构建出成对的低分辨率图像
‑
高分辨率图像训练数据；步骤2：构建卷积神经网络与Transformer相结合的轻量级单图像超分辨率重建网络，将预处理好的训练数据输入到网络中；步骤3：采用L1作为训练损失函数进行训练，得到最终的训练好的超分辨率重建网络模型；步骤4：加载步骤3得到的模型，将所需要超分的图片输入到超分辨率重建网络模型中，得到低分辨率图像所对应的高分辨率图像。2.根据权利要求1所述的方法，其特征在于，所述步骤1具体包括：步骤1.1：将原始数据集中高分辨率图像HR进行裁剪操作，每张图片裁剪若干张128
×
128的子图，用来扩充数据集；步骤1.2：通过MATLAB使用双三次核函数对高分辨率图像进行4倍的下采样从而获得低分辨率图像LR，采用成对的LR
‑
HR作为超分辨率重建网络的训练集。3.根据权利要求1或2所述的方法，其特征在于，所述步骤2具体包括：步骤2.1：首先将I
LR
输入到非对称卷积模块ACB中进行浅层特征提取，具体的公式如下所示：F
ACB
＝f
ACB
(I
LR
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)其中F
ACB
代表经过ACB模块提取到的浅层特征；f
ACB
(
·
)表示的是ACB模块的功能函数，I
LR
代表的是输入的低分辨率图像；步骤2.2：将步骤2.1经过浅层特征提取得到的结果输入到基于多尺度特征融合注意力的卷积神经网络MFF
‑
CNN中，其计算公式下所示：F
MFF
‑
CNN
＝f
MFF
‑
CNN
(F
ACB
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)其中，F
MFF
‑
CNN
表示的是经过MFF
‑
CNN网络提取得到的局部特征，f
MFF
‑
CNN
(
·
)表示的是MFF
‑
CNN网络的功能函数；步骤2.3：将经过多尺度特征融合注意力的网络提取到的特征F
MFF
‑
CNN
送入到多重注意力模块当中，其公式如下：F
MAB
＝f3×3(f
MAB
(f3×3(F
MFF
‑
CNN
)))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)其中，F
MAB
代表经过MAB模块学习到的特征，f
MAB
(
·
)表示的是MAB模块的功能函数；步骤2.4：将得到的输出结果F
MAB
以及F
ACB
输入到最后的上采样重建模块中，得到最终重建出来的高分辨率图像，并且保存训练模型和评价指标，输出用如下公式表示：I
SR
＝f
Sub
‑
pixel
(F
MAB
+F
ACB
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)其中，I
SR
代表的是最终网络重建出来的高分辨率图像。4.根据权利要求3所述的方法，其特征在于，所述步骤2.1具体包括：在网络的第一层采用ACB模块，即使用3
×
3、1
×
3以及3
×
1卷积核来从输入图像中提取浅层特征，最后将以上三个卷积层的计算结果进行融合从而获得最终卷积层的输出；ACB模块的完整操作定义如下所示：F
ACB
＝f3×3(I
LR
)+f1×3(I
LR
)+f3×1(I
LR
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)
其中，f3×3(
·
)、f1×3(
·
)和f3×1(
·
)分别表示卷积核大小为3
×
3、1
×
3和3
×
1的卷积功能函数。5.根据权利要求3所述的方法，其特征在于，所述步骤2.2具体包括：步骤2.2.1：MFF
‑
CNN主要由14个多尺度特征融合模块MFFM构成，将提取好的特征F
ACB
送入到MFFM模块中，将会首先进入到移动卷积模块MBConv，MBConv采用了1
×
1的卷积以及3
×
3的反卷积来进行特征提取，其具体计算如下所示：F
...

【专利技术属性】
技术研发人员：周东生，张炜，樊万姝，王鹏飞，张强，魏小鹏，
申请(专利权)人：大连大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人