基于制造技术

技术编号:39499015 阅读:10 留言:0更新日期:2023-11-24 11:28
本发明专利技术提出一种基于

【技术实现步骤摘要】
基于CNN

Transformer的局部全局交互式图像恢复方法


[0001]本专利技术属于计算机视觉领域


技术介绍

[0002]图像恢复任务是计算机视觉中的一个热门的研究课题,它的目的是从噪声观测中恢复出来干净的图像

这是一个极具挑战性的问题,因为在真实场景中存在着十分复杂的噪声场景

为了适应各种退化的噪声,现有的最先进的恢复技术

卷积神经网络算法
(CNNs)

Transformer
算法,经常通过从大规模数据中捕获自然图像的统计信息用来学习隐藏的先验知识和先验特征

[0003]近年来,卷积神经网络和
Transformer
逐渐取代了传统的恢复方法,成为了最主流的恢复方式

卷积神经网络的核心是卷积运算,它分层地收集特征信息,用来获得更好的图像表示

虽然该方法在局部特征的提取方面取得了令人印象深刻的结果,但由于卷积运算的感受域有限,它缺乏捕获全局表示的能力

它对于长距离像素关系进行建模是很糟糕的

尽管人们试图通过加入注意力机制来提高网络在捕捉全局特征方面上的性能,但如果卷积没有与注意力机制适当地集成,局部特征细节甚至可能被破坏

[0004]为了解决这个问题,最近的几项
Transformer
工作开始尝试使用位置块来提取参数向量作为视觉表示

这证明了它在全球信息的提取方面具有巨大的潜力
。Transformer
反映了复杂的空间变换和长程特征依赖性,通过自注意力机制
(SA)
层的结构来获得全局的特征表示

例如,用于低级视觉任务的预训练通用模型
(IPT)
可以通过多个头和尾巴共享一个躯干来处理不同的图像处理任务
。Parmaret al
提出了图像转换器,这是推广转换器模型以制定图像转换和生成任务的第一步

为了恢复高质量的图像,设计了一个基于
Swin Transformer
的强大基线模型,以自适应地方式处理各种恢复任务

虽然它善于通过多头自注意模块学习像素之间的长程依赖关系,但同时忽略了局部特征的细节,大大降低了背景和前景之间的可分辨性

除此之外,自注意力机制
(SA)
带来的计算和空间复杂性也是不可估量的

总的来说,卷积神经网络或
Transformer
只能在片面的基础上有效地获得有用的信息

在计算复杂性的保证下,它们都不能很好地同时从根本上平衡局部建模和全局建模之间的关系

[0005]因此,如何在尽可能减小网络计算量的同时,高效地将局部信息和全局信息进行耦合成为了目前亟待解决的问题


技术实现思路

[0006]本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一

[0007]为此,本专利技术的目的在于提出一种基于
CNN

Transformer
的局部全局交互式图像恢复方法,用于获取更准确和可靠的图像恢复结果

[0008]为达上述目的,本专利技术第一方面实施例提出了一种基于
CNN

Transformer
的局部全局交互式图像恢复方法,包括:
[0009]获取合成模糊图像数据集作为训练集;
[0010]构建基于
CNN

Transformer
的局部全局交互式图像恢复模型,其中所述局部全局交互式图像恢复模型包括:
CNN
分支
、Transformer
分支

交互学习

耦合连接

交互学习

跳跃连接;
[0011]使用所述训练集对所述局部全局交互式图像恢复模型进行训练;
[0012]获取待恢复图像,将所述待恢复图像输入训练好的局部全局交互式图像恢复模型中,进行图像降噪

[0013]另外,根据本专利技术上述实施例的一种基于
CNN

Transformer
的局部全局交互式图像恢复方法还可以具有以下附加的技术特征:
[0014]进一步地,在本专利技术的一个实施例中,所述基于
CNN

Transformer
的局部全局交互式图像恢复模型,利用
CNN

Transformer
结合的方式以及基于交互式学习的方法引导局部和全局信息的提取和耦合

[0015]进一步地,在本专利技术的一个实施例中,所述利用
CNN

Transformer
结合的方式,包括设计一个耦合块用于耦合局部和全局的信息,所述耦合块为具有三明治结构的块,包括外部两侧的
CNN
分支和中间的
Transformer
分支;
[0016]所述基于交互式学习的方法包括块内耦合连接方法和用于交互式学习的块间跳跃连接方法

[0017]进一步地,在本专利技术的一个实施例中,所述具有三明治结构的块,包括:
[0018]使用批量归一化和层归一化用来对齐特征值,并设计1×1卷积用来对齐耦合连接处的通道维度,用交互的方式桥接两个分支

[0019]进一步地,在本专利技术的一个实施例中,所述的外部两侧的
CNN
分支,包括:
[0020]两个重复的卷积和注意力的步骤,位于耦合块的最外两侧;
[0021]每个卷积和注意力的步骤包含了改变特征图的通道数量的1×1卷积

调整特征图的分辨率的3×3深度卷积和预测特征图潜在关键特征的通道注意力块;
[0022]所述
CNN
分支用于通过堆叠一系列的卷积运算操作来逐渐扩大
CNN
的感受野

[0023]进一步地,在本专利技术的一个实施例中,所述的中间的
Transformer
分支,用于:
[0024]接收由
CNN
分支操作完成后的具有局部线索的特征图;
[0025]全局范围内的信息聚合;
[0026]将
Transformer
分支处理后的特征图传输回到
CNN
分支;
[0027]在
Transformer
分支中细化自注意模块和前馈网络

[0028]进一步地,在本专利技术的一个实施例中,所述块间跳跃连接方法,包括:
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于
CNN

Transformer
的局部全局交互式图像恢复方法,其特征在于,包括以下步骤:获取合成模糊图像数据集作为训练集;构建基于
CNN

Transformer
的局部全局交互式图像恢复模型,其中所述局部全局交互式图像恢复模型包括:
CNN
分支
、Transformer
分支

交互学习

耦合连接

交互学习

跳跃连接;使用所述训练集对所述局部全局交互式图像恢复模型进行训练;获取待恢复图像,将所述待恢复图像输入训练好的局部全局交互式图像恢复模型中,进行图像降噪
。2.
根据权利要求1所述的方法,其特征在于,所述基于
CNN

Transformer
的局部全局交互式图像恢复模型,利用
CNN

Transformer
结合的方式以及基于交互式学习的方法引导局部和全局信息的提取和耦合
。3.
根据权利要求2所述的方法,其特征在于,所述利用
CNN

Transformer
结合的方式,包括设计一个耦合块用于耦合局部和全局的信息,所述耦合块为具有三明治结构的块,包括外部两侧的
CNN
分支和中间的
Transformer
分支;所述基于交互式学习的方法包括块内耦合连接方法和用于交互式学习的块间跳跃连接方法
。4.
根据权利要求3所述的方法,其特征在于,所述具有三明治结构的块,包括:使用批量归一化和层归一化用来对齐特征值,并设计1×1卷积用来对齐耦合连接处的通道维度,用交互的方式桥接两个分支
。5.
根据权利要求3所述的方法,其特征在于,所述的外部两侧的
CNN
分支,包括:两个重复的卷积和注意力的步骤,位于耦合块的最外两侧;每个卷积和注意力的步骤包含了改变特征图的通道数量的1×1卷积

调整特征图的分辨率的3×3深度卷积和预测特征图潜在关键特征的通道注意力块;所述
CNN
分支用于通过堆叠一系列的卷积运算操作来逐渐扩大
CNN
的感受野
。6.
根据权利要求3所述的方法,其特征在于,所述的中间的
Transformer
分支,用于...

【专利技术属性】
技术研发人员:章春娥姜钰琪
申请(专利权)人:北京交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1