【技术实现步骤摘要】
一种基于Vision Transformer的图像压缩感知重构方法及系统
[0001]本专利技术涉及一种基于Vision Transformer的图像压缩感知重构方法及系统,属于图像处理
技术介绍
[0002]压缩感知也可以被叫做Compressed Sampling,即压缩采样。压缩感知是一种能够突破香农的奈奎斯特采样定理,通过利用信号的稀疏特征以远远小于原始信号的测量值,高精度的来重建原始信号的一种方法。压缩感知理论的提出,引起学术界和工业界的广泛关注。在图像处理、光学/微波成像、模式识别、无线通信等领域受到高度关注。
[0003]卷积神经网络在压缩图像感知方面取得了成功。然而,由于卷积神经网络感受野通常很小,不利于捕获全局特征,卷积运算在建模长期依赖关系时存在固有的局限性。
[0004]Transformer是一种基于自注意力机制的编码器
‑
解码器结构,Vision Transformer将Transformer应用到计算机视觉领域。Vision Transformer可以捕获长距离依赖关系,因此在许多视觉任务中超越许多卷积神经网络结构。
[0005]现有的图像压缩感知重构方法利用卷积神经网络进行重构,卷积神经网络感受野小,不利于捕获全局特征。
[0006]随着深度学习的发展,将压缩感知与深度学习相结合,显著地提高了信号恢复的性能和速度。
技术实现思路
:
[0007]针对现有技术的不足,本专利技术提供了一种基于Vision Transf ...
【技术保护点】
【技术特征摘要】
1.一种基于Vision Transformer的图像压缩感知重构方法,其特征在于,包括步骤如下:(1)对图像依次进行预处理、分块压缩采样操作;(2)对步骤(1)处理后的图像通过训练好的初始重构网络进行初始重构,并进行重构和拼接;(3)对步骤(2)得到的图像通过训练好的深度重构网络进行深度重构,得到深度重构图像。2.根据权利要求1所述的一种基于Vision Transformer的图像压缩感知重构方法,其特征在于,步骤(1)中,分块压缩采样,是指:对预处理后的每张图像分成大小为B
×
B
×
l的不重叠的图像块,l表示通道数,设压缩率为s,则n
B
=[slB2],分块压缩采样表示为式(I):y=W
s
*x (I)式(I)中,*表示卷积操作,x是输入图像,y是测量值,W
s
是n
B
个大小为B
×
B
×
l的滤波器。3.根据权利要求1所述的一种基于Vision Transformer的图像压缩感知重构方法,其特征在于,步骤(2)中,初始重构,表示为式(II):式(II)中,*表示卷积操作,y是测量值,的每一列是一个大小为1
×
l
×
lB2的向量对应于一个B
×
B
×
l的图像块,W
int
是lB2个大小为1
×
l
×
n
B
的滤波器;是向量形式,的每一列对应于一个图像块的重构输出。4.根据权利要求1所述的一种基于Vision Transformer的图像压缩感知重构方法,其特征在于,步骤(2)中,重构和拼接,包括:利用一个组合层对进行重构和拼接,组合层包括一个reshape函数和一个拼接函数,得到初始重构图像;具体实现过程如下:a、将每个大小为1
×
l
×
lB2的重构向量reshape为一个B
×
B
×
l图像块;b、将所有图像块拼接得到初始重构图像,这个过程表示为式(III):式(III)中,是大小为1
×
l
×
lB2的向量,h、w分别表示行、列的块数,γ(.)是将大小为1
×
l
×
lB2的向量转换为B
×
B
×
l图像块的reshape函数,k(.)是将所有这些图像块拼接起来得到初始重建图像的拼接函数。5.根据权利要求1所述的一种基于Vision Transformer的图像压缩感知重构方法,其特征在于,步骤(3)的具体实现步骤包括:A、将步骤(2)得到的初始重构图像按照B
×
B
×
l的大小进行划分得到初始重构图像块,对初始重构图像块进行卷积操作,线性映射得到一维向量,如式(IV)所示:式(IV)中,W是大小为B
×
B的lB2个滤波器,是初始重构图像块,p是对h、w两个维度进行展平操作,z0是二维矩阵;
B、将z
l
‑1输入Transformer编码器,l=1
…
L,Transformer编码器是重复堆叠编码器块L次...
【专利技术属性】
技术研发人员:刘福涛,王付奎,曹维达,于依冉,王馨悦,李蔚郁,鲁威志,陈龙,许丽媛,姜秋波,万月忠,徐彪,李振玲,杨超尘,李云龙,陈芳,
申请(专利权)人:国家电网有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。