一种基于解耦深度字典学习的图像去噪方法技术

技术编号:34485341 阅读:37 留言:0更新日期:2022-08-10 09:02
本发明专利技术公开了一种基于解耦深度字典学习的图像去噪方法,首先对图像数据进行预处理,将输入的图像分解为结构图像和纹理图像;所述结构图像和纹理图像分别遵循字典学习模型去学习一个自适应的字典,对解耦深度字典学习模型求解,利用模型驱动的网络对处理完后的图像不同成分做融合;然后将经过预处理的图像输入神经网络模型进行参数训练,得到去噪效果较好的网络模型;最后将需要测试的图像输入到上述经过参数训练的网络模型中,得到清晰图像。本方法所形成的解耦深度字典学习图像去噪模型克服了当前主流方法中存在的模型退化严重、网络收敛慢、字典不自适应等问题,有效的利用了DNN的学习能力,使之在严重噪声环境下也能很好的恢复图像的细微结构。好的恢复图像的细微结构。好的恢复图像的细微结构。

【技术实现步骤摘要】
一种基于解耦深度字典学习的图像去噪方法


[0001]本专利技术涉及一种自然源图像去噪方法,尤其是一种基于解耦深度字典学习的图像去噪方法,属于图像去噪领域。

技术介绍

[0002]随着信息科学技术的快速发展,人们对目标检测、物体识别、图像检索等研究越来越多,然而对目标检测、物体识别、图像检索等很多应用都要求输入尽可能清晰的数字图像,而数字图像在采集和存储的过程中会因为各种原因被噪声所污染,因此图像去噪是一个十分重要的课题。
[0003]目前现有去噪方法包括:采用K

SVD字典训练算法进行去噪,采用非线性反应扩散算法(TNRD)进行去噪,采用中值滤波进行去噪,采用小波变换进行去噪以及采用三维块匹配算法(BM3D)块匹配稀疏三维变换域协作滤波算法进行去噪,其中,采用BM3D块匹配稀疏三维变换域协作滤波算法进行去噪作为当前最优去噪方法,在去噪效果上已经达到了很高的水平。而采用BM3D算法进行去噪是根据噪声图片内部的信息进行去噪,高斯噪声的标准差越大或者光照条件越差,图像的信噪比就越低,图像内部能够利用的有用信息就越少,受到的噪声干扰就越多,从理论上说去噪效果就会越差。当图像内部能够利用的信息变少时,能够借助外部信息进行去噪,因此,学者提出了基于深度学习对于图像去噪方法。
[0004]由于传统的字典去噪模型缺乏移位不变特性,Cristina提出了卷积字典学习(convolutional dictionary learning,CDicL),使用卷积运算来代替信号表示中矩阵乘法来解决问题。但是此方法学习一个通用的字典来表示所有的图像,降低了模型的灵活性。还有很多集成字典学习和DNN进行图像去噪的技术,使用的是手工来构造先验知识,没有有效的利用到DNN的学习能力。基于此,有必要在CDicL模型基础之上,提出一种新的字典学习框架。

技术实现思路

[0005]针对上述存在的问题,本专利技术提供了一种基于解耦深度字典学习的图像去噪方法,利用图像分解技术将输入的图像分解为结构图像和纹理图像,分解完每部分使用了一个自适应的字典来保证去噪效果,为防止冗余加入了灵敏度惩罚算子,同时使用图像融合技术来复原图像,解决了当前主流方法中存在的模型退化严重、网络收敛慢、字典不自适应等问题。
[0006]本专利技术为解决上述技术问题采用的技术方案如下:
[0007]一种基于解耦深度字典学习的图像去噪方法,具体包括如下步骤:
[0008]步骤1,对图像数据进行预处理;
[0009]步骤2,对解耦深度字典学习模型求解并构建包含InputNet、LNM

X、LNM

D、LNM

P、SplitNet的神经网络模型;
[0010]步骤3,设置已构建神经网络模型的损耗函数、训练参数;
[0011]步骤4,将经过预处理的图像输入步骤3设置好的神经网络模型进行参数训练,得到去噪效果较好的网络模型;
[0012]步骤5,将需要测试的图像输入到步骤4得到的网络模型中,得到去噪后的清晰图像。
[0013]所述步骤1具体如下:
[0014]收集不同的自然图像数据集进行组合,对图像加上高斯白噪声,然后使用现代变分技术将加噪后的图片分解为结构图像和纹理图像,最后将图像裁剪为128*128大小的图像块。
[0015]步骤2中所述深度解耦字典学习模型为:
[0016][0017]其中N表示使用一组N个训练样本对;Y表示一副加噪后的完整图像;下标1和2分别代表结构图像和纹理图像的表示项;X表示图像的系数矩阵;D表示图像的自适应字典;P表示为每部分图像引入的灵敏度解耦算子;λ表示正则化参数;φ表示系数先验;ψ表示正则化项。
[0018]所述步骤2中,对解耦深度字典学习模型中的结构图像及纹理图像(即X、D、P、)进行求解的具体方法包括如下步骤,其中结构图像即为X1、D1、P1,纹理图像即为X2、D2、P2,下标s表示结构图像和纹理图像通用部分的表示项:
[0019]步骤21:引入辅助变量D
aux
、X
aux
、P
aux
,并对其进行求解;
[0020]如下式所示,通过FFT(fast Fourier transform)有效的求得X
aux
闭式解:
[0021][0022]式中,F
‑1表示逆FFT,定义F(
·
)是二维傅里叶变换,并让d=F(D)、x
*
=F(X
*
)、p=F(P),表示d的复共轭,表示哈德曼乘积,A

C表示将A的通道维度扩展为C,a
X
是超参数;
[0023]如下式所示,使用最小二乘法对D
aux
和P
aux
进行求解,最终得到D
aux
和P
aux
的闭式解:
[0024][0025][0026]其中vec(
·
)是向量化算子,d
s
=vec(D
s
),p
s
=vec(P
s
),vec
‑1(
·
)表示反转矢量化,对于和y=u
k
(Y
s
),u
a
表示核大小为a的展开算子,
是带宽度的圆形填充算子;a
D
和a
P
为超参数,下标s表示结构图像和纹理图像通用部分的表示项;
[0027]步骤22:构建SplitNet模块;
[0028]所述SplitNet模块将噪声级σ作为输入,并预测每个阶段的超参数;所述SplitNet模块由2个卷积层(Conv)内核大小为1和一个SoftPlus层组成,确保所有超参数都是正的。
[0029]步骤23:构建InputNet模块对X、D、P进行初始化
[0030]所述InputNet模块将噪声图像Y和噪声级σ作为输出来初始化系数;所述InputNet模块由2个Conv层(每个64通道)和ReLU(Rectified Linear Units)激活函数组成,通过给定输入图像Y,输出初始化系数。
[0031]步骤24:构建LNM

X模块、LNM

D模块、LNM

P模块;
[0032]对于LNM

X模块的构建,通过所述深度解耦字典学习模型可得X在t阶段的求解如下:
[0033][0034]其中β
X
为超参数,可经过SplitNet分解得出;为图像系数的辅助变量在t阶段的值,表示X
s,(t

1)
的值;
[0035]所述LNM

X模块在系数X上学习先验知识,充当隐式正则化器,通过采用U型网络本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于解耦深度字典学习的图像去噪方法,其特征在于,具体包括如下步骤:步骤1,对图像数据进行预处理;步骤2,对解耦深度字典学习模型求解并构建包含InputNet、LNM

X、LNM

D、LNM

P、SplitNet的神经网络模型;步骤3,设置已构建神经网络模型的损耗函数、训练参数;步骤4,将经过预处理的图像输入步骤3设置好的神经网络模型进行参数训练,得到去噪效果较好的网络模型;步骤5,将需要测试的图像输入到步骤4得到的网络模型中,得到去噪后的清晰图像。2.根据权利要求1所述的一种基于解耦深度字典学习的图像去噪方法,其特征在于,所述步骤1具体如下:收集不同的自然图像数据集进行组合,对图像加上高斯白噪声,然后使用现代变分技术将加噪后的图片分解为结构图像和纹理图像,最后将结构图像和纹理图像分别裁剪为128*128大小的图像块。3.根据权利要求2所述的一种基于解耦深度字典学习的图像去噪方法,其特征在于,步骤2中所述深度解耦字典学习模型为:其中N表示使用一组N个训练样本对;Y表示一副加噪后的完整图像;下标1和2分别代表结构图像和纹理图像的表示项;X表示图像的系数矩阵;D表示图像的自适应字典;P表示为每部分图像引入的灵敏度解耦算子;λ表示正则化参数;φ表示系数先验;ψ表示正则化项。4.根据权利要求3所述的一种基于解耦深度字典学习的图像去噪方法,其特征在于,所述步骤2中,对解耦深度字典学习模型中的结构图像及纹理图像(X、D、P、)进行求解的具体方法包括如下步骤,其中结构图像即为X1、D1、P1,纹理图像即为X2、D2、P2,s表示结构图像和纹理图像通用部分的表示项:步骤21:引入辅助变量D
aux
、X
aux
、P
aux
,并对其进行求解;如下式所示,通过快速傅里叶变换有效的求得X
aux
闭式解:式中,F
‑1表示逆FFT,定义F(
·
)是二维傅里叶变换,并让d=F(D)、x
*
=F(X
*
)、p=F(P),表示d的复共轭,表示哈德曼乘积,A

C表示将A的通道维度扩展为C,a
X
是超参数;如下式所示,使用最小二乘法对D
aux
和P
aux
进行求解,最终得到D
aux
和P
aux
的闭式解:
其中vec(
·
)是向量化算子,d
s
=vec(D
s
),p
s
=vec(P
s
),vec
‑1(
·
)表示反转矢量化,对于和y=u
k
(Y
s
),u
a
表示核大小为a的展开算子,是带宽度的圆形填充算子;a
D
和a
P
为超参数,下标s表示结构图像和纹理图像通用部分的表示项;步骤22:构建SplitNet模块;所述SplitNet模块将噪声级σ作为输入,并预测每个阶段的超参数;所述SplitNet模块由2个卷积层Conv内核大小为1和一个SoftPlus层组成,确保所有超参数都是正的;步骤23:构建InputNet模块对X、D、P进行初始化所述InputNet模块将噪声图像Y和噪声级σ作为输出来初始化系数;所述InputNet模块由2个Conv层和ReLU激活函数组成,所述Conv层每个64通道,通过给定输入图像Y,输出初始化系数;步骤24:构建LNM

X模块、LNM

D模块、LNM

P模块;对于LNM

X模块的构建,通过所述深度解耦字典学习模型可得X在t阶段的求解如下:其中β
X
为超参数,可经过SplitNet分解得出;为图像系数的辅助变量在t阶段的值,表示X
s,(t

1)
的值;所述LNM

X模块在系数X上学习先验知识,充当隐式正则化器,通过采用U型网络...

【专利技术属性】
技术研发人员:朱虎李宏博邓丽珍
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1