一种基于扩散模型的水下图像增强方法、装置及介质制造方法及图纸

技术编号：44563482 阅读：1 留言：0更新日期：2025-03-11 14:22

本发明专利技术涉及一种基于扩散模型的水下图像增强方法、装置及介质，其中方法包括以下步骤：获取退化图像；将退化图像分别输入教师模型和学生模型；计算教师模型和学生模型的轨迹；输入退化图像至反射估计模块，计算反射图；通过扩散模型的正向扩散过程，将反射图映射为教师模型的轨迹修正量，并以预设的权重将轨迹修正量和教师模型的轨迹逐位相加，修正教师模型的轨迹；计算修正后的教师模型轨迹和学生模型轨迹的蒸馏损失，冻结教师模型的参数，基于梯度下降优化学生模型参数；利用优化后的学生模型对退化图像进行图像增强，得到增强后的水下图像。与现有技术相比，本发明专利技术具有在降低计算量的同时提升了模型在细节和纹理回复方面的性能等优点。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图像增强，尤其是涉及一种基于扩散模型的水下图像增强方法、装置及介质。

技术介绍

1、图像增强技术是一种通过改善图像的亮度、对比度、清晰度等参数，使图像在视觉上更加清晰、细节更加丰富的处理方法。这项技术在计算机视觉、图像处理、自动驾驶、医疗影像、监控等多个领域具有广泛的应用。现有的图像增强技术可以分为两大类：传统方法和基于深度学习的方法。传统方法包括直方图均衡、拉普拉斯变换、滤波等，这些方法通常通过直接调整图像的亮度和对比度来增强视觉效果。基于深度学习的方法得通过卷积神经网络等模型自动学习图像中的特征，并进行自适应增强处理。扩散模型是一种迭代式的深度学习方法，近年来在图像生成领域展现出强大的性能，在图像增强领域也有一些应用。

2、基于扩散模型的方法通常通过利用扩散模型作为骨干网络，将原始图像作为条件输入，输出增强后的图像。为了提升增强效果，现有的基于扩散模型的方法在图像增强过程中效率较低，需要大量的采样步数进行迭代，通常需要25步或更多的迭代才能在亮度、对比度、色彩还原等方面得到较好的图像质量，消耗大量计算资源，限制了实际应用。

3、而传统蒸馏技术在压缩采样步数时，常常伴随显著的性能下降，导致增强的图像质量不佳，细节如纹理、结构和颜色的恢复效果较差。

4、因此，目前缺少一种能够兼顾计算资源和恢复效果的图像增强方法。

技术实现思路

1、本专利技术的目的是为了提供一种基于扩散模型的水下图像增强方法、装置及介质，通过引入轨迹蒸馏技术减少扩散

2、本专利技术的目的可以通过以下技术方案来实现：

3、一种基于扩散模型的水下图像增强方法，包括以下步骤：

4、步骤1)获取退化图像，所述退化图像为待增强的低质量水下图像；

5、步骤2)将退化图像分别输入教师模型和学生模型，其中，所述教师模型为预训练的条件扩散模型，所述学生模型与教师模型的架构相同；

6、步骤3)计算教师模型和学生模型的轨迹；

7、步骤4)输入退化图像至反射估计模块，计算反射图；

8、步骤5)通过扩散模型的正向扩散过程，将反射图映射为教师模型的轨迹修正量，并以预设的权重将轨迹修正量和教师模型的轨迹逐位相加，修正教师模型的轨迹；

9、步骤6)计算修正后的教师模型轨迹和学生模型轨迹的蒸馏损失，冻结教师模型的参数，基于梯度下降优化学生模型参数；

10、步骤7)利用优化后的学生模型对退化图像进行图像增强。

11、所述教师模型和学生模型采用基于sr3的扩散模型架构，其扩散过程表示为；

12、

13、其中，xt表示扩散模型的中间带噪结果，x0表示正常图像的真值，∈表示标准分布的高斯噪声，表示噪声调度表在第t步的值，σt表示第t步噪声的方差。

14、所述步骤3)中，采用一阶常微分方程采样器作为轨迹解码器来计算教师模型和学生模型的轨迹。

15、所述教师模型从第t步到第s步的轨迹解码器gη表示为：

16、

17、采用轨迹解码器解码得到的教师模型从第t步到第u步，再到第s步的轨迹表示为：

18、

19、其中，xt表示扩散模型的中间带噪结果，y表示退化图像，σt、σs分别表示第t、s步噪声的方差，分别表示噪声调度表在第t、s步的值，∈η表示教师模型输出，t,u,s均为扩散模型的中间步，且0<t<u<s<t，t为扩散模型的总步数，η表示教师模型的模型参数。

20、所述反射估计模块对输入的退化图像执行以下步骤：

21、步骤41)通过高斯滤波估计噪声图：z′＝|y-ψ(y)|，其中，ψ表示高斯模糊操作，z′表示估计的噪声图；

22、步骤42)基于退化图像rgb三通道中的最大通道值估计光照分布h′；

23、步骤43)基于retinex模型计算退化图像的反射分量，得到反射图：

24、

25、其中，表示反射图。

26、所述步骤5)具体为：

27、通过扩散模型的正向扩散过程，将反射图映射为教师模型的轨迹修正量：

28、

29、以预设的权重wrefine将轨迹修正量和教师模型的轨迹逐位相加，修正教师模型的轨迹：

30、

31、

32、其中，xtarget为教师模型输出的修正后的轨迹。

33、所述学生模型从第t步到第s步的轨迹解码器gθ表示为：

34、

35、采用轨迹解码器解码得到的学生模型从第t步到第s步的轨迹表示为：

36、

37、则，学生模型输出的轨迹xeps为：

38、

39、其中，xt表示扩散模型的中间带噪结果，y表示退化图像，σt、σs分别表示第t、s步噪声的方差，分别表示噪声调度表在第t、s步的值，∈θ表示学生模型输出，t,s均为扩散模型的中间步，且0<t<s<t，t为扩散模型的总步数，θ表示学生模型的模型参数。

40、所述蒸馏损失表示为：

41、ldistill＝λ(t)||xtarget-xest||

42、其中，xtarget为教师模型输出的修正后的轨迹，xeps为学生模型输出的轨迹，

43、

44、σt表示第t步噪声的方差，表示噪声调度表在第t步的值。

45、一种基于扩散模型的水下图像增强装置，包括存储器、处理器，以及存储于所述存储器中的程序，所述处理器执行所述程序时实现如上所述的方法。

46、一种存储介质，其上存储有程序，所述程序被执行时实现如上所述的方法。

47、与现有技术相比，本专利技术具有以下有益效果：

48、(1)本专利技术通过轨迹蒸馏技术将原需多步迭代的模型压缩至仅需2步即可实现高质量的图像增强，显著提升了水下图像增强任务的效率，同时确保了较优的图像增强效果。

49、(2)本专利技术通过引入反射估计模块，利用图像的反射信息优化扩散模型的轨迹，减少了蒸馏过程中的性能损耗，大幅提升了蒸馏后的模型性能，使其在降低计算量的同时，仍能在水下图像的细节和纹理恢复方面取得优异的效果。

本文档来自技高网...

【技术保护点】

1.一种基于扩散模型的水下图像增强方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于扩散模型的水下图像增强方法，其特征在于，所述教师模型和学生模型采用基于SR3的扩散模型架构，其扩散过程表示为；

3.根据权利要求1所述的一种基于扩散模型的水下图像增强方法，其特征在于，所述步骤3)中，采用一阶常微分方程采样器作为轨迹解码器来计算教师模型和学生模型的轨迹。

4.根据权利要求3所述的一种基于扩散模型的水下图像增强方法，其特征在于，所述教师模型从第t步到第s步的轨迹解码器Gη表示为：

5.根据权利要求4所述的一种基于扩散模型的水下图像增强方法，其特征在于，所述反射估计模块对输入的退化图像执行以下步骤：

6.根据权利要求5所述的一种基于扩散模型的水下图像增强方法，其特征在于，所述步骤5)具体为：

7.根据权利要求3所述的一种基于扩散模型的水下图像增强方法，其特征在于，所述学生模型从第t步到第s步的轨迹解码器Gθ表示为：

8.根据权利要求1所述的一种基于扩散模型的水下图像增强方法，其特征在于，所述蒸馏损失表示为：

9.一种基于扩散模型的水下图像增强装置，包括存储器、处理器，以及存储于所述存储器中的程序，其特征在于，所述处理器执行所述程序时实现如权利要求1-8中任一所述的方法。

10.一种存储介质，其上存储有程序，其特征在于，所述程序被执行时实现如权利要求1-8中任一所述的方法。

...

【技术特征摘要】

1.一种基于扩散模型的水下图像增强方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于扩散模型的水下图像增强方法，其特征在于，所述教师模型和学生模型采用基于sr3的扩散模型架构，其扩散过程表示为；

4.根据权利要求3所述的一种基于扩散模型的水下图像增强方法，其特征在于，所述教师模型从第t步到第s步的轨迹解码器gη表示为：

5.根据权利要求4所述的一种基于扩散模型的水下图像增强方法，其特征在于，所述反射估计模块对输入的退化图像执行...

【专利技术属性】
技术研发人员：赵斌，兰冠州，李学龙，
申请(专利权)人：上海人工智能创新中心，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人