System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及图像重建,特别是涉及基于扩散模型的眼底彩照修复方法、系统、装置、介质及程序产品。
技术介绍
1、在眼科领域,许多诊断工作依赖于对眼底图像的分析。然而,诊断过程的有效性常常受到视网膜图像质量的限制。低质量的眼底图像不仅给眼科医生带来了巨大的挑战,影响了他们诊断的效率和准确性,还严重削弱了自动视网膜评估系统的性能。这种情况在晶状体混浊、严重白内障、玻璃体混浊或其他障碍物导致图像出现显著缺陷时尤为明显。由于这些因素,在进行诊断时可能会遇到困难,导致误诊或漏诊的风险增加。因此,提升眼底图像的质量对于提高诊断的可靠性和自动评估系统的有效性至关重要。
2、无论是通过医疗专业人员手工标注,还是利用人工智能等自动化方法进行分析,高质量的眼底图像都是至关重要的。这些图像的完整性直接影响到诊断的准确性和可靠性。令人信服的诊断依赖于清晰、详细的图像数据,以便医生能够准确地识别和评估病变区域。在该领域的最新进展中,研究人员大量使用生成对抗网络(gan)和自动编码器(ae)等深度学习技术来恢复或增强眼底图像。这些技术在图像处理和增强方面显示出了巨大的潜力,特别是在风格转移和全局亮度增强方面。然而,当图像遭受重大细节损失时,例如存在广泛的阴影区域,这些方法的效用仍然有限。尽管gan和ae在某些情况下能够改善图像质量,但它们在处理严重受损的图像时,仍然面临挑战,无法完全恢复图像的细节和精度。
技术实现思路
1、鉴于以上所述现有技术的缺点,本申请的目的在于提供基于扩散模型的眼底彩照修复方法、
2、为实现上述目的及其他相关目的,本申请的第一方面提供一种基于扩散模型的眼底彩照修复方法,包括:将若干彩色图像转换为cmyk格式,量化黑色平面以建立动态阈值,应用二值掩模进行形态学操作,选取各图像中最大区域作为掩模以识别最显著的阴影区域,据以构建掩码库;基于所述掩码库为原始图像添加噪声;基于原始图像和噪声图像构建噪声预测模型;基于所述噪声预测模型,训练u-net模型得到用以从噪声图像中恢复出原始图像的扩散模型;使用训练好的扩散模型进行模型推理,以将带阴影的图像重构成不带损失的干净图像。
3、于本申请的第一方面的一些实施例中,所述将若干彩色图像转换为cmyk格式,量化黑色平面以建立动态阈值,应用二值掩模进行形态学操作,选取各图像中最大区域作为掩模以识别最显著的阴影区域,据以构建掩码库,其包括:将若干彩色图像转换为cmyk格式,对cmyk格式中的黑色平面进行量化分析,并根据量化分析结果建立两个用于区分图像中不同区域的动态阈值,据以识别和分离出感兴趣区域的部分;基于两个动态阈值,应用二值掩膜对图像进行形态重建和闭合操作;从进行形态重建和闭合操作后的图像中选择最显著或最大的区域,作为用以表征图像中最显著阴影区域的最终掩膜,据以生成掩码库。
4、于本申请的第一方面的一些实施例中,所述基于两个动态阈值,应用二值掩膜对图像进行形态重建和闭合操作,其包括:利用所述动态阈值对图像应用二值掩膜,以将图像转换为二值图像;对二值图像进行形态重建和闭合操作,形态重建用于恢复被破坏的结构,闭合操作用于消除小的空洞并连接断开的部分。
5、于本申请的第一方面的一些实施例中,基于所述掩码库为原始图像添加噪声;基于原始图像和噪声图像构建噪声预测模型;基于所述噪声预测模型,训练u-net模型得到用以从噪声图像中恢复出原始图像的扩散模型,其包括:从所述掩码库中随机选择一掩码并将其应用于原始图像以生成对应的掩码图像,并仅在掩码图像的掩码区域添加噪声;构建噪声预测模型;所述噪声预测模型用于描述噪声图像和原始图像之间的映射关系;构建u-net模型,并使用所述噪声预测模型来定义损失函数,通过梯度下降算法调整u-net模型的参数,直至最小化损失函数。
6、于本申请的第一方面的一些实施例中,所述修复带有严重黑色阴影的图像的构建过程包括:给定一个有噪声的图像xt,目标是将图像重建到其原始状态x0。前向加噪的扩散过程为:
7、其中,q(xt|xt-1)表示给定前一状态xt-1下状态xt的条件概率分布,它服从均值为以及协方差矩阵为βti的正态分布,正态分布由符号n表示;均值表示当前状态xt是前一状态xt-1的一个缩放版本,缩放因子为协方差矩阵βti中,βt是一个标量,表示过程的噪声水平或不确定性,i是单位矩阵,表示协方差矩阵是对角的,每个维度的方差都是βt。
8、于本申请的第一方面的一些实施例中,u-net模型的学习目标为:u-net模型的损失函数为:其中,表示对未遮罩区域xcond和噪声图像xt的期望值;e(∈,α)表示对噪声∈和参数α的期望值;fθ(xcond,xt,γ)是u-net模型的输出,表示在给定未遮罩区域xcond和噪声图像xt的情况下,模型对噪声的预测,我们定义γ表示数据被保留的比例;表示预测噪声与真实噪声∈之间的lp范数的p次方,该范数用于度量模型预测的噪声与真实噪声之间的差异。
9、为实现上述目的及其他相关目的,本申请的第二方面提供一种基于扩散模型的眼底彩照修复系统,包括:掩码库构建模块,用于将若干彩色图像转换为cmyk格式,量化黑色平面以建立动态阈值,应用二值掩模进行形态学操作,选取各图像中最大区域作为掩模以识别最显著的阴影区域,据以构建掩码库;模型训练模块,用于基于所述掩码库为原始图像添加噪声;基于原始图像和噪声图像构建噪声预测模型;基于所述噪声预测模型,训练u-net模型得到用以从噪声图像中恢复出原始图像的扩散模型;模型推理模块,用于使用训练好的扩散模型进行模型推理,以将带阴影的图像重构成不带损失的干净图像。
10、为实现上述目的及其他相关目的,本申请的第三方面提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述基于扩散模型的眼底彩照修复方法。
11、为实现上述目的及其他相关目的,本申请的第四方面提供一种计算机程序产品,所述计算机程序产品中包括计算机程序代码,当所述计算机程序代码在计算机上运行时,使得所述计算机实现所述基于扩散模型的眼底彩照修复方法。
12、为实现上述目的及其他相关目的,本申请的第五方面提供一种计算机装置/设备/系统/电子终端,包括存储器、处理器及存储在存储器上的计算机程序;所述处理器执行所述计算机程序以实现所述基于扩散模型的眼底彩照修复方法。
13、如上所述,本申请的基于扩散模型的眼底彩照修复方法、系统、装置、介质及程序产品,具有以下有益效果:本申请的技术方案不仅提高了图像处理的精度和效率,还增强了模型的泛化能力和鲁棒性,对于现有的算法(如生成对抗网络或自动编码器)在面对图像遭受重大细节损失时效用有限的情况,本申请能够很好地恢复图像的细节和精度。
本文档来自技高网...【技术保护点】
1.一种基于扩散模型的眼底彩照修复方法,其特征在于,包括:
2.根据权利要求1所述的基于扩散模型的眼底彩照修复方法,其特征在于,所述将若干彩色图像转换为CMYK格式,量化黑色平面以建立动态阈值,应用二值掩模进行形态学操作,选取各图像中最大区域作为掩模以识别最显著的阴影区域,据以构建掩码库,其包括:
3.根据权利要求2所述的基于扩散模型的眼底彩照修复方法,其特征在于,所述基于两个动态阈值,应用二值掩膜对图像进行形态重建和闭合操作,其包括:利用所述动态阈值对图像应用二值掩膜,以将图像转换为二值图像;对二值图像进行形态重建和闭合操作,形态重建用于恢复被破坏的结构,闭合操作用于消除小的空洞并连接断开的部分。
4.根据权利要求1所述的基于扩散模型的眼底彩照修复方法,其特征在于,基于所述掩码库为原始图像添加噪声;基于原始图像和噪声图像构建噪声预测模型;基于所述噪声预测模型,训练U-Net模型得到用以从噪声图像中恢复出原始图像的扩散模型,其包括:
5.根据权利要求4所述的基于扩散模型的眼底彩照修复方法,其特征在于,所述噪声预测模型的构建过程包括:
6.根据权利要求4所述的基于扩散模型的眼底彩照修复方法,其特征在于:
7.一种基于扩散模型的眼底彩照修复系统,其特征在于,包括:
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述基于扩散模型的眼底彩照修复方法。
9.一种计算机程序产品,其特征在于,所述计算机程序产品中包括计算机程序代码,当所述计算机程序代码在计算机上运行时,使得所述计算机实现如权利要求1至6中任一项所述基于扩散模型的眼底彩照修复方法。
10.一种计算机装置,包括存储器、处理器及存储在存储器上的计算机程序,其特征在于,所述处理器执行所述计算机程序以实现权利要求1至6中任一项所述基于扩散模型的眼底彩照修复方法。
...【技术特征摘要】
1.一种基于扩散模型的眼底彩照修复方法,其特征在于,包括:
2.根据权利要求1所述的基于扩散模型的眼底彩照修复方法,其特征在于,所述将若干彩色图像转换为cmyk格式,量化黑色平面以建立动态阈值,应用二值掩模进行形态学操作,选取各图像中最大区域作为掩模以识别最显著的阴影区域,据以构建掩码库,其包括:
3.根据权利要求2所述的基于扩散模型的眼底彩照修复方法,其特征在于,所述基于两个动态阈值,应用二值掩膜对图像进行形态重建和闭合操作,其包括:利用所述动态阈值对图像应用二值掩膜,以将图像转换为二值图像;对二值图像进行形态重建和闭合操作,形态重建用于恢复被破坏的结构,闭合操作用于消除小的空洞并连接断开的部分。
4.根据权利要求1所述的基于扩散模型的眼底彩照修复方法,其特征在于,基于所述掩码库为原始图像添加噪声;基于原始图像和噪声图像构建噪声预测模型;基于所述噪声预测模型,训练u-net模型得到用以从噪声图像中恢复出原...
【专利技术属性】
技术研发人员:董家迪,钱天威,王利生,许迅,
申请(专利权)人:上海市第一人民医院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。