System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于深度学习的儿童中医舌诊图像色彩自动校正方法及系统技术方案_技高网
当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于深度学习的儿童中医舌诊图像色彩自动校正方法及系统技术方案

技术编号:43994458 阅读:1 留言:0更新日期:2025-01-10 20:14
本发明专利技术公开了一种基于深度学习的儿童中医舌诊图像色彩自动校正方法及系统,包括:(1)拍摄包含色彩标准卡的舌诊图像,收集色彩标准卡基准图像;(2)构建改进的GAN模型,包含生成器和判别器;生成器在训练过程中,负责接收一个随机噪声向量作为输入,并生成一个与色彩校正后的舌诊图像相似的图像;判别器负责接收生成器生成的舌诊图像,并将图中的色彩标准卡与色彩标准卡基准图像进行对比,用于区分真实色彩的舌诊图像和色彩校正后的舌诊图像;(3)对GAN模型进行训练;(4)将待校正的包含色彩标准卡的舌诊图像输入生成器中,输出校正后的舌诊图像。利用本发明专利技术,可以对舌诊图像进行色彩校正,生成如实际肉眼所见的舌诊图像色彩。

【技术实现步骤摘要】

本专利技术属于图像校正领域,尤其是涉及一种基于深度学习的儿童中医舌诊图像色彩自动校正方法及系统


技术介绍

1、中医诊法包括望、闻、问、切四诊,舌诊是中医望诊的重要组成部分,舌质、舌苔、舌体的变化能够充分反应小儿体内气血阴阳变化及疾病转归。随着中医药现代化研究发展及互联网医疗兴起,中医舌诊标准化、客观化乃至智能化的需求正在迅猛提升。

2、中医舌诊仪可以通过拍摄患儿舌影像,形成中医师所需舌诊图像数据,从而达到舌诊标准化辅助诊断。但市场上舌诊仪良莠不齐,体积较大不易移动,只适用于线下医疗机构诊疗,且价格昂贵,难以满足日趋增长的线上、线下儿童舌诊拍摄需求。目前的医疗机构线上与线下诊疗大多利用手机或数码相机拍摄舌诊图像。但由于环境和照明条件的差异,拍摄的舌诊图像色彩很难展现出肉眼所能看到的实际图像色彩,因此需要一种方法能对这些舌诊图像进行色彩校正。

3、计算机视觉技术常用于图像快速智能处理领域,如图像增强、图像生成和超分辨率重建,计算机视觉模拟了人的视觉机制,具有生成速度快、成本低的优点。近年来,随着深度学习在计算机视觉领域的应用,特别是在医学影像领域取得了突破性的进展,生成对抗网络(gan,generative adversarial networks)在图像生成领域具有广泛应用,能够生成逼真的图像样本,如人脸、自然风景或动物等。其图像生成能力可以生成以假乱真的图片。gan还可以用于图像编辑,如目标提取、图像修复和增强等。例如,将黑白照片转换为彩色照片,或将低分辨率图像转换为高分辨率图像。

4、然而,现有的生成对抗网络并不能直接用于儿童舌诊图像色彩校正,主要存在以下问题:

5、数据问题:儿童舌诊图像数据稀缺且特异性高,限制了gan模型的训练效果和泛化能力。

6、精确性要求:舌诊图像色彩校正需高度精确,而gan模型在色彩生成上的不稳定性难以满足此要求。

7、病理特征保留:gan在重构图像时可能模糊或改变病理特征,影响诊断准确性。

8、可解释性与透明度:gan模型复杂,难以直观理解,不符合医疗领域的可解释性和透明度要求。

9、资源与时间成本:gan训练需要大量计算资源和时间,对医疗资源紧张的机构构成障碍。

10、跨域适应性:不同拍摄条件和个体差异导致图像差异大,gan模型难以适应,影响校正效果的一致性和稳定性。


技术实现思路

1、本专利技术提供了一种基于深度学习的儿童中医舌诊图像色彩自动校正方法及系统,可以对舌诊图像进行色彩校正,生成如实际肉眼所见的舌诊图像色彩,辅助中医师进行儿童舌诊辨识。

2、一种基于深度学习的儿童中医舌诊图像色彩自动校正方法,包括以下步骤:

3、(1)拍摄包含色彩标准卡的舌诊图像,同时,收集色彩标准卡基准图像;

4、(2)构建改进的gan模型,所述的gan模型包含生成器和判别器;

5、其中,生成器在训练过程中,负责接收一个随机噪声向量作为输入,并且向生成器中注入先验知识,由生成器生成一个与色彩校正后的舌诊图像相似的图像;

6、判别器负责接收生成器生成的图像,并将图中的色彩标准卡与色彩标准卡基准图像进行对比,输出一个概率值,用于区分真实色彩的舌诊图像和色彩校正后的舌诊图像;

7、(3)训练一个教师模型,在正向传播过程中,向教师模型中输入色彩标准卡基准图像,并逐步向该图像中添加高斯噪声,直到图像完全转化为随机噪声;在反向传播过程中,教师模型则通过神经网络学习每一步的噪声分布,从随机噪声中逐步去除噪声,恢复出原始的包含色彩标准卡的图像;

8、利用步骤(1)的图像数据对gan模型进行训练,训练过程中,教师模型与gan网络是并行的网络,通过权值共享技术使gan模型模仿教师模型在特征空间中的表现,从而获取到与教师模型相似的特征提取能力;

9、(4)gan模型训练完毕后,将待校正的包含色彩标准卡的舌诊图像输入生成器中,输出色彩校正后的舌诊图像。

10、生成器的具体结构如下:

11、生成器根据输入的随机噪声和先验知识,通过reshape操作将其映射为一个形状为4×4×1024的张量;接下来,通过4个反卷积层和cbam块的组合层进行特征提取;每个反卷积层的卷积核大小均为4×4、步长均设置为2、padding=1,这些层将输入的随机噪声映射到数据空间,并生成逼真的图像样本;图像在每次反卷积结束后输入批归一化层层,并使用relu函数作为激活函数以加快模型收敛速度和引入非线性因素,最后一层使用tanh函数进行激活,生成为一个3通道64×64的图像。

12、先验知识的获取过程如下:,先利用nnunet网络模型对舌诊图像中的色彩标准卡进行分割,从分割后的色彩标准卡中精确提取出每一种色彩的直方图信息;将这些直方图信息与标准的色彩卡数据库进行详尽比对,记录下所有色彩间的差异值,并以张量的形式进行保存;最终,这些包含色彩差异信息的张量被作为先验知识注入到生成器中。

13、判别器的具体结构如下:

14、判别器接收一个3通道64×64的图像作为输入,通过4个卷积层和cbam块的组合层逐步减小特征图的尺寸,每个卷积层的卷积核大小均为4×4、步长均设置为2、padding=1,同时通道数逐步增加分别为128、256、512、1024,最后一层为全连接层,对输入特征图进行向量化,并使用sigmoid非线性激活函数得到输入样本是真实数据的概率。

15、cbam块包括通道注意力模块和空间注意力模块,通道注意力和空间注意力通过串联的方式进行组合。

16、步骤(3)中,对gan模型进行训练的过程中,定义wassertein作为损失函数,其中,生成器的损失基于生成的舌诊图像中色彩标准卡与色彩标准卡基准图像之间的差异来计算,而判别器的损失则基于其判断输入舌诊图像真实性的准确性来计算。

17、训练过程中,生成器采用随机梯度下降算法为优化算法,初始学习率设为0.002,动量为0.75,权重衰减为1e-4;判别器型使用adam优化器,初始学习率为0.001,其他超参数与生成器相同;在网络训练时,设置批量大小为20,周期为50,通过不断迭代,直到gan模型达到一个稳定的状态。

18、一种基于深度学习的儿童中医舌诊图像色彩自动校正系统,包括存储器和一个或多个处理器,所述存储器中存储有可执行代码,所述一个或多个处理器执行所述可执行代码时,用于实现上述儿童中医舌诊图像色彩自动校正方法。

19、与现有技术相比,本专利技术具有以下有益效果:

20、1、高精度校正:通过深度学习技术,提升色彩校正的精确度,减少人为误差。

21、2、强鲁棒性:适应不同光照、设备和拍摄角度,保持稳定的校正效果。

22、3、高度自动化:实现全自动处理,减轻医生负担,提高诊断效率

23、4、普及化应用:便于普通用户使用,促进中医舌诊的普及。...

【技术保护点】

1.一种基于深度学习的儿童中医舌诊图像色彩自动校正方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于深度学习的儿童中医舌诊图像色彩自动校正方法,其特征在于,生成器的具体结构如下:

3.根据权利要求2所述的基于深度学习的儿童中医舌诊图像色彩自动校正方法,其特征在于,先验知识的获取过程如下:先利用nnUnet网络模型对舌诊图像中的色彩标准卡进行分割,从分割后的色彩标准卡中精确提取出每一种色彩的直方图信息;将这些直方图信息与标准的色彩卡数据库进行比对,记录下所有色彩间的差异值,并以张量的形式进行保存;最终,这些包含色彩差异信息的张量被作为先验知识注入到生成器中。

4.根据权利要求1所述的基于深度学习的儿童中医舌诊图像色彩自动校正方法,其特征在于,判别器的具体结构如下:

5.根据权利要求2或4所述的基于深度学习的儿童中医舌诊图像色彩自动校正方法及系统,其特征在于,CBAM块包括通道注意力模块和空间注意力模块,通道注意力和空间注意力通过串联的方式进行组合。

6.根据权利要求1所述的基于深度学习的儿童中医舌诊图像色彩自动校正方法,其特征在于,步骤(3)中,对GAN模型进行训练的过程中,定义Wassertein作为损失函数,其中,生成器的损失基于生成的舌诊图像中色彩标准卡与色彩标准卡基准图像之间的差异来计算,而判别器的损失则基于其判断输入舌诊图像真实性的准确性来计算。

7.根据权利要求6所述的基于深度学习的儿童中医舌诊图像色彩自动校正方法,其特征在于,训练过程中,生成器采用随机梯度下降算法为优化算法,初始学习率设为0.002,动量为0.75,权重衰减为1e-4;判别器型使用Adam优化器,初始学习率为0.001,其他超参数与生成器相同;在网络训练时,设置批量大小为20,周期为50,通过不断迭代,直到GAN模型达到一个稳定的状态。

8.一种基于深度学习的儿童中医舌诊图像色彩自动校正系统,其特征在于,包括存储器和一个或多个处理器,所述存储器中存储有可执行代码,所述一个或多个处理器执行所述可执行代码时,用于实现权利要求1-7中任一项所述的儿童中医舌诊图像色彩自动校正方法。

...

【技术特征摘要】

1.一种基于深度学习的儿童中医舌诊图像色彩自动校正方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于深度学习的儿童中医舌诊图像色彩自动校正方法,其特征在于,生成器的具体结构如下:

3.根据权利要求2所述的基于深度学习的儿童中医舌诊图像色彩自动校正方法,其特征在于,先验知识的获取过程如下:先利用nnunet网络模型对舌诊图像中的色彩标准卡进行分割,从分割后的色彩标准卡中精确提取出每一种色彩的直方图信息;将这些直方图信息与标准的色彩卡数据库进行比对,记录下所有色彩间的差异值,并以张量的形式进行保存;最终,这些包含色彩差异信息的张量被作为先验知识注入到生成器中。

4.根据权利要求1所述的基于深度学习的儿童中医舌诊图像色彩自动校正方法,其特征在于,判别器的具体结构如下:

5.根据权利要求2或4所述的基于深度学习的儿童中医舌诊图像色彩自动校正方法及系统,其特征在于,cbam块包括通道注意力模块和空间注意力模块,通道注意力和空间注意力通过串联的方式进行组合。

6.根据...

【专利技术属性】
技术研发人员:俞刚黄坚虞念成吴芳
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1