System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 辅助诊断模型训练方法及装置制造方法及图纸_技高网
当前位置: 首页 > 专利查询>清华大学专利>正文

辅助诊断模型训练方法及装置制造方法及图纸

技术编号:43485862 阅读:7 留言:0更新日期:2024-11-29 16:57
本申请公开了一种辅助诊断模型训练方法及装置,该方法包括:构建用于训练第一辅助诊断模型的第一训练数据集;将所述第一训练数据集中的样本输入所述第一辅助诊断模型,通过第一优化函数对所述第一辅助诊断模型进行迭代训练,使所述第一辅助诊断模型符合第一优化目标;将所述第一辅助诊断模型和用于标识所述公开图像的标识信息发送至服务端,以使所述服务端基于所述标识信息和所述第一辅助诊断模型训练第二辅助诊断模型,使所述第二辅助诊断模型符合第二优化目标。该方法能够形成较好的训练效果,有益于降低大尺寸的辅助诊断模型的训练难度。

【技术实现步骤摘要】

本申请涉及机器学习,特别涉及一种辅助诊断模型训练及辅助诊断模型训练装置。


技术介绍

1、基于深度学习(deep learning,dl)的计算机辅助诊断(computer-aideddiagnosis,cad)已经在医疗图像分析上(例如x射线图像分类)取得了优异效果。作为辅助诊断的一种方式,其能够帮助放射科医师提高诊断准确性以及对于图像、疾病解释的一致性,并缓解由于病例差异大以及医师劳累所带来的延迟诊断以及错误诊断。

2、深度学习模型的训练依赖于足够大的有标签数据集。然而,单个医疗机构的医疗样本数量较小,通常难以满足深度学习模型的训练需求。即使大型的医疗机构大量的医疗样本,但医学专家通常也难以足量且时对的医疗样本进行标注。所以,单个医疗机构的医疗样本通常难以满足深度学习模型的训练需求。如果能够对不同医疗机构的有标签医疗样本进行共享,则能够有效增加有标签样本数量。但是受限于患者、机构及国家对隐私保护的要求,一些医疗数据通常无法公开,也不能在不同医疗机构之间分享。

3、联邦学习(federated learning,fl)作为一种强调数据安全和隐私保护的分布式机器学习技术,通过共享机器学习模型参数的方式实现各分散的客户端在不披露隐私数据的前提下,协作训练机器学习模型的效果。但是,常规的联邦学习方法仍然受限于医疗机构的医学样本数量较小,导致医疗机构的客户端的辅助诊断模型无法形成拟合,进行影响到服务端的联合训练模型的训练效果。

4、迁移学习通过寻找已有知识和新知识之间的相似性,能够利用已有知识来学习新知识。具体辅助诊断模型训练场景,迁移学习能够利用公开样本协助客户端的辅助诊断模型对医学样本进行学习。常规的迁移学习方法,通常在相似领域进行迁移。如果已有知识和新知识之间的相似度不够,则迁移结果并不理想。所以,通常需要利用公开的且相似的医疗数据来协助客户端的辅助诊断模型训练。但是,受限于医疗数据的隐私属性,公开的数据集中通常难以获得足够数量的医疗数据,且公开的医疗数据的真实性和数据质量通常难以保证。


技术实现思路

1、有鉴于现有技术中存在的上述问题,本申请提供了一种辅助诊断模型训练方法及辅助诊断模型训练装置。

2、本申请第一方面提供了一种辅助诊断模型训练方法,应用于客户端,包括:

3、构建用于训练第一辅助诊断模型的第一训练数据集;所述第一辅助诊断模型包括第一特征提取网络和第一分类网络;所述第一训练数据集包括客户端的医疗图像、与所述医疗图像相对应的标签、从公开图库中选取的与所述医疗图像相匹配的公开图像,以及与所述公开图像相对应的标签,所述标签用于标识辅助诊断结果;

4、将所述第一训练数据集中的样本输入所述第一辅助诊断模型,通过第一优化函数对所述第一辅助诊断模型进行迭代训练,使所述第一辅助诊断模型符合第一优化目标;所述第一优化目标至少包括对齐第一特征信息和第二特征信息的特征分布,所述第一特征信息包括所述第一特征提取网络从所述医疗图像提取的特征信息,所述第二特征信息包括所述第一特征提取网络从所述公开图像提取的特征信息;

5、将所述第一辅助诊断模型和用于标识所述公开图像的标识信息发送至服务端,以使所述服务端基于所述标识信息和所述第一辅助诊断模型训练第二辅助诊断模型,使所述第二辅助诊断模型符合第二优化目标;所述标识信息用于所述服务端获取所述公开图像并构建第二训练数据集;所述第二辅助诊断模型包括第二特征提取网络和第二分类网络;所述第二优化目标至少包括对齐第三特征信息和第四特征信息的特征分布,所述第三特征信息包括所述服务端基于所述第一特征提取网络从所述公开图像提取的特征信息,所述第四特征信息包括所述服务端基于所述第二特征提取网络从所述公开图像提取的特征信息。

6、在一些实施例中,所述构建用于训练第一辅助诊断模型的第一训练数据集,包括:

7、获取所述客户端的医疗数据,所述医疗数据包括第一医疗图像和与所述第一医疗图像相对应的标签;

8、从公开图库中选取与所述第一医疗图像相匹配的公开图像,并构建所述公开图像与所述第一医疗图像的标签之间的对应关系;

9、基于所述第一医疗图像、所述公开图像及标签,构建所述第一训练数据集。

10、在一些实施例中,所述构建用于训练第一辅助诊断模型的第一训练数据集,包括:

11、获取所述客户端的医疗数据,所述医疗数据包括第一医疗图像、第二医疗图像与所述第一医疗图像相对应的标签;

12、基于所述第一辅助诊断模型,从所述第二医疗图像中选取置信度符合第一阈值的第三医疗图像,生成与所述第三医疗图像相对应的标签;

13、从公开图库中选取与所述第一医疗图像相匹配的公开图像,并构建所述公开图像与所述第一医疗图像的标签之间的对应关系;

14、基于所述第一医疗图像、所述第三医疗图像、所述公开图像及标签,构建所述第一训练数据集。

15、在一些实施例中,所述构建用于训练第一辅助诊断模型的第一训练数据集,还包括:

16、对所述第一医疗图像和/或所述第三医疗图像进行数据增强处理,以增加所述第一训练数据集的样本数量。

17、在一些实施例中,所述从公开图库中选取与所述第一医疗图像相匹配的公开图像,包括:

18、将具有相同标签的一类第一医疗图像与所述公开图库中各类公开图像进行比较,确定该类第一医疗图像与各类公开图像之间数据分布的相似性;

19、选取所述相似性符合第一预设条件的公开图像,作为与该类第一医疗图像相匹配的公开图像。

20、在一些实施例中,所述将具有相同标签的一类第一医疗图像与所述公开图库中各类公开图像进行比较,确定该类第一医疗图像与各类公开图像之间数据分布的相似性,包括:

21、基于具有相同标签的一类第一医疗图像,生成第一数据矩阵;

22、基于所述公开数据库中一类公开图像,生成第二数据矩阵;

23、对所述第一数据矩阵和所述第二数据矩阵进行拼接和转置,形成联合矩阵;

24、对所述联合矩阵进行非负矩阵分解,获取共享基矩阵和系数矩阵;其中,所述系数矩阵包括第一系数矩阵和第二系数矩阵,所述第一系数矩阵和所述第二系数矩阵沿横向拼接能够形成所述系数矩阵,所述第一系数矩阵表征所述共享基矩阵对所述第一数据矩阵的贡献程度,所述第二系数矩阵表征所述共享基矩阵对所述第二数据矩阵的贡献程序;

25、基于所述第一系数矩阵和所述第二系数矩阵之间的相似性,确定该类第一医疗图像与该类公开图像之间的相似性。

26、在一些实施例中,所述第一训练数据集包括源域和目标域,所述源域包括所述公开图像和与所述公开图像相对应的标签,所述目标域包括所述第一医疗图像、所述第三医疗图像,以及与所述第一医疗图像和所述第三医疗图像相对应的标签;

27、所述第一优化函数用于优化所述第一辅助诊断模型的参数,对齐所述第一特征提取网络从所述公开图像和从所述第一医疗本文档来自技高网...

【技术保护点】

1.一种辅助诊断模型训练方法,其特征在于,应用于客户端,包括:

2.根据权利要求1所述的方法,其特征在于,所述构建用于训练第一辅助诊断模型的第一训练数据集,包括:

3.根据权利要求1所述的方法,其特征在于,所述构建用于训练第一辅助诊断模型的第一训练数据集,包括:

4.根据权利要求3所述的方法,其特征在于,所述构建用于训练第一辅助诊断模型的第一训练数据集,还包括:

5.根据权利要求2或3所述的方法,其特征在于,所述从公开图库中选取与所述第一医疗图像相匹配的公开图像,包括:

6.根据权利要求5所述的方法,其特征在于,所述将具有相同标签的一类第一医疗图像与所述公开图库中各类公开图像进行比较,确定该类第一医疗图像与各类公开图像之间数据分布的相似性,包括:

7.根据权利要求3所述的方法,其特征在于,所述第一训练数据集包括源域和目标域,所述源域包括所述公开图像和与所述公开图像相对应的标签,所述目标域包括所述第一医疗图像、所述第三医疗图像,以及与所述第一医疗图像和所述第三医疗图像相对应的标签;

8.根据权利要求3所述的方法,其特征在于,所述方法还包括:

9.一种辅助诊断模型训练方法,其特征在于,应用于服务端,包括:

10.一种辅助诊断模型训练装置,其特征在于,包括:

...

【技术特征摘要】

1.一种辅助诊断模型训练方法,其特征在于,应用于客户端,包括:

2.根据权利要求1所述的方法,其特征在于,所述构建用于训练第一辅助诊断模型的第一训练数据集,包括:

3.根据权利要求1所述的方法,其特征在于,所述构建用于训练第一辅助诊断模型的第一训练数据集,包括:

4.根据权利要求3所述的方法,其特征在于,所述构建用于训练第一辅助诊断模型的第一训练数据集,还包括:

5.根据权利要求2或3所述的方法,其特征在于,所述从公开图库中选取与所述第一医疗图像相匹配的公开图像,包括:

6.根据权利要求5所述的方法,其特征在于,所述将具有...

【专利技术属性】
技术研发人员:刘洋冯晓彬普艳红
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1