一种影像样本数据扩增方法及装置制造方法及图纸

技术编号:37963022 阅读:8 留言:0更新日期:2023-06-30 09:38
本申请涉及人工智能图像处理技术领域,特别是涉及一种影像样本数据扩增方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取影像数据集;构建生成对抗网络模型;使用所述影像数据集将所述生成对抗网络模型训练至收敛,提取出生成对抗网络模型中用于将第一图像样本合成为所述第二图像样本的目标生成网络;利用目标生成网络将影像数据集中的第一图像样本合成为合成第二图像样本,将所述合成图像样本与所述第一图像样本的标注信息配对拼接,得到第三图像样本。采用本方法能够以影像合成的方式使得已标注的影像数据与未标注的影像数据融合,从而实现训练样本数据扩增的目的,提高最终得到的算法模型的准确度。度。度。

【技术实现步骤摘要】
一种影像样本数据扩增方法及装置


[0001]本申请涉及人工智能图像处理
,特别是涉及一种影像样本数据方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]医学影像是指为了医学目的对人体或人体某部分以非侵入的方式取得内部组织影像的技术与处理过程。医学影像在应用中可以用于多种疾病的检查和治疗,能够为医职人员提供极大的便利。其中,电子计算机断层扫描(CT,Computed Tomography)以及核磁共振成像(MRI,Magnetic Resonance Imaging)是医学影像技术的重要组成部分。
[0003]在医学应用中,为了提高影像技术的分析效率,通常会引入人工智能技术来辅助实现基于CT影像的图像分割技术。为了训练一个基于平扫CT影像的肝脏分割人工智能算法模型,在训练前期需要准备大量的人工标注的训练数据。然而在平扫CT下,由于存在肝脏分辨率低、纹理不清晰等问题,人工标注肝脏掩码的难度较大,在时间和人力成本上远高于其他影像模态。相应的,在公开数据库中,大量被专业医师进行人工标注的数据集,通常也为基于增强CT或核磁共振成像的数据集,几乎难以找到可以直接使用的平扫CT肝脏分割影像数据集。
[0004]目前,为了解决基于平扫CT的肝脏器官分割任务中数据获取困难的问题,通常需要在已有数据的基础上对训练样本的总数量进行扩增处理。在人工智能图像分割领域中,传统的训练数据扩增技术仅将人工手动标注的图像进行平移、旋转、拉伸、裁剪、高斯模糊、对比度调整等一系列几何变换或数值变换。通过上述的数据扩增技术可以一定程度上解决模型训练样本缺少的问题然而,目前的训练样本数据扩增方法,存在如下的技术问题:基于几何变换或数值变换的样本数据扩增方法仍然以已有数据为基础,如初始数据量过少,难以对算法模型的训练起到有效的提升作用,导致最终得到的算法模型准确度低,难以在应用于实际的业务场景时得到较好的效果。

技术实现思路

[0005]基于此,有必要针对上述技术问题,提供一种能够以影像合成的方式使得已标注的影像数据与未标注的影像数据融合,替代人工标注的数据,从而实现训练样本数据扩增的目的,提高最终得到的算法模型的准确度的一种影像样本数据扩增方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0006]第一方面,本申请提供了一种影像样本数据扩增方法。所述方法包括:获取影像数据集,所述影像数据集包括经过标注处理的第一图像样本以及未经标注处理的第二图像样本;构建生成对抗网络模型,所述生成对抗网络模型包括第一阶段网络,所述第一阶段网络包括成对设置的生成网络以及判别网络,所述生成网络用于实现所述第一图像样本
与所述第二图像样本之间的相互生成转化,与所述生成网络对应的所述判别网络用于对所述生成网络输出的结果进行真伪判别;使用所述影像数据集将所述生成对抗网络模型训练至收敛,提取出所述生成对抗网络模型中用于将所述第一图像样本合成为所述第二图像样本的目标生成网络;利用所述目标生成网络将所述影像数据集中的第一图像样本合成为合成第二图像样本,将所述合成第二图像样本与所述第一图像样本的标注信息配对拼接,得到第三图像样本。
[0007]在其中一个实施例中,所述生成对抗网络模型包括第一生成网络、第二生成网络、第一判别网络以及第二判别网络,所述使用所述影像数据集将所述生成对抗网络模型训练至收敛包括:通过所述第一生成网络,基于所述第一图像样本以及合成第一图像样本生成合成第二图像样本;通过所述第一判别网络对所述合成第二图像样本进行真伪判别,得到第一判别结果;通过所述第二生成网络,基于所述第二图像样本以及所述合成第二图像样本生成所述合成第一图像样本;通过所述第二判别网络对所述合成第一图像样本进行真伪判别,得到第二判别结果;所述第一生成网络根据所述第一判别结果进行迭代,所述第二生成网络根据所述第二判别结果进行迭代。
[0008]在其中一个实施例中,所述第一生成网络根据所述第一判别结果进行迭代,所述第二生成网络根据所述第二判别结果进行迭代包括:获取判别损失,在迭代中基于所述判别损失更新所述第一生成网络以及第二生成网络的参数,所述判别损失包括第一网络判别损失、第二网络判别损失、循环一致损失以及全局损失。
[0009]在其中一个实施例中,所述使用所述影像数据集将所述生成对抗网络模型训练至收敛包括:对所述影像数据集中的图像样本进行预处理,所述预处理包括降采样处理,得到降采样影像数据集,基于所述降采样影像数据集将所述生成对抗网络模型训练至收敛。
[0010]在其中一个实施例中,所述生成对抗网络包括第二阶段网络,所述第二阶段网络包括第三生成网络以及第三判别网络,所述方法包括:通过所述第三生成网络,基于所述降采样影像数据集中经降采样处理后的降采样第二图像样本,生成符合所述第二图像样本格式的复原第二图像样本;通过所述第三判别网络,对所述复原第二图像样本进行真伪判别;基于所述第三判别网络的输出结果对所述第三生成网络进行迭代直至收敛。
[0011]在其中一个实施例中,所述利用所述目标生成网络将所述影像数据集中的第一图像样本合成为合成第二图像样本包括:将所述目标生成网络与收敛后的所述第三生成网络拼接,得到影像合成模型;利用所述目标生成网络将所述降采样影像数据集中的降采样第一图像样本合成
为降采样合成图像样本;利用所述第三生成网络将所述降采样合成图像样本合成为符合所述第二图像样本格式的所述合成第二图像样本。
[0012]第二方面,本申请还提供了一种影像标注方法。所述方法包括:获取待标注影像;将所述待标注影像输入至影像分割模型,通过所述影像分割模型获取与所述待标注影像对应的标注信息,所述影像分割模型基于影像样本集训练得到,所述影像样本集包括第三图像样本,所述第三图像样本通过第一方面中任意一项所述的一种影像样本数据扩增方法得到。
[0013]第三方面,本申请还提供了一种影像样本数据扩增装置。所述装置包括:数据获取模块,用于获取影像数据集,所述影像数据集包括经过标注处理的第一图像样本以及未经标注处理的第二图像样本;网络构建模块,用于构建生成对抗网络模型,所述生成对抗网络模型包括第一阶段网络,所述第一阶段网络包括成对设置的生成网络以及判别网络,所述生成网络用于实现所述第一图像样本与所述第二图像样本之间的相互生成转化,与所述生成网络对应的所述判别网络用于对所述生成网络输出的结果进行真伪判别;网络训练模块,用于使用所述影像数据集将所述生成对抗网络模型训练至收敛,提取出所述生成对抗网络模型中用于将所述第一图像样本合成为所述第二图像样本的目标生成网络;样本扩增模块,用于利用所述目标生成网络将所述影像数据集中的第一图像样本合成为合成第二图像样本,将所述合成第二图像样本与所述第一图像样本的标注信息配对拼接,得到第三图像样本。
[0014]在其中一个实施例中,所述网络训练模块包括:第一生成网络模块,用于通过所述第一生成网络,基于所述第一图像样本以及合成第一图像样本生成合成第二图像样本;第一判别网络模块,用于通过所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种影像样本数据扩增方法,其特征在于,所述方法包括:获取影像数据集,所述影像数据集包括经过标注处理的第一图像样本以及未经标注处理的第二图像样本;构建生成对抗网络模型,所述生成对抗网络模型包括第一阶段网络,所述第一阶段网络包括成对设置的生成网络以及判别网络,所述生成网络用于实现所述第一图像样本与所述第二图像样本之间的相互生成转化,与所述生成网络对应的所述判别网络用于对所述生成网络输出的结果进行真伪判别;使用所述影像数据集将所述生成对抗网络模型训练至收敛,提取出所述生成对抗网络模型中用于将所述第一图像样本合成为所述第二图像样本的目标生成网络;利用所述目标生成网络将所述影像数据集中的第一图像样本合成为合成第二图像样本,将所述合成第二图像样本与所述第一图像样本的标注信息配对拼接,得到第三图像样本。2.根据权利要求1所述的方法,其特征在于,所述生成对抗网络模型包括第一生成网络、第二生成网络、第一判别网络以及第二判别网络,所述使用所述影像数据集将所述生成对抗网络模型训练至收敛包括:通过所述第一生成网络,基于所述第一图像样本以及合成第一图像样本生成合成第二图像样本;通过所述第一判别网络对所述合成第二图像样本进行真伪判别,得到第一判别结果;通过所述第二生成网络,基于所述第二图像样本以及所述合成第二图像样本生成所述合成第一图像样本;通过所述第二判别网络对所述合成第一图像样本进行真伪判别,得到第二判别结果;所述第一生成网络根据所述第一判别结果进行迭代,所述第二生成网络根据所述第二判别结果进行迭代。3.根据权利要求2所述的方法,其特征在于,所述第一生成网络根据所述第一判别结果进行迭代,所述第二生成网络根据所述第二判别结果进行迭代包括:获取判别损失,在迭代中基于所述判别损失更新所述第一生成网络以及第二生成网络的参数,所述判别损失包括第一网络判别损失、第二网络判别损失、循环一致损失以及全局损失。4.根据权利要求1所述的方法,其特征在于,所述使用所述影像数据集将所述生成对抗网络模型训练至收敛包括:对所述影像数据集中的图像样本进行预处理,所述预处理包括降采样处理,得到降采样影像数据集,基于所述降采样影像数据集将所述生成对抗网络模型训练至收敛。5.根据权利要求4所述的方法,其特征在于,所述生成对抗网络包括第二阶段网络,所述第二阶段网络包括第三生成网络以及第三判别网络,所述方法包括:通过所述第三生成网络,基于所述降采样影像数据集中经降采样处理后的降采样第二图像样本,生成符合所述第二图像样本格式的复原第二图像样本;通过所述第三判别网络,对所述复原第二图像样本进行真伪判别;基于所述第三判别网络的输出结果对所述第三生成网络进行迭代直至收敛。6.根据权利要求5所述的方法,其特征在于,所...

【专利技术属性】
技术研发人员:冯奕乐孙步梁
申请(专利权)人:苏州恒瑞宏远医疗科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1