结节检测及其模型训练的方法和装置以及电子设备制造方法及图纸

技术编号:22187563 阅读:36 留言:0更新日期:2019-09-25 04:03
本发明专利技术揭示了一种结节检测及其模型训练的方法和装置、计算机可读存储介质以及电子设备。所述结节检测的模型训练方法包括:基于已标注结节位置的训练图像序列,获取包含结节的正样例和不包含结节的负样例,并对所述正样例和负样例进行扰动处理;使用卷积神经网络CNN模型对所述扰动处理前后的正样例和负样例进行特征提取,并分别获取正特征相似度损失和负特征损失;以及基于所述正特征相似度损失和负特征损失的联合损失训练所述CNN模型。基于本发明专利技术实施例的方案,通过在CNN模型的训练中引入正特征相似度损失和负特征损失,能避免模型在高噪音数据下出现过拟合的情况,使得基于训练好的模型提取的特征向量有更强的辨别力。

Nodule detection and its model training methods and devices and electronic equipment

【技术实现步骤摘要】
结节检测及其模型训练的方法和装置以及电子设备
本专利技术涉及计算机
,特别涉及一种结节检测及其模型训练的方法和装置、计算机可读存储介质以及电子设备。
技术介绍
目前在医疗领域,对诸如肺结节和甲状腺结节等结节的研究,日益引起广泛关注。通说认为,结节是癌症最重要的早期征象之一,根据结节的病变特征能够推断出病灶特性。由于结节的大小、形状以及密度等特征的不确定性,即使基于清晰的CT图像,传统的医学检测方法难以满足肺结节检测精确度的需求。近年来,随着人工智能和深度学习算法的发展,也推动图像处理的相关领域产生巨大变革。医疗诊断中的图像处理也越来越多的涉足其中,将基于大数据的深度学习应用于结节诊断中,对于充分利用医疗资源、缓解医生诊断压力有着重大意义。利用深度神经网络提取CT图像中的抽象特征,与人工手动提取的特征相比,能够更客观的表征图像自身的特性,避免人工主观因素在不同环境中造成不同程度的影响,因此日渐成为结节检测方法的主流。同时,为了结合CT图像的三维属性,相关技术中通常基于3D卷积神经网络(ConvolutionalNeuralNetwork,CNN)来进行结节的检测。与2D模型相比,3DCNN模型的复杂度要更大,而且不像前者那样可利用已有的2DCNN模型(例如利用ImageNet开放数据库训练的模型)作为预训练参数,这意味着后者的训练难度也更大。已有的用于结节检测的3DCNN模型,在训练数据较大的情况下,容易出现对训练数据的过拟合,造成模型的实际检测效果不佳。
技术实现思路
为了解决相关技术中结节检测模型实际效果不佳的问题,本专利技术提供了一种结节检测及其模型训练的方法和装置、计算机可读存储介质以及电子设备。根据本专利技术的实施例,提供一种结节检测的模型训练方法,所述方法包括:基于已标注结节位置的训练图像序列,获取包含结节的正样例和不包含结节的负样例,并对所述正样例和负样例进行扰动处理;使用卷积神经网络CNN模型对所述扰动处理前后的正样例和负样例进行特征提取,并分别获取正特征相似度损失和负特征损失;以及基于所述正特征相似度损失和负特征损失的联合损失训练所述CNN模型。根据本专利技术的实施例,提供一种结节检测方法,包括:使用卷积神经网络CNN模型对采集的图像序列提取特征向量,所述CNN模型根据如上所述的结节检测的模型训练方法训练得到;以及基于所述提取的特征向量进行结节检测。根据本专利技术的实施例,提供一种结节检测的模型训练装置,包括:样本生成模块,设置为基于已标注结节位置的训练图像序列,获取包含结节的正样例和不包含结节的负样例,并对所述正样例和负样例进行扰动处理;特征提取模块,设置为使用卷积神经网络CNN模型对所述扰动处理前后的正样例和负样例进行特征提取,并分别获取正特征相似度损失和负特征损失;以及模型训练模块,设置为基于所述正特征相似度损失和负特征损失的联合损失训练所述CNN模型。根据本专利技术的实施例,提供一种结节检测装置,包括:提取模块,设置为使用卷积神经网络CNN模型对采集的图像序列提取特征向量,所述CNN模型根据如上所述的结节检测的模型训练装置训练得到;以及检测模块,设置为基于所述提取的特征向量进行结节检测。根据本专利技术的实施例,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的结节检测的模型训练方法或者如上所述的结节检测方法。根据本专利技术的实施例,提供一种电子设备,包括:处理器;以及存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如上所述的结节检测的模型训练方法或者如上所述的结节检测方法。本专利技术的实施例提供的技术方案可以包括以下有益效果:基于本专利技术实施例提供的模型训练及结节检测方案,通过在CNN模型的训练中引入正特征相似度损失和负特征损失,能避免模型在高噪音数据下出现过拟合的情况,使得基于训练好的模型提取的特征向量有更强的辨别力,从而提高结节检测识别的性能。应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本专利技术。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并于说明书一起用于解释本专利技术的原理。图1示出了可以应用本专利技术实施例的模型训练方法或装置、或者结节检测方法或装置的示例性系统架构的示意图。图2示出了适于用来实现本专利技术实施例的电子设备的计算机系统的结构示意图。图3是根据一示例性实施例示出的一种结节检测的模型训练方法的流程图。图4是根据一示例性实施例示出的增强处理示意图。图5是图3所示实施例中步骤330的一个示例的流程示意图。图6是根据另一示例性实施例示出的一种结节检测的模型训练方法的流程图。图7是图6所示实施例的基础网络结构示意图。图8是根据一示例性实施例示出的一种结节检测方法的流程图。图9是根据一示例性实施例示出的一种结节检测的模型训练装置的框图。图10是根据另一示例性实施例示出的一种结节检测的模型训练装置的框图。图11是根据一示例性实施例示出的一种结节检测装置的框图。具体实施方式现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本专利技术将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本专利技术的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本专利技术的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本专利技术的各方面。附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。图1示出了可以应用本专利技术实施例的结节检测的模型训练方法或装置、或者结节检测方法或装置的示例性系统架构100的示意图。如图1所示,系统架构100可以包括终端设备101、102、103中的一种或多种,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群等。用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、便携式计算机和台式计算机等等。服务器105可以是提供各种服务的服务器。例如,用户利用终本文档来自技高网...

【技术保护点】
1.一种用于结节检测的模型训练方法,其特征在于,所述方法包括:基于已标注结节位置的训练图像序列,获取包含结节的正样例和不包含结节的负样例,并对所述正样例和负样例进行扰动处理;使用卷积神经网络CNN模型对所述扰动处理前后的正样例和负样例进行特征提取,并分别获取正特征相似度损失和负特征损失;以及基于所述正特征相似度损失和负特征损失的联合损失训练所述CNN模型。

【技术特征摘要】
1.一种用于结节检测的模型训练方法,其特征在于,所述方法包括:基于已标注结节位置的训练图像序列,获取包含结节的正样例和不包含结节的负样例,并对所述正样例和负样例进行扰动处理;使用卷积神经网络CNN模型对所述扰动处理前后的正样例和负样例进行特征提取,并分别获取正特征相似度损失和负特征损失;以及基于所述正特征相似度损失和负特征损失的联合损失训练所述CNN模型。2.如权利要求1所述的方法,其特征在于,所述的基于已标注结节位置的训练图像序列,获取包含结节的正样例和不包含结节的负样例,并对所述正样例和负样例进行扰动处理,包括:使用预设大小的裁剪框,对所述训练图像序列进行随机裁剪,以获取所述正样例和负样例;以及按预设体素对所述正样例和负样例进行扰动,并保留扰动前后的正样例和扰动前后的负样例作为所述CNN模型的输入。3.如权利要求2所述的方法,其特征在于,所述方法还包括:针对经所述随机裁剪得到的正样例,按预设偏移量改变所述裁剪框的中心与所包含结节之间的相对位置,并保留改变所述相对位置前后的正样例作为所述扰动处理的输入。4.如权利要求1所述的方法,其特征在于,所述的获取正特征相似度损失和负特征损失包括:基于分别从所述扰动处理前后的正样例提取的第一特征向量和第二特征向量构建相似度损失函数,使得在所述CNN模型的训练过程中,所述第一特征向量与所述第二特征向量之间的距离趋于最小化;以及基于从所述扰动处理前后的负样例提取的第三特征向量构建负特征损失函数,使得在所述CNN模型的训练过程中,所述第三特征向量的范数趋于最小化。5.如权利要求1所述的方法,其特征在于,所述的基于所述正特征相似度损失和负特征损失的联合损失训练所述CNN模型,包括:基于所述CNN模型的交叉熵损失和权重衰减损失、以及所述正特征相似度损失和所述负特征损失的加权求和获取所述联合损失。6.如权利要求5所述的方法,其特征在于,所述的基于所述正特征相似度损失和负特征损失的联合损失训练所述CNN模型,还包括:将所述联合损失经所述CNN模型反向传播以更新所述CNN模型的模型参数;基于参数经过更新的CNN模型重新进行所述特征提取和所述联合损失的获取;以及在确定满足预设停止条件时输出所述模型参数,在确定不满足所述预设...

【专利技术属性】
技术研发人员:陈鹏孙钟前程陈杨巍
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1