医学图像分类处理人工智能的小样本元学习训练方法技术

技术编号:25088056 阅读:72 留言:0更新日期:2020-07-31 23:32
医学图像分类处理人工智能的小样本元学习训练方法,搭建多尺度CNN特征提取器、度量学习器和分类判别器三个元学习器,同时对元学习器上度量标准的设计;在训练集的每个任务上,通过支持集距离度量学习目标集,最终学习得到一个度量标准,然后对于测试集的新任务,只需借助支持集少量样本,就可以快速对目标集进行正确分类;通过采用元学习来提高疑难病症领域人工智能自动检测的实用性和可靠性,克服单一病种数据量少病种分散的不足,完成医学图像处理智能系统分类少样本学习训练,使得过滤的正确率显著改善,有效地增强医学图像分类的准确率,极大的提高生产效率,有助于医疗行业智能诊断深度学习技术升级。

【技术实现步骤摘要】
医学图像分类处理人工智能的小样本元学习训练方法
本专利技术涉及设备装置的结构改进技术,属于IPC分类中的G06T7/11机器学习、模式识别和医学影像处理技术,或G06K9/00用于阅读或识别印刷或书写字符或者用于识别图形
,尤其是医学图像分类处理人工智能的小样本元学习训练方法。
技术介绍
目前,包括X射线成像、CT成像、磁共振成像、超声成像和核医学成像等医学影像能让医生除接触和解剖外,了解患者身体内部形态、功能、代谢等改变,对诊断患者病因、病情有重要作用。医学影像在医学临床诊断中有着极为重要的地位,现代医学离不开医学影像技术。科大讯飞、腾讯觅影、阿里健康等研发的医学影像辅助诊断系统,依靠优质高分辨率图像,能在肺部CT影像诊断、食管癌早期筛查等特定的医疗领域辅助医生诊断,让计算机通过学习大量的影像和诊断数据,做到自动切割医学影像图像和图像分类,对可疑组织进行多次不同比例尺度的放大观察,提取重要信息,最后输出是否病变的建议,辅助影像科医生进行决策,大大提高诊断效率,与此同时可有效减少漏诊、误诊的现象,给未来医学发展起到了极大的促进作用。随着互联网技术的发展和信息化水平的提高,图像数据量也呈现了爆炸式的增长。在庞大的图像数据库中,计算机如何高效地挑选图像数据,对图像分类技术提出了一定的挑战。由于近几年深度学习快速发展,凭借着其较高的准确率与识别效率,借助深度学习进行图像分类技术己经逐渐取代了人工标注特征进行图像分类,但是深度学习在训练过程中往往存在参数难以调整,训练样本需求量较大且训练时间过长的缺点。针对以上问题,研究在小数量样本情况下,如何高效利用深度学习进行图像识别是很有意义的,也增强了不同样本情况下的深度学习模型的适应能力。人类智能的一个关键特征是多面性(versatility):完成不同任务的能力。目前的AI系统擅长掌握单项技能,如围棋、Jeopardy游戏,甚至直升机特技飞行。但是,让AI系统做一些看起来很简单的事情,对它们来说反而比较困难。取得Jeopardy冠军的程序无法进行对话,专业的直升机特技飞行控制器无法在全新的简单环境中航行,比如定位起火现场、飞过去然后扑灭它。然而,人类可以在面对多种新情况时灵活应对并自发适应。人类对人工智能体获得这样的多面性有所期待。自深度学习发展起来之后,智能化的各种设备得到快速发展,但是对于智能化的程序来说,需要数以万计甚至百万千万的数据行进训练,以近年来最为出名的AlphaGo为例,虽然下棋的是一台电脑,但其后台需要庞大的数据支持训练才能达到这样的效果。所以这也是深度学习的一个短板,训练数据需要太多,但有时一些训练任务并不能找到这么多的训练数据。这种情况下,如果训练数据较少时给深度学习器加以训练,会出现过拟合的现象,这是不利于应用的,所以对于此随之而来的便是小样本学习问题,即针对样本量较少的任务,需要有一个学习器能够成功应用少量的数据进行好的训练,达到学习器所需的功能。据公开报道,某实验室开发的最新技术《与模型无关的元学习(model-agnosticmeta-learning)》,对此进行尝试,结果未知。对于人来说,初识一个新的物品,你可以通过探索很快地了解并熟悉它,而这种学习能力,是目前机器所没有的。所以人们思考,如果机器也能拥有这种学习能力的话,面对样本量较少的问题时,便可以快速地学习,这便是元学习(metalearning),也可以称为元学习。例如,在2015年Science杂志封面刊登过一篇小样本学习文章《Human-levelconceptlearningthroughprobabilisticprograminduction》,该文章提出了贝叶斯规划学习(BPL)框架,实现One-shotlearning,数据集采用世界各地字母表的手写字符。人们发现通过元学习能够很好地实现小样本分类任务。近年来,小样本学习分类发展迅速,面对总多的分类任务,都可以通过训练一个模型来达到任务要求。其中元学习的方法较多,为了最大的适用性,元学习的机制应该是任务的通用性,即面对不同的任务,不需要构建不同的模型,用同样的一套学习算法即可解决多种不同的任务。定义一个模型的可学习参数θ,面对不同的任务,可以通过改变参数θ的值来解决相应的任务。而参数θ的值可以通过元学习器去学习,在面对不同任务的时候,根据损失函数通过梯度下降的方法不断地更新θ值,使这个模型不断向能解决这个任务的模型靠近,当θ值最终收敛时,元学习器学习到了一个较好的参数θ,让模型自适应地解决相应任务。该算法没有为学习器构建或引入其他的参数,训练学习器的策略使用的是已知的如梯度下降等优化过程。针对小样本识别的众多问题,例如,极容易过拟合、模型泛化性较差等,试验研究提出基于深度学习的小样本分类识别模型,优化方向主要基于以下两个方面,第一是图像样本数量的增强,第二是识别模型的优化。在进行样本数量增强时,提出生成式模型与图像预处理相结合的技术。首先利用全连接生成式模型进行样本增强,针对全连接神经网络参数过多的问题,利用卷积神经网络代替全连接神经网络进行图像训练。由于产生的样本图像具有随机性,利用条件生成式模型进行样本生成,所产生的样本集合含有labels,在后续的监督式分类学习中可以得到很好的应用。针对在条件生成模型中产生样本出现模糊的问题,提出基于小波变换与自适应数学形态学的图像边缘检测技术。该方法可以很好的克服边缘模糊问题,此外,由于生成的样本往往存在噪声,基于经验模态分解与稀疏表示相结合的图像去噪技术,优化的去噪模型可以很好的在去除噪声的同时保留图像的边缘细节。因此,利用融合模型进行的图像样本数量增强可以很好的扩大样本,用于下一部分的分类模型。在进行小样本分类模型中,利用迁移学习进行模型分类,迁移学习往往能在较少的训练样本集中达到较高的识别效率。结合生成模型与迁移学习,利用融合模型进行小样本图像识别。迁移学习采用Inpection-V3模型进行训练,相比较于单纯进行卷积神经网络进行分类训练,加入迁移学习可以提高模型的泛化能力,模型的训练效率也有很大的提升,在样本缺失时,基于迁移学习的分类模型,由于只需要再训练,因此,识别的准确率也得到了很大的提升。结合样本增强技术,在样本缺失时,通过增加仿造样本与迁移学习相结合的方式进行模型融合并分类,利用标准数据集与拍摄的树叶图像作实验对比,在准确率上,相比较于单纯使用迁移学习和卷积神经网络均有所提升,对于样本量不足的实验环境中进行深度学习分类具有很好的参考意义。在医疗行业中,计算机能做的最大的贡献就是帮助医生做大量医学影像的过滤工作,至于使用诊断上最多也只是一个辅助的诊断工具,而机器学习到达了深度学习的时代,有些本来以为不太可能的任务都被深度学习算法所攻克。相关专利文献公开较少。南京大学、江苏万维艾斯网络智能产业创新中心有限公司201910374698.6公开一种基于深度神经网络的点交互式医学图像分割方法,专门针对医学图像中的肾肿瘤分割问题而提出的一种点交互的深度学习分割算法。该算法由点交互预处理模块,双向ConvRNN单元、核心深度分割网本文档来自技高网...

【技术保护点】
1.医学图像分类处理人工智能的小样本元学习训练方法,其特征在于,搭建多尺度CNN特征提取器、度量学习器和分类判别器三个元学习器,同时对元学习器上度量标准的设计;在训练集的每个任务上,通过支持集距离度量学习目标集,最终学习得到一个度量标准,然后对于测试集的新任务,只需借助支持集少量样本,就可以快速对目标集进行正确分类;具体包括以下步骤:/n步骤1:读取数据集,数据集即训练数据集,为1000例标注的医学图像数据集,该训练数据集包括训练集、验证集和测试集;/n步骤2:进行图像预处理操作,对训练数据集中的数据进行初步的处理,将数据的范围进行规定,规定数据的范围和尺寸,去除无关的数据;/n步骤3:数据增广,对医学图像数据进行归一化,进行图像旋转、加噪声以及扩增处理;/n步骤4:搭建多尺度特征提取器,进行算法模型构建,该特征提取器为CNN特征提取器,提取图像多尺度超像素特征;/n步骤5:搭建度量学习器,计算图像特征之间的距离;/n步骤6:搭建分类判断器,对网络层结构以及训练网络参数进行设计;/n步骤7:进入模型训练过程,该模型训练过程涉及的多尺度关系网络是一个端到端可微分的结构,采用反向传播算法和自适应矩估计调整模型中参数的取值;/n步骤8:完成输出;根据关系特征通过度量学习器学习后得到关系分数,所述关系分数即一次少样本图像分类任务的结果。/n...

【技术特征摘要】
1.医学图像分类处理人工智能的小样本元学习训练方法,其特征在于,搭建多尺度CNN特征提取器、度量学习器和分类判别器三个元学习器,同时对元学习器上度量标准的设计;在训练集的每个任务上,通过支持集距离度量学习目标集,最终学习得到一个度量标准,然后对于测试集的新任务,只需借助支持集少量样本,就可以快速对目标集进行正确分类;具体包括以下步骤:
步骤1:读取数据集,数据集即训练数据集,为1000例标注的医学图像数据集,该训练数据集包括训练集、验证集和测试集;
步骤2:进行图像预处理操作,对训练数据集中的数据进行初步的处理,将数据的范围进行规定,规定数据的范围和尺寸,去除无关的数据;
步骤3:数据增广,对医学图像数据进行归一化,进行图像旋转、加噪声以及扩增处理;
步骤4:搭建多尺度特征提取器,进行算法模型构建,该特征提取器为CNN特征提取器,提取图像多尺度超像素特征;
步骤5:搭建度量学习器,计算图像特征之间的距离;
步骤6:搭建分类判断器,对网络层结构以及训练网络参数进行设计;
步骤7:进入模型训练过程,该模型训练过程涉及的多尺度关系网络是一个端到端可微分的结构,采用反向传播算法和自适应矩估计调整模型中参数的取值;
步骤8:完成输出;根据关系特征通过度量学习器学习后得到关系分数,所述关系分数即一次少样本图像分类任务的结果。


2.如权利要求1所述的医学图像分类处理人工智能的小样本元学习训练方法,其特征在于,超像素由一系列位置相邻且颜色、亮度或纹理特征相似的像素点组成的小区域;这些小区域大多保留进一步进行图像分割的有效信息,且一般不会破坏图像中物体的边界信息;超像素就是把一幅像素级(pixel-level)的图,划分成区域级(district-level)的图,是对基本信息元素进行的抽象;对每一块超像素,以该超像素中心为中心提取多个不同大小的图像斑块作为多尺度CNN模型的输入,多尺度特征提取器基于关系网络对每一块超像素对应的图像斑块采用多尺度CNN模型进行特征提取操作。


3.如权利要求1所述的医学图像分类处理人工智能的小样本元学习训练方法,其特征在于,具体网络层结构由两个卷积模块由卷积层、批标准化层、修正线性单元层以及最大池化层组成;其中卷积层由64个尺寸大小为3x3的过滤器组成,不进行零填充,且第一个卷积层的输入信号的通道数由输入图片的通道数决定;池化层的尺寸大小为2x2,不进行零填充;第三个和第四个卷积模块由卷积层、批标准化层以及修正线性单元层组成,其中卷积层由64个尺寸大小为3x3的过滤器组成,进行零填充;将图片输入特征提取器,得到尺寸大小为(W,M,64);第二、三、四层特征图,其中M代表特征图的宽度和高度,64代表特征图的深度;然后将第二、三层特征图和第四层特征图在深度方向拼接得到尺寸大小(M,M,128)为多尺度特征。


4.如权利要求1所述的医学图像分类处理人工智能的小样本元学习训练方法,其特征在于,度量学习器具体结构,总共由两个卷积模块和两个全连接层组成;第一个和第二个卷积模块由卷积层、批标准化层、修芷线性单元层以及最大池化层组成;其中卷积层由64个尺寸大小为3x3或...

【专利技术属性】
技术研发人员:李功杰马潞娜
申请(专利权)人:北京全景德康医学影像诊断中心有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1