一种基于少样本模型学习的联合医院数据迁移方法及系统技术方案

技术编号:32112883 阅读:19 留言:0更新日期:2022-01-29 18:56
本发明专利技术属于数据处理技术领域,本发明专利技术公开一种基于少样本模型学习的联合医院数据迁移方法及系统,包括步骤:利用数据源丰富的源医院集构建病例数据模型,从数据源丰富的源医院集上基于任务分配算法构建任务集合;在每个任务中对每个样本进行多次病例采样,将采集到的病例数据进行预处理,得到特征集合;按照时间顺序对特征集合进行时序训练,提取完整时序的特征值;以所述特征值对病例数据模型进行训练,得到病例数据模型;利用所述病例数据模型对数据源稀疏的目标医院数据集进行数据识别获得数据类别,并将该类别数据迁移至目标医院数据库。本发明专利技术能够为资源稀疏的目标医院的目标病例精准迁移的丰富的医疗资源数据。标病例精准迁移的丰富的医疗资源数据。标病例精准迁移的丰富的医疗资源数据。

【技术实现步骤摘要】
一种基于少样本模型学习的联合医院数据迁移方法及系统


[0001]本专利技术属于数据处理
,特别是涉及一种基于少样本模型学习的联合医院数据迁移方法及系统。

技术介绍

[0002]空间分布不平衡的数据采集是时空预测最常遇到的问题。例如,有些医疗机构可能有由于资源充足等原因可以提供恒定丰富的病例资源数据,而有些机构由于医疗设备不足等原因只有少量的有效病例数据,当资源匮乏的医疗机构无法精准有效的获取罕见病例的相关资源数据,例如医生数据、科室数据和应对方案数据等。
[0003]早期的方法只从单一来源(医院)转移知识,会导致结果不稳定和负迁移的风险。由于缺少值或特殊事件(例如病例数据缺失或不足)的影响,现有的方法在数据有限的情况下很难有效地学习。

技术实现思路

[0004]为了解决上述问题,本专利技术提出了一种基于少样本模型学习的联合医院数据迁移方法及系统,能够为资源稀疏的目标医院的目标病例精准迁移的丰富的医疗资源数据。
[0005]为达到上述目的,本专利技术采用的技术方案是:一种基于少样本模型学习的联合医院数据迁移方法,包括步骤:S10,利用数据源丰富的源医院集构建病例数据模型,包括步骤:S11,从数据源丰富的源医院集上基于任务分配算法构建任务集合;S12,在每个任务中对每个样本进行多次病例采样,将采集到的病例数据进行预处理,得到特征集合;S13,按照时间顺序对特征集合进行时序训练,提取完整时序的特征值;S14,以所述特征值对病例数据模型进行训练,得到病例数据模型;S20,利用所述病例数据模型对数据源稀疏的目标医院数据集进行数据识别获得数据类别,并将该类别资源数据迁移至目标医院数据库。
[0006]进一步的是,在所述步骤S14中,以所述特征值对病例数据模型进行训练,得到病例数据模型,包括步骤:S141,将数据源丰富的源医院集划分为基础源医院集和新医院集,分别进行基础训练和元训练;S142,基础训练阶段,学习一个基础学习器并获得主干网络参数作为基础先验知识;元训练阶段,通过对新医院集的训练,结合增量少样本学习算法,获得网络训练参数;S143,将基础源医院集和新医院集的训练网络参数进行结合,更新主干网络,得到病例数据模型。
[0007]进一步的是,所述基础源医院集和新医院集不相交。
[0008]进一步的是,所述主干网络包括卷积神经网络和长短期记忆网络构成,将处理后
的数据输入主干网络进行训练,并通过SOFTMAX层,输出病例数据所属类别。
[0009]进一步的是,在基础训练阶段,对基础医院集进行训练获得的基础知识参数并通入记忆正则化器,将记忆正则化器的输出发送至元学习阶段。
[0010]进一步的是,在元训练阶段中,对新医院集进行任务抽样算法构建支持集和查询集;支持集用于训练主干网络模型获得元参数;利用查询集对支持集训练获得的元参数进行查询集任务损失值判断,根据查询集任务损失值对主干网络学习参数进行梯度更新。
[0011]进一步的是,利用基础源医院集重构查询集,重构后的查询集包括新医院集中的样本和自于基础源医院集的样本。
[0012]进一步的是,利用记忆正则化器提取基础知识与新知识进行混合;在元训练阶段,学习元参数以最小化查询集上的联合预测损失值;在元学习阶段,通过迭代更新来优化元学习器的元参数,元参数通过注意力机制封装;从而为少样本学习目标中的权重生成正则化器。
[0013]进一步的是,利用记忆正则化器来加载混合基础知识参数与元参数的权重向量和,完成提取基础知识与新知识进行混合;基于注意力机制对基本知识参数进行编码;注意力向量被用来计算记忆矩阵,使用记忆矩阵存储每个基本源的学习吸引子向量;在元学习阶段,对于每个任务,以最小化查询集的预期损失来更新元参数。
[0014]另一方面,本专利技术还提供了一种基于少样本模型学习的联合医院数据迁移系统,包括:处理器、存储器;所述存储器用于储存处理器可执行指令;所述处理器被配置为执行上述任意一种基于少样本模型学习的联合医院数据迁移方法。
[0015]采用本技术方案的有益效果:本专利技术通过对数据源丰富的医疗机构(医院,养老院等)的学习,利用神经网络构建训练框架,结合增量少样本学习算法,将学习到的病例数据进行知识迁移,以完成对数据源稀少的目标医院进行辅助,将丰富的医疗资源数据精准迁移至资源稀疏的目标医院,解决机构发展水平不平衡的问题。
[0016]本专利技术提出基于增量少样本学习算法的跨多源医院集进行知识迁移的新方法。构建记忆正则化器防止灾难性遗忘问题。能够完成来跨多源医疗机构进行知识迁移的任务,也在一定程度上防止了源医院集训练过程中的灾难性遗忘问题。
[0017]本专利技术提出了一种存储源医院集先验知识的记忆调节结构,并将其扩展到目标医院样本,以提高目标医院的数据迁移精度。
附图说明
[0018]图1为本专利技术的一种基于少样本模型学习的联合医院数据迁移方法流程示意图;图2为本专利技术实施例中特征数据处理流程图;图3为本专利技术实施例中基于增量少样本算法改进训练阶段流程图。
具体实施方式
[0019]为了使本专利技术的目的、技术方案和优点更加清楚,下面结合附图对本专利技术作进一步阐述。
[0020]在本实施例中,参见图1所示,本专利技术提出了一种基于少样本模型学习的联合医院数据迁移方法,包括步骤:S10,利用数据源丰富的源医院集构建病例数据模型;S20,利用所述病例数据模型对数据源稀疏的目标医院数据集进行数据识别获得数据类别,并将该类别资源数据迁移至目标医院数据库,迁移相应资源数据。
[0021]所述步骤S10中,利用数据源丰富的源医院集构建病例数据模型,包括步骤:S11,从数据源丰富的源医院集上基于任务分配算法构建任务集合;S12,在每个任务中对每个样本进行多次病例采样,将采集到的病例数据进行预处理,得到特征集合;S13,按照时间顺序对特征集合进行时序训练,提取完整时序的特征值;S14,以所述特征值对病例数据模型进行训练,得到病例数据模型。
[0022]如图2所示,利用数据源丰富的源医院集构建病例数据模型,从数据源丰富的一个或多个源医院集上基于任务分配算法构建任务集合,对每个任务中对每个样本进行多次病例采样(第一次数据、第二次数据、第三次数据),将采集到的数据进行预处理,得到特征集合,所述特征集合的第一个点为初测起始点。按照时间顺序进行时序训练,提取所述完整时序的特征值,对病例数据模型模型进行训练,最后利用所述数据源丰富的病例数据模型对数据源稀疏对目标医院病例数据进行类别识别并迁移相应的资源数据。资源数据包括作为上述实施例的优化方案,如图3所示,在所述步骤S14中,以所述特征值对病例数据模型进行训练,得到病例数据模型,包括步骤:S141,将数据源丰富的源医院集划分为基础源医院集和新医院集,分别进行基础训练和元训练,即,其中新医院集与基础源医院集不相交;S142,基础训练阶段,学习一个基础学习器并获得主干网络参数作为基础先验知识;元训练阶段,通过对新医院集的训练,结合增量少样本学习算本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于少样本模型学习的联合医院数据迁移方法,其特征在于,包括步骤:S10,利用数据源丰富的源医院集构建病例数据模型,包括步骤:S11,从数据源丰富的源医院集上基于任务分配算法构建任务集合;S12,在每个任务中对每个样本进行多次病例采样,将采集到的病例数据进行预处理,得到特征集合;S13,按照时间顺序对特征集合进行时序训练,提取完整时序的特征值;S14,以所述特征值对病例数据模型进行训练,得到病例数据模型;S20,利用所述病例数据模型对数据源稀疏的目标医院数据集进行数据识别获得数据类别,并将该类别资源数据迁移至目标医院数据库。2.根据权利要求1所述的一种基于少样本模型学习的联合医院数据迁移方法,其特征在于,在所述步骤S14中,以所述特征值对病例数据模型进行训练,得到病例数据模型,包括步骤:S141,将数据源丰富的源医院集划分为基础源医院集和新医院集,分别进行基础训练和元训练;S142,基础训练阶段,学习一个基础学习器并获得主干网络参数作为基础先验知识;元训练阶段,通过对新医院集的训练,结合增量少样本学习算法,获得网络训练参数;S143,将基础源医院集和新医院集的训练网络参数进行结合,更新主干网络,得到病例数据模型。3.根据权利要求2所述的一种基于少样本模型学习的联合医院数据迁移方法,其特征在于,所述基础源医院集和新医院集不相交。4.根据权利要求2所述的一种基于少样本模型学习的联合医院数据迁移方法,其特征在于,所述主干网络包括卷积神经网络和长短期记忆网络构成,将处理后的数据输入主干网络进行训练,并通过SOFTMAX层,输出病例数据所属类别。5.根据权利要求2所述的一种基于少样本模型学习的联合医院数据迁移方法,其特征在于,在基础训练阶段,对基础医院集进行训...

【专利技术属性】
技术研发人员:王佳昊齐秀秀李文雄陈大江朱军向平包晓乐
申请(专利权)人:四川华迪信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1