一种基于肺部CT影像的数据处理方法及系统技术方案

技术编号:30142282 阅读:12 留言:0更新日期:2021-09-23 15:08
本发明专利技术公开一种基于肺部CT影像的数据处理方法及系统,包括:基于联邦学习,中心服务器根据接收到的各终端Agent(智能体)上传的训练好的参数,更新中心模型;根据所述各终端Agent上传的参数,进行注意力权重的分配;基于所述注意力权重的分配,中心服务器更新模型公式,计算各终端Agent每轮对中心模型造成的影响;根据所述各终端Agent每轮参数对中心模型造成的影响,计算各终端Agent的贡献值,即对各终端的贡献值进行评估。应用本发明专利技术能够在肺部CT影像识别中实现实时贡献测量和评估。像识别中实现实时贡献测量和评估。

【技术实现步骤摘要】
一种基于肺部CT影像的数据处理方法及系统


[0001]本专利技术涉及图像识别
,具体而言,涉及一种基于肺部CT影像的数据处理方法及系统。

技术介绍

[0002]近年来,人工智能领域突飞猛进,图像识别作为人工智能的重要组成部分被广泛应用于各种领域。图像识别在医疗行业的运用尤其突出,应用在医疗影像诊断能有效解决放射科医师增长速率不及影像数据增长速度的问题,和医疗人才资源分配不均、基层医院误诊率高等问题。
[0003]图像识别技术的迅速发展和广泛运用依然存有一些问题,图像识别技术依赖数据积累,但在大多数行业中数据以孤岛的形式存在。由于行业竞争、隐私安全和复杂的管理程序,数据集成面临着巨大的阻力。
[0004]在联邦学习中,各参与方的数据是更为分散的,如何建立激励机制使得拥有优质数据的参与方持续参与到数据联邦中就成了一项重要的挑战。实现这一目标的关键是制定一种贡献评估方法,公平公正地评估各参与方的数据集对联邦学习模型的贡献度。
[0005]贡献度,即每个参与方对总的模型参数的贡献程度,包括数量的贡献和质量的贡献两种。联邦学习系统需要鼓励不同的智能体贡献他们的数据并参与合作。联邦激励机制对激励当前和潜在的参与者至关重要。联邦学习需要一个良好的评价机制基于智能体合理的奖励,其中每一个参与方应该根据其对共享模型的贡献获得相应的奖励。

技术实现思路

[0006]本专利技术提供一种基于肺部CT影像的数据处理方法及系统,用以克服现有技术中存在的至少一个技术问题。
[0007]根据本专利技术实施例的第一方面,提供一种基于肺部CT影像的数据处理方法,包括:基于联邦学习,中心服务器根据接收到的各终端Agent上传的训练好的参数,更新中心模型;根据所述各终端Agent上传的参数,进行注意力权重的分配;基于所述注意力权重的分配,中心服务器更新模型公式,计算各终端Agent每轮对中心模型造成的影响;根据所述各终端Agent每轮参数对中心模型造成的影响,计算各终端Agent的贡献值,即对各终端的贡献值进行评估。
[0008]可选的,所述注意力权重的分配,包括:
[0009][0010]其中,为第k个Agent的模型的第1层分配的注意力权重;为第k个Agent的模型第1层与中心模型的差异值。
[0011]可选的,所述为第k个Agent的模型第1层与中心模型的差异值:
[0012][0013]其中,为第k个Agent第1层的参数,从各终端Agent获取到;w
l
为中心模型第1层的参数,由上一轮中心模型迭代得到;p取2,即为平方差。
[0014]可选的,所述参数为模型梯度,在上传梯度的同时添加一个随机的扰动用于隐藏原始梯度,保护数据的隐私。
[0015]可选的,所述更新模型公式包括:
[0016][0017]其中,∈为步长;为正态分布;β为相关系数;所述步长为1.2;所述随机的扰动服从所述正态分布;所述β为0.001。
[0018]可选的,所述各终端Agent每轮对中心模型造成的影响力参数为包括:
[0019][0020]其中,为第k个Agent在第t轮对中心模型造成的影响;α
k
为计算得到的第k个Agent的注意力,γ为遗忘系数;所述遗忘系数越大表示贡献评估越依赖于上一轮Agent对模型造成的影响;所述γ为0.7;所述如果Agent在第t轮并没有被选中作为更新的Agent,则
[0021]可选的,所述计算Agent的贡献,包括:
[0022]con
t
=Softmax(MinMaxScaler(imp
t
))
[0023]其中,con
t
为第t轮各Agent的贡献,imp
t
为计算得到的第t轮对中心模型造成的影响。
[0024]根据本专利技术实施例的第二方面,提供一种基于肺部CT影像的数据处理系统,包括:更新模块,用于基于联邦学习,中心服务器根据接收到的各终端Agent上传的训练好的参数,更新中心模型;分配模块,用于根据所述各终端Agent上传的参数,进行注意力权重的分配;第一计算模块,用于基于所述注意力权重的分配,中心服务器更新模型公式,计算各终端Agent每轮对中心模型造成的影响;第二计算模块,用于根据所述各终端Agent每轮参数对中心模型造成的影响,计算各终端Agent的贡献值,即对各终端的贡献值进行评估。
[0025]可选的,所述注意力权重的分配,包括:
[0026][0027]其中,为第k个Agent的模型的第1层分配的注意力权重;为第k个Agent的模型第1层与中心模型的差异值。
[0028]可选的,所述注意力权重的分配,包括:
[0029]所述为第k个Agent的模型第1层与中心模型的差异值:
[0030][0031]其中,为第k个Agent第1层的参数,从各终端Agent获取到;w
l
为中心模型第1层的参数,由上一轮中心模型迭代得到;p取2,即为平方差。
[0032]本专利技术实施例的创新点包括:
[0033]1、本专利技术提出的一种基于肺部CT影像的数据处理方法及系统,能够根据所述各终端Agent每轮参数对中心模型造成的影响,计算各终端Agent的贡献值,即对各终端的贡献值进行评估,相比现有技术,本专利技术提出的方法每轮都会更新贡献率,使得它能够实时执行。是本专利技术实施例的创新点之一。
[0034]2、本专利技术提出的一种基于肺部CT影像的数据处理方法及系统,基于联邦学习,中心服务器根据接收到的各终端Agent上传的训练好的参数,更新中心模型,相比现有技术,本专利技术提出的方法在保持数据隐私和医疗数据本地化的前提下,将数据用于中心模型的训练,由中心服务器对参数进行汇总,综合各终端Agent参数更新向量,得到一个有高鲁棒性和泛化能力的神经网络模型。是本专利技术实施例的创新点之一。
[0035]3、本专利技术提出的一种基于肺部CT影像的数据处理方法及系统,基于多模型融合机制使能够获得精确度更高、泛化能力更强的模型。是本专利技术实施例的创新点之一。
附图说明
[0036]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0037]图1为本专利技术基于肺部CT影像的数据处理方法的中心服务器端流程示意;
[0038]图2为本专利技术的各网络架构模型本地训练在测试数据集上的损失值;
[0039]图3为本专利技术的多模型融合在训练数据集上的损失值;
[0040]图4为本专利技术的基于肺部CT影像的数据处理方法的数据集中部分图片展示;
[0041]图5为本专利技术的基于肺部CT影像的数据处理方法的图像分割测试结果;
[0042]图6为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于肺部CT影像的数据处理方法,其特征在于,包括:基于联邦学习,中心服务器根据接收到的各终端Agent(智能体)上传的训练好的参数,更新中心模型;根据所述各终端Agent上传的参数,进行注意力权重的分配;基于所述注意力权重的分配,中心服务器更新模型公式,计算各终端Agent每轮对中心模型造成的影响;根据所述各终端Agent每轮参数对中心模型造成的影响,计算各终端Agent的贡献值,即对各终端的贡献值进行评估。2.根据权利要求1所述的方法,其特征在于,所述注意力权重的分配,包括:其中,为第k个Agent的模型的第l层分配的注意力权重;为第k个Agent的模型第l层与中心模型的差异值。3.根据权利要求2所述的方法,其特征在于,所述为第k个Agent的模型第l层与中心模型的差异值:其中,为第k个Agent第l层的参数,从各终端Agent获取到;w
l
为中心模型第l层的参数,由上一轮中心模型迭代得到;p取2,即为平方差。4.根据权利要求1所述的方法,其特征在于,所述参数为模型梯度,在上传梯度的同时添加一个随机的扰动用于隐藏原始梯度,保护数据的隐私。5.根据权利要求1所述的方法,其特征在于,所述更新模型公式包括:其中,∈为步长;为正态分布;β为相关系数;所述步长为1.2;所述随机的扰动服从所述正态分布;所述β为0.001。6.根据权利要求1所述的方法,其特征在于,所述各终端Agent每轮对中心模型造成的影响力参数为包括:
其中,为第k个Agent在第t轮对中心模型造成的影响;α
k
为计算得到的第k个Agent的注意力,γ为遗忘系数;所述遗忘系数越大表示贡献评估越依赖于上一轮...

【专利技术属性】
技术研发人员:闫冰洁肖驰周志成刘博艺陈海龙范智玮明诗雅叶静辰陆兴悦卢林峰
申请(专利权)人:海南大学三亚研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1