基于联邦学习和特征提取的恶意行为识别方法技术

技术编号:32128603 阅读:17 留言:0更新日期:2022-01-29 19:22
本发明专利技术涉及人工智能技术领域,具体涉及一种基于联邦学习和特征提取的恶意行为识别方法。该方法包括各个医院训练自己的语义分割网络以得到对应语义分割网络的第一准确率,以第一准确率最大的语义分割网络的网络参数为初始值,依次对每个医院的语义分割网络进行网络训练和网络参数的更新,同时将每个语义分割网络训练后的新网络参数、损失函数值以及该语义分割网络在所有医院训练集上的第二准确率都存储在对应医院生成的区块中;根据区块中存储的数据获取每个医院的训练集异常程度,由训练集异常程度识别恶意行为。对每个医院的语义分割网络进行特征提取,来分析各医院之间的训练集差异情况,从而识别恶意行为。从而识别恶意行为。从而识别恶意行为。

【技术实现步骤摘要】
基于联邦学习和特征提取的恶意行为识别方法


[0001]本专利技术涉及人工智能
,具体涉及一种基于联邦学习和特征提取的恶意行为识别方法。

技术介绍

[0002]随着医疗技术的进步,各医院纷纷利用先进的医疗设备来诊断疾病,例如利用X射线等透视成像设备和内窥镜设备或者核磁共振设备等,将病人的病情以图象数据的方式可视化出来,辅助医师跟价快速准确的诊断出病情和确定治疗方案。
[0003]随着人工智能技术的发展,利用各种各样的神经网络来根据医疗图像数据诊断病情,其中最常用的技术是利用神经网络分割医疗图像数据,获得图像上器官的病灶区域。但是由于单个医院的医疗图像数据样本少,带标签的数据样本更少,并且各个医院的医疗图像数据不共享,使得单个医院只能根据自身少量的医疗图像数据样本训练神经网络,虽然能够满足常规疾病的诊断,但是会导致神经网络的误诊率高,无法诊断出难以发现的病灶。
[0004]现有的联邦学习可以在医院不共享数据的情况下获得一个准确率高的神经网络,联邦学习的大致过程是各医院将各自训练的模型参数共享给中心服务器,中心服务器通将各医院的模型参数进行融合然后再分发给各医院,各医院在接收到的参数基础上继续训练模型,然后一直重复这个过程。联邦学习中利用数据的同态加密和身份验证等信息确保数据的安全。
[0005]各医院用于训练网络的数据集中的医疗图像数据的标注需要专业医师或相关人员标注,而由于医师和相关人员的技术或职业水平存在差异,使得标注图像样本标签的标准不能统一,导致有一些医院为了节省标注成本或者管理监督不当,可能会存在故意或者无意的引入错误的、不精确的标签数据的恶意行为,也可能存在一些篡改数据标签或者添加错误的标签的恶意网络攻击行为,也或者是恶意网络端攻击各医院的训练过程等,这些恶意行为使得图像数据样本的标签不匹配,网络参数引入噪声或干扰数据,导致神经网络的准确率下降。

技术实现思路

[0006]为了解决上述技术问题,本专利技术的目的在于提供一种基于联邦学习和特征提取的恶意行为识别方法,所采用的技术方案具体如下:
[0007]本专利技术实施例提供了一种基于联邦学习和特征提取的恶意行为识别方法,该方法包括以下具体步骤:
[0008]各个医院训练自己的语义分割网络,基于每个医院的数据集分别计算对应所述语义分割网络的第一准确率;将所述第一准确率最大的所述语义分割网络的网络参数存储在对应医院的区块中,且将该区块作为初始区块;所述数据集包括由多张医疗图像数据组成的训练集和测试集;
[0009]对所有医院进行编号排序,将每个医院生产的区块按编号顺序依次连接在所述初
始区块上以构成区块链;以所述初始区块中的网络参数开始获取相邻下一级区块的新网络参数,依次将上一级区块中的所述新网络参数共享给其相邻下一级区块对应的所述语义分割网络以得到新语义分割网络;分别获取所有医院的训练集利用所述新语义分割网络的第二准确率,将所述新语义分割网络的所述新网络参数、损失函数值和所有医院的所述第二准确率都存储在对应的区块中;当所有医院的网络参数未完全收敛时,继续将最后一个医院的区块作为所述初始区块进行下一轮的网络训练直至所有医院的所述语义分割网络收敛;
[0010]根据所述区块链上每个区块中的所述第二准确率计算每个医院的初始训练集异常指标;基于两个医院之间训练集的相似度分别获取所有医院对一个医院的所述初始训练集异常指标的评估信任向量以得到每个医院对应的所述评估信任向量;结合所述评估信任向量和所述初始训练集异常指标得到每个医院的训练集异常程度,由所述训练集异常程度识别恶意行为。
[0011]优选的,所述第一准确率的获取方法,包括:
[0012]分别计算所述语义分割网络在所述训练集上的训练准确率和测试集上的测试准确率,进而由所述训练准确率和所述测试准确率计算出该语义分割网络的所述第一准确率。
[0013]优选的,所述根据所述区块链上每个区块中的所述第二准确率计算每个医院的初始训练集异常指标的方法,包括:
[0014]对于所述区块链上的所有区块,分别依次计算每个区块之后的连续多个区块上的损失函数均值,获取所述损失函数均值小于预设阈值时对应区块之后的所有目标区块;
[0015]根据所述目标区块中存储的所述第二准确率计算每个医院的所述初始训练集异常指标。
[0016]优选的,所述根据所述目标区块中存储的所述第二准确率计算每个医院的所述初始训练集异常指标的方法,包括:
[0017]基于相邻医院对应的两个所述目标区块,获取前一个医院的训练集分别在这两个所述目标区块中对应的所述第二准确率,以得到准确率差异;
[0018]根据这两个相邻医院对应的所有所述目标区块得到多个所述准确率差异以构成第一序列;
[0019]获取前一个医院对应的所有所述目标区块中的所述第二准确率以构成第二序列;
[0020]结合所述第一序列和所述第二序列计算前一个医院对后一个医院评估的所述初始训练集异常指标。
[0021]优选的,所述结合所述第一序列和所述第二序列计算前一个医院对后一个医院评估的所述初始训练集异常指标的方法,包括:
[0022]以设定长度窗口对所述第一序列进行滑窗滤波,计算每次滑窗内所包含的所述第一序列中对应元素的方差以得到方差序列;由所述窗口对所述第二序列进行均值滤波得到均值序列;结合所述方差序列和所述均值序列得到前一个医院对后一个医院评估的所述初始训练集异常指标。
[0023]优选的,所述结合所述评估信任向量和所述初始训练集异常指标得到每个医院的训练集异常程度的方法,包括:
[0024]计算当前医院与其他每个医院之间所述评估信任向量的欧氏距离,根据所述欧式距离分别得到当前医院与任意一个其他医院被相同医院信任的信任程度;
[0025]由其他每个医院的所述初始训练集异常指标和对应的所述信任程度得到其他所述医院的异常指标平均值;
[0026]结合当前医院的所述初始训练集异常指标和所述异常指标平均值得到所述当前医院的所述训练集异常程度。
[0027]优选的,所述训练集异常程度与所述初始训练集异常指标呈正相关、所述训练集异常程度与所述异常指标平均值呈负相关。
[0028]本专利技术实施例至少具有如下有益效果:通过对每个医院的语义分割网络的特征提取,以分析个医院之间的训练集差异情况,进而根据差异情况获取每个医院的的训练集异常程度,使得对每个医院的评估结果更加准确,对同时也降低了由训练集异常程度来识别恶意行为的误差,提高了每个医院对应神经网络的准确率。
附图说明
[0029]为了更清楚地说明本专利技术实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
[0030]图1为本专利技术一个实施例提供的一种基于联邦学习和特征提取的恶意行为识本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于联邦学习和特征提取的恶意行为识别方法,其特征在于,该方法包括:各个医院训练自己的语义分割网络,基于每个医院的数据集分别计算对应所述语义分割网络的第一准确率;将所述第一准确率最大的所述语义分割网络的网络参数存储在对应医院的区块中,且将该区块作为初始区块;所述数据集包括由多张医疗图像数据组成的训练集和测试集;对所有医院进行编号排序,将每个医院生产的区块按编号顺序依次连接在所述初始区块上以构成区块链;以所述初始区块中的网络参数开始获取相邻下一级区块的新网络参数,依次将上一级区块中的所述新网络参数共享给其相邻下一级区块对应的所述语义分割网络以得到新语义分割网络;分别获取所有医院的训练集利用所述新语义分割网络的第二准确率,将所述新语义分割网络的所述新网络参数、损失函数值和所有医院的所述第二准确率都存储在对应的区块中;当所有医院的网络参数未完全收敛时,继续将最后一个医院的区块作为所述初始区块进行下一轮的网络训练直至所有医院的所述语义分割网络收敛;根据所述区块链上每个区块中的所述第二准确率计算每个医院的初始训练集异常指标;基于两个医院之间训练集的相似度分别获取所有医院对一个医院的所述初始训练集异常指标的评估信任向量以得到每个医院对应的所述评估信任向量;结合所述评估信任向量和所述初始训练集异常指标得到每个医院的训练集异常程度,由所述训练集异常程度识别恶意行为。2.如权利要求1所述的方法,其特征在于,所述第一准确率的获取方法,包括:分别计算所述语义分割网络在所述训练集上的训练准确率和测试集上的所述测试准确率,进而由所述训练准确率和所述测试准确率计算出该语义分割网络的所述第一准确率。3.如权利要求1所述的方法,其特征在于,所述根据所述区块链上每个区块中的所述第二准确率计算每个医院的初始训练集异常指标的方法,包括:对于所述区块链上的所有区块,分别依次计算每个区块之后的连续多个区块上的损失函数均值,获取所述损...

【专利技术属性】
技术研发人员:杜冬高柏杏丽张劳模李博
申请(专利权)人:河南工程学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1