基于联邦学习和特征提取的恶意行为识别方法技术

技术编号：32128603 阅读：17 留言：0更新日期：2022-01-29 19:22

本发明专利技术涉及人工智能技术领域，具体涉及一种基于联邦学习和特征提取的恶意行为识别方法。该方法包括各个医院训练自己的语义分割网络以得到对应语义分割网络的第一准确率，以第一准确率最大的语义分割网络的网络参数为初始值，依次对每个医院的语义分割网络进行网络训练和网络参数的更新，同时将每个语义分割网络训练后的新网络参数、损失函数值以及该语义分割网络在所有医院训练集上的第二准确率都存储在对应医院生成的区块中；根据区块中存储的数据获取每个医院的训练集异常程度，由训练集异常程度识别恶意行为。对每个医院的语义分割网络进行特征提取，来分析各医院之间的训练集差异情况，从而识别恶意行为。从而识别恶意行为。从而识别恶意行为。

全部详细技术资料下载

【技术实现步骤摘要】
基于联邦学习和特征提取的恶意行为识别方法

[0001]本专利技术涉及人工智能
，具体涉及一种基于联邦学习和特征提取的恶意行为识别方法。

技术介绍

[0002]随着医疗技术的进步，各医院纷纷利用先进的医疗设备来诊断疾病，例如利用X射线等透视成像设备和内窥镜设备或者核磁共振设备等，将病人的病情以图象数据的方式可视化出来，辅助医师跟价快速准确的诊断出病情和确定治疗方案。
[0003]随着人工智能技术的发展，利用各种各样的神经网络来根据医疗图像数据诊断病情，其中最常用的技术是利用神经网络分割医疗图像数据，获得图像上器官的病灶区域。但是由于单个医院的医疗图像数据样本少，带标签的数据样本更少，并且各个医院的医疗图像数据不共享，使得单个医院只能根据自身少量的医疗图像数据样本训练神经网络，虽然能够满足常规疾病的诊断，但是会导致神经网络的误诊率高，无法诊断出难以发现的病灶。
[0004]现有的联邦学习可以在医院不共享数据的情况下获得一个准确率高的神经网络，联邦学习的大致过程是各医院将各自训练的模型参数共享给中心服务器，中心服务器通将各医院的模型参数进行融合然后再分发给各医院，各医院在接收到的参数基础上继续训练模型，然后一直重复这个过程。联邦学习中利用数据的同态加密和身份验证等信息确保数据的安全。
[0005]各医院用于训练网络的数据集中的医疗图像数据的标注需要专业医师或相关人员标注，而由于医师和相关人员的技术或职业水平存在差异，使得标注图像样本标签的标准不能统一，导致有一些医院为了节省标注成本或者管理监督...

【技术保护点】

【技术特征摘要】
1.一种基于联邦学习和特征提取的恶意行为识别方法，其特征在于，该方法包括：各个医院训练自己的语义分割网络，基于每个医院的数据集分别计算对应所述语义分割网络的第一准确率；将所述第一准确率最大的所述语义分割网络的网络参数存储在对应医院的区块中，且将该区块作为初始区块；所述数据集包括由多张医疗图像数据组成的训练集和测试集；对所有医院进行编号排序，将每个医院生产的区块按编号顺序依次连接在所述初始区块上以构成区块链；以所述初始区块中的网络参数开始获取相邻下一级区块的新网络参数，依次将上一级区块中的所述新网络参数共享给其相邻下一级区块对应的所述语义分割网络以得到新语义分割网络；分别获取所有医院的训练集利用所述新语义分割网络的第二准确率，将所述新语义分割网络的所述新网络参数、损失函数值和所有医院的所述第二准确率都存储在对应的区块中；当所有医院的网络参数未完全收敛时，继续将最后一个医院的区块作为所述初始区块进行下一轮的网络训练直至所有医院的所述语义分割网络收敛；根据所述区块链上每个区块中的所述第二准确率计算每个医院的初始训练集异常指标；基于两个医院之间训练集的相似度分别获取所有医院对一个医院的所述初始训练集异常指标的评估信任向量以得到每个医院对应的所述评估信任向量；结合所述评估信任向量和所述初始训练集异常指标得到每个医院的训练集异常程度，由所述训练集异常程度识别恶意行为。2.如权利要求1所述的方法，其特征在于，所述第一准确率的获取方法，包括：分别计算所述语义分割网络在所述训练集上的训练准确率和测试集上的所述测试准确率，进而由所述训练准确率和所述测试准确率计算出该语义分割网络的所述第一准确率。3.如权利要求1所述的方法，其特征在于，所述根据所述区块链上每个区块中的所述第二准确率计算每个医院的初始训练集异常指标的方法，包括：对于所述区块链上的所有区块，分别依次计算每个区块之后的连续多个区块上的损失函数均值，获取所述损...

【专利技术属性】
技术研发人员：杜冬高，柏杏丽，张劳模，李博，
申请(专利权)人：河南工程学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人