一种基于改进联邦学习算法的恶意流量分类方法技术

技术编号：35460039 阅读：55 留言：0更新日期：2022-11-03 12:26

本发明专利技术属于机器学习领域，具体涉及一种基于改进联邦学习算法的恶意流量分类方法。针对目前恶意流量分类方法中存在的“数据孤岛”问题和原始联邦学习算法存在的数据异构问题，本发明专利技术设计并实现了一种基于改进联邦学习算法的恶意流量分类方法。相较于传统的分类方法，本发明专利技术不需要把数据进行集中训练，只需要通过中央服务器聚合各个参与者使用本地数据训练的模型参数来进行协作训练，维护了网络安全厂商的数据安全。相较于原始的联邦学习方法，本发明专利技术通过将具有近似数据分布的参与者划分为一个集群，使得每个集群里的数据分布呈现独立同分布，然后再将每个集群串行训练的方法使得联邦学习算法对非独立同分布的数据也呈现较好的效果。实验证明，本发明专利技术能够对恶意流量分类呈现较好的效果。类呈现较好的效果。类呈现较好的效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于改进联邦学习算法的恶意流量分类方法

[0001]本专利技术属于机器学习领域，具体涉及一种基于改进联邦学习算法的恶意流量分类方法。

技术介绍

[0002]互联网的飞速发展给人们的生活带来了巨大的变化，互联网用户数量呈现爆炸式增长，网民平均上网时间也呈现持续增长的态势。与此同时，互联网环境遭受的网络攻击也越来越频繁，攻击方式也层出不穷。这些网络攻击给人们的信息财产安全和网络空间安全带来了极大的隐患，如何有效的预防网络安全问题带来的危害变得越来越重要。其中将恶意流量分类是进行有效预防网络安全问题中重要的一步。
[0003]目前各个网络安全厂商以及相关国家机构都有自己的恶意流量分类系统，但是由于人们对数据隐私的保护越来越重视，这些组织机构只能基于自己的数据来做分析，这就形成了“数据孤岛”情况，即政府部门、科研部门以及互联网公司等由于隐私保护而不能共享数据。例如360公司只能基于自己的网络安全数据来做自己恶意流量分类系统，由于隐私保护的原因，它无法获取腾讯、长城等网络安全厂商的网络安全数据，这就导致它训练得到的恶意流量分类模型不够全面，有很多的不足。
[0004]联邦学习是一种具有隐私保护功能的分布式机器学习，在中央服务器的协调下，多个参与者协作解决机器学习模型训练问题并且每个参与者的原始私有数据存储在本地，很好的解决了目前的恶意流量分类技术的上述局限。但是现有的联邦学习算法存在数据异构性，当数据呈非独立同分布时联邦学习不能发挥出很好的效果，而现实世界中的数据都是呈现非独立同分布的。
专利技术内...

【技术保护点】

【技术特征摘要】
1.一种基于改进联邦学习算法的恶意流量分类方法，其特征在于，包括以下步骤：S1、每个参与联邦学习的网络安全厂商计算自己的数据属性I，并将其发送给中央服务器；其中数据属性定义为：n为参与者所拥有的样本量，n
i
为所拥有的第i类数据的样本量；S2、中央服务器使用聚类算法来将所有的网络安全厂商聚合到N个集群S
N
中，其中聚类算法为：(1)将每个网络安全厂商视为单独的一个集群；(2)计算两个集群之间的距离，并合并最小距离的两个集群，两个集群之间的距离定义为D
p,q
＝max(d
ij
＝||I
i
‑
I
j
||2|i∈p,j∈q)
ꢀꢀꢀꢀ
(1)其中d
ij
代表集群p中的网络安全厂商...

【专利技术属性】
技术研发人员：王壮，刘仁婷，任春辉，付毓生，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人