System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于LSTM模型的PCDN应用监测方法及系统技术方案_技高网

一种基于LSTM模型的PCDN应用监测方法及系统技术方案

技术编号:40316279 阅读:14 留言:0更新日期:2024-02-07 20:58
本发明专利技术属于网络安全技术领域,提供了一种基于LSTM模型的PCDN应用监测方法及系统,通过获取PCDN网络流量数据;提取PCDN网络流量中的特征信息,所述特征信息包括第一特征和第二特征,采用二进制编码对第一特征进行编码,采用分段编码对第二特征进行编码,筛选出适合LSTM模型训练的数据;采用训练后的LSTM模型,进行PCDN网络流量分析得到PCDN流量模式、检测PCDN应用程序以及预测PCDN流量行为。对PCDN应用程序进行告警处理,用户可根据告警信息,对应用程序进行断网、拉黑等处理。可针对PCDN滥用的有效监控。

【技术实现步骤摘要】

本专利技术属于网络安全,尤其涉及一种基于lstm模型的pcdn应用监测方法及系统。


技术介绍

1、本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。

2、pcdn(peer content delivery network)是一种构建在p2p(peer-to-peer)技术基础上的内容分发网络。它是一种用于优化内容传输和分发的网络技术,通过充分利用用户设备之间的网络资源,将内容从源服务器分发到最终用户,从而提高内容传输速度和用户体验。

3、传统的内容分发网络(cdn)通常采用集中式服务器分发内容,这些服务器位于全球各地,用户通过与这些服务器直接通信来获取内容。而pcdn技术则采用了点对点的分发方式,利用用户设备之间的资源来共同构建一个内容分发网络,从而降低对中心服务器的依赖,减少了带宽压力和延迟。但部分网络科技公司,通过安装客户端的方式,私自利用用户终端搭建pcdn节点,偷跑客户上行流量。

4、pcdn技术是为了提高网络内容传输的效率和性能而设计的,但滥用pcdn可能导致一些问题和挑战:

5、1、隐私和安全问题:滥用pcdn可能导致未经授权的数据收集和传输,可能会损害用户的隐私和数据安全。这可能发生在未经用户同意的情况下,pcdn服务商获取了用户的敏感信息。

6、2、版权侵权:某些情况下,滥用pcdn可能用于未经授权的内容分发,导致版权侵权问题。这样的行为可能损害原始内容提供者的权益。

7、3、网络恶意攻击:滥用pcdn可能成为网络攻击的一种工具。攻击者可能使用pcdn来隐藏其身份和源服务器位置,以逃避检测和阻止。

8、4、信息篡改:滥用pcdn可能被用来篡改传输的内容,例如在中间插入广告、篡改新闻等。这可能会影响信息的真实性和可信度。

9、5、网络稳定性问题:滥用pcdn可能导致网络拥堵和不稳定性。大量的请求通过pcdn节点传递,可能会对pcdn和源服务器造成压力。

10、现阶段,没有针对pcdn滥用的有效监控工具和体系。运行商(移动、联通、电信)会根据家庭宽带的上行利用率和上行流量,以及跟踪访问家庭宽带的ip的地址等信息判断家庭宽带是否存在pcdn节点或服务端,一旦判定用于搭建商业服务器,轻则限制流量,限制带宽,重则停止服务。


技术实现思路

1、为了解决上述
技术介绍
中存在的至少一项技术问题,本专利技术提供一种基于lstm模型的pcdn应用监测方法及系统,其使用lstm模型(长短期记忆网络,long short-termmemory),进行pcdn网络流量分析可以帮助识别pcdn流量模式、检测pcdn应用程序以及预测pcdn流量行为,对pcdn应用程序进行告警处理,用户可根据告警信息,对应用程序进行断网、拉黑等处理,同时,使用白名单方式,对加入白名单的应用程序不进行检测分析。

2、为了实现上述目的,本专利技术采用如下技术方案:

3、本专利技术的第一个方面提供一种基于lstm模型的pcdn应用监测方法,包括如下步骤:

4、获取pcdn网络流量数据和非pcdn网络流量数据;

5、基于pcdn网络流量数据、非pcdn网络流量数据对lstm模型进行训练,得到训练后的lstm模型;其中,lstm模型的训练过程包括:

6、提取pcdn网络流量数据和非pcdn网络流量数据中的特征信息,所述特征信息包括第一特征和第二特征,采用二进制编码对第一特征进行编码,采用分段编码对第二特征进行编码,筛选出适合lstm模型训练的数据;

7、采用训练后的lstm模型,进行待分析网络流量数据进行预测,得到网络流量预测结果。

8、进一步地,pcdn网络流量数据和非pcdn网络流量数据获取过程为:

9、在未启动pcdn的情况下,使用带有netflow功能的网关,间隔每分钟采集一次上行和下行流量,以每24小时为一个时间窗口,对经过网关的流量进行采集,得到流量信息观测值序列,非pcdn网络流量标记为1;

10、在启动pcdn的情况下,使用带有netflow功能的网关,间隔每分钟采集一次上行和下行流量,以每24小时为一个时间窗口,对经过网关的流量进行采集,得到流速率观测值序列,pcdn网络流量标记为0。

11、进一步地,所述方法还包括:非pcdn网络流量数据进行预处理,具体包括:

12、选取未启动pcdn的情况下的数据;

13、对数据进行清洗,使用python中的fillna()函数使用x填充空值,x在字典中的标识为1,使用duplicated()和drop_duplicates()函数来查找和删除重复的行。

14、进一步地,所述采用分段编码对第二特征进行编码包括:将端口号分为多个范围,每个范围作为一个类别,将0-1023作为第一类别,为知名端口所保留,1024-49151作为第二类别,为注册端口所保留,49152-65535作为第三类别,为动态或私有端口所保留的,对这些类别进行独热编码。

15、进一步地,所述特征信息还包括数据包大小分布bit、持续时间dt、数据包间隔、数据包方向、数据包序列和一个标签,标签中0代表该数据已参与训练,1代表该数据未参与训练。

16、进一步地,提取网络流量中的特征信息后,对提取的特征数据进行归一化和标准化处理,对一个滑动窗口内的标准化处理,在一个滑动窗口内标准化数据,只使用当前窗口内的数据来计算均值和标准差,保存训练数据的统计数据,在预测或测试新数据时,使用相同的统计数据进行归一化或标准化。

17、进一步地,所述lstm模型的构建过程包括:

18、确定隐藏层和神经元数量,使用1层隐藏层和50个神经元;

19、确定每次模型权重更新时使用的样本数量;

20、确定epoch数量和dropout比例;

21、确定优化器和学习率;

22、使用多分类交叉熵度量多分类问题中预测值与真实标签之间的差异。

23、本专利技术的第二个方面提供一种基于lstm模型的pcdn应用监测系统,包括:

24、系统流量采集单元,其用于获取pcdn网络流量数据和非pcdn网络流量数据;

25、流量数据处理模块,其用于基于pcdn网络流量数据、非pcdn网络流量数据对lstm模型进行训练,得到训练后的lstm模型;其中,lstm模型的训练过程包括:

26、提取pcdn网络流量数据和非pcdn网络流量数据中的特征信息,所述特征信息包括第一特征和第二特征,采用二进制编码对第一特征进行编码,采用分段编码对第二特征进行编码,筛选出适合lstm模型训练的数据;

27、pcdn预测单元,其用于采用训练后的lstm模型,进行待分析网络流量数据进行预测,得到网络流量预测结果。

28、本专利技术的第三个方面提供一种计算机可读存储介质。

29本文档来自技高网...

【技术保护点】

1.一种基于LSTM模型的PCDN应用监测方法,其特征在于,包括如下步骤:

2.如权利要求1所述的一种基于LSTM模型的PCDN应用监测方法,其特征在于,PCDN网络流量数据和非PCDN网络流量数据获取过程为:

3.如权利要求1所述的一种基于LSTM模型的PCDN应用监测方法,其特征在于,所述方法还包括:非PCDN网络流量数据进行预处理,具体包括:

4.如权利要求1所述的一种基于LSTM模型的PCDN应用监测方法,其特征在于,所述采用分段编码对第二特征进行编码包括:将端口号分为多个范围,每个范围作为一个类别,将0-1023作为第一类别,为知名端口所保留,1024-49151作为第二类别,为注册端口所保留,49152-65535作为第三类别,为动态或私有端口所保留的,对这些类别进行独热编码。

5.如权利要求1所述的一种基于LSTM模型的PCDN应用监测方法,其特征在于,所述特征信息还包括数据包大小分布Bit、持续时间DT、数据包间隔、数据包方向、数据包序列和一个标签,标签中0代表该数据已参与训练,1代表该数据未参与训练。

6.如权利要求1所述的一种基于LSTM模型的PCDN应用监测方法,其特征在于,提取网络流量中的特征信息后,对提取的特征数据进行归一化和标准化处理,对一个滑动窗口内的标准化处理,在一个滑动窗口内标准化数据,只使用当前窗口内的数据来计算均值和标准差,保存训练数据的统计数据,在预测或测试新数据时,使用相同的统计数据进行归一化或标准化。

7.如权利要求1所述的一种基于LSTM模型的PCDN应用监测方法,其特征在于,所述LSTM模型的构建过程包括:

8.一种基于LSTM模型的PCDN应用监测系统,其特征在于,包括:

9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的一种基于LSTM模型的PCDN应用监测方法中的步骤。

10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一项所述的一种基于LSTM模型的PCDN应用监测方法中的步骤。

...

【技术特征摘要】

1.一种基于lstm模型的pcdn应用监测方法,其特征在于,包括如下步骤:

2.如权利要求1所述的一种基于lstm模型的pcdn应用监测方法,其特征在于,pcdn网络流量数据和非pcdn网络流量数据获取过程为:

3.如权利要求1所述的一种基于lstm模型的pcdn应用监测方法,其特征在于,所述方法还包括:非pcdn网络流量数据进行预处理,具体包括:

4.如权利要求1所述的一种基于lstm模型的pcdn应用监测方法,其特征在于,所述采用分段编码对第二特征进行编码包括:将端口号分为多个范围,每个范围作为一个类别,将0-1023作为第一类别,为知名端口所保留,1024-49151作为第二类别,为注册端口所保留,49152-65535作为第三类别,为动态或私有端口所保留的,对这些类别进行独热编码。

5.如权利要求1所述的一种基于lstm模型的pcdn应用监测方法,其特征在于,所述特征信息还包括数据包大小分布bit、持续时间dt、数据包间隔、数据包方向、数据包序列和一个标签,标签中0代表该数据已参与训练,1代表该数据...

【专利技术属性】
技术研发人员:马晓红张建成郭锐郭峰吴书胜张玉良王红强鹿全礼任强陈纪旸李士宽于小苇万翠凤
申请(专利权)人:山东正中信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1