System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于网络安全,尤其涉及一种基于lstm模型的pcdn应用监测方法及系统。
技术介绍
1、本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。
2、pcdn(peer content delivery network)是一种构建在p2p(peer-to-peer)技术基础上的内容分发网络。它是一种用于优化内容传输和分发的网络技术,通过充分利用用户设备之间的网络资源,将内容从源服务器分发到最终用户,从而提高内容传输速度和用户体验。
3、传统的内容分发网络(cdn)通常采用集中式服务器分发内容,这些服务器位于全球各地,用户通过与这些服务器直接通信来获取内容。而pcdn技术则采用了点对点的分发方式,利用用户设备之间的资源来共同构建一个内容分发网络,从而降低对中心服务器的依赖,减少了带宽压力和延迟。但部分网络科技公司,通过安装客户端的方式,私自利用用户终端搭建pcdn节点,偷跑客户上行流量。
4、pcdn技术是为了提高网络内容传输的效率和性能而设计的,但滥用pcdn可能导致一些问题和挑战:
5、1、隐私和安全问题:滥用pcdn可能导致未经授权的数据收集和传输,可能会损害用户的隐私和数据安全。这可能发生在未经用户同意的情况下,pcdn服务商获取了用户的敏感信息。
6、2、版权侵权:某些情况下,滥用pcdn可能用于未经授权的内容分发,导致版权侵权问题。这样的行为可能损害原始内容提供者的权益。
7、3、网络恶意攻击:滥用pcdn可能成为网络
8、4、信息篡改:滥用pcdn可能被用来篡改传输的内容,例如在中间插入广告、篡改新闻等。这可能会影响信息的真实性和可信度。
9、5、网络稳定性问题:滥用pcdn可能导致网络拥堵和不稳定性。大量的请求通过pcdn节点传递,可能会对pcdn和源服务器造成压力。
10、现阶段,没有针对pcdn滥用的有效监控工具和体系。运行商(移动、联通、电信)会根据家庭宽带的上行利用率和上行流量,以及跟踪访问家庭宽带的ip的地址等信息判断家庭宽带是否存在pcdn节点或服务端,一旦判定用于搭建商业服务器,轻则限制流量,限制带宽,重则停止服务。
技术实现思路
1、为了解决上述
技术介绍
中存在的至少一项技术问题,本专利技术提供一种基于lstm模型的pcdn应用监测方法及系统,其使用lstm模型(长短期记忆网络,long short-termmemory),进行pcdn网络流量分析可以帮助识别pcdn流量模式、检测pcdn应用程序以及预测pcdn流量行为,对pcdn应用程序进行告警处理,用户可根据告警信息,对应用程序进行断网、拉黑等处理,同时,使用白名单方式,对加入白名单的应用程序不进行检测分析。
2、为了实现上述目的,本专利技术采用如下技术方案:
3、本专利技术的第一个方面提供一种基于lstm模型的pcdn应用监测方法,包括如下步骤:
4、获取pcdn网络流量数据和非pcdn网络流量数据;
5、基于pcdn网络流量数据、非pcdn网络流量数据对lstm模型进行训练,得到训练后的lstm模型;其中,lstm模型的训练过程包括:
6、提取pcdn网络流量数据和非pcdn网络流量数据中的特征信息,所述特征信息包括第一特征和第二特征,采用二进制编码对第一特征进行编码,采用分段编码对第二特征进行编码,筛选出适合lstm模型训练的数据;
7、采用训练后的lstm模型,进行待分析网络流量数据进行预测,得到网络流量预测结果。
8、进一步地,pcdn网络流量数据和非pcdn网络流量数据获取过程为:
9、在未启动pcdn的情况下,使用带有netflow功能的网关,间隔每分钟采集一次上行和下行流量,以每24小时为一个时间窗口,对经过网关的流量进行采集,得到流量信息观测值序列,非pcdn网络流量标记为1;
10、在启动pcdn的情况下,使用带有netflow功能的网关,间隔每分钟采集一次上行和下行流量,以每24小时为一个时间窗口,对经过网关的流量进行采集,得到流速率观测值序列,pcdn网络流量标记为0。
11、进一步地,所述方法还包括:非pcdn网络流量数据进行预处理,具体包括:
12、选取未启动pcdn的情况下的数据;
13、对数据进行清洗,使用python中的fillna()函数使用x填充空值,x在字典中的标识为1,使用duplicated()和drop_duplicates()函数来查找和删除重复的行。
14、进一步地,所述采用分段编码对第二特征进行编码包括:将端口号分为多个范围,每个范围作为一个类别,将0-1023作为第一类别,为知名端口所保留,1024-49151作为第二类别,为注册端口所保留,49152-65535作为第三类别,为动态或私有端口所保留的,对这些类别进行独热编码。
15、进一步地,所述特征信息还包括数据包大小分布bit、持续时间dt、数据包间隔、数据包方向、数据包序列和一个标签,标签中0代表该数据已参与训练,1代表该数据未参与训练。
16、进一步地,提取网络流量中的特征信息后,对提取的特征数据进行归一化和标准化处理,对一个滑动窗口内的标准化处理,在一个滑动窗口内标准化数据,只使用当前窗口内的数据来计算均值和标准差,保存训练数据的统计数据,在预测或测试新数据时,使用相同的统计数据进行归一化或标准化。
17、进一步地,所述lstm模型的构建过程包括:
18、确定隐藏层和神经元数量,使用1层隐藏层和50个神经元;
19、确定每次模型权重更新时使用的样本数量;
20、确定epoch数量和dropout比例;
21、确定优化器和学习率;
22、使用多分类交叉熵度量多分类问题中预测值与真实标签之间的差异。
23、本专利技术的第二个方面提供一种基于lstm模型的pcdn应用监测系统,包括:
24、系统流量采集单元,其用于获取pcdn网络流量数据和非pcdn网络流量数据;
25、流量数据处理模块,其用于基于pcdn网络流量数据、非pcdn网络流量数据对lstm模型进行训练,得到训练后的lstm模型;其中,lstm模型的训练过程包括:
26、提取pcdn网络流量数据和非pcdn网络流量数据中的特征信息,所述特征信息包括第一特征和第二特征,采用二进制编码对第一特征进行编码,采用分段编码对第二特征进行编码,筛选出适合lstm模型训练的数据;
27、pcdn预测单元,其用于采用训练后的lstm模型,进行待分析网络流量数据进行预测,得到网络流量预测结果。
28、本专利技术的第三个方面提供一种计算机可读存储介质。
29本文档来自技高网...
【技术保护点】
1.一种基于LSTM模型的PCDN应用监测方法,其特征在于,包括如下步骤:
2.如权利要求1所述的一种基于LSTM模型的PCDN应用监测方法,其特征在于,PCDN网络流量数据和非PCDN网络流量数据获取过程为:
3.如权利要求1所述的一种基于LSTM模型的PCDN应用监测方法,其特征在于,所述方法还包括:非PCDN网络流量数据进行预处理,具体包括:
4.如权利要求1所述的一种基于LSTM模型的PCDN应用监测方法,其特征在于,所述采用分段编码对第二特征进行编码包括:将端口号分为多个范围,每个范围作为一个类别,将0-1023作为第一类别,为知名端口所保留,1024-49151作为第二类别,为注册端口所保留,49152-65535作为第三类别,为动态或私有端口所保留的,对这些类别进行独热编码。
5.如权利要求1所述的一种基于LSTM模型的PCDN应用监测方法,其特征在于,所述特征信息还包括数据包大小分布Bit、持续时间DT、数据包间隔、数据包方向、数据包序列和一个标签,标签中0代表该数据已参与训练,1代表该数据未参与训练。
7.如权利要求1所述的一种基于LSTM模型的PCDN应用监测方法,其特征在于,所述LSTM模型的构建过程包括:
8.一种基于LSTM模型的PCDN应用监测系统,其特征在于,包括:
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的一种基于LSTM模型的PCDN应用监测方法中的步骤。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一项所述的一种基于LSTM模型的PCDN应用监测方法中的步骤。
...【技术特征摘要】
1.一种基于lstm模型的pcdn应用监测方法,其特征在于,包括如下步骤:
2.如权利要求1所述的一种基于lstm模型的pcdn应用监测方法,其特征在于,pcdn网络流量数据和非pcdn网络流量数据获取过程为:
3.如权利要求1所述的一种基于lstm模型的pcdn应用监测方法,其特征在于,所述方法还包括:非pcdn网络流量数据进行预处理,具体包括:
4.如权利要求1所述的一种基于lstm模型的pcdn应用监测方法,其特征在于,所述采用分段编码对第二特征进行编码包括:将端口号分为多个范围,每个范围作为一个类别,将0-1023作为第一类别,为知名端口所保留,1024-49151作为第二类别,为注册端口所保留,49152-65535作为第三类别,为动态或私有端口所保留的,对这些类别进行独热编码。
5.如权利要求1所述的一种基于lstm模型的pcdn应用监测方法,其特征在于,所述特征信息还包括数据包大小分布bit、持续时间dt、数据包间隔、数据包方向、数据包序列和一个标签,标签中0代表该数据已参与训练,1代表该数据...
【专利技术属性】
技术研发人员:马晓红,张建成,郭锐,郭峰,吴书胜,张玉良,王红强,鹿全礼,任强,陈纪旸,李士宽,于小苇,万翠凤,
申请(专利权)人:山东正中信息技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。