基于LSTM模型的网络流量资源态势预测方法技术

技术编号:20568719 阅读:34 留言:0更新日期:2019-03-14 10:44
本发明专利技术属于网络流量资源态势预测技术领域,特别是一种基于LSTM模型的网络流量资源态势预测方法。本发明专利技术的目的在于提出适用于流量时空非线性特点的长短期记忆(Long Short‑Term Memory,LSTM)循环神经网络预测模型。该模型结合实际流量数据突发性较强和长程依赖的特点进行模型训练和定量预测。本发明专利技术的有益效果为,本发明专利技术通过LSTM模型实现对网络流量的预测功能,有效的提高了预测准确性,并且当数据样本差异性较大时,LSTM预测模型的优势更加显著。

Network Traffic Resource Situation Prediction Method Based on LSTM Model

The invention belongs to the technical field of network traffic resource situation prediction, in particular to a network traffic resource situation prediction method based on LSTM model. The object of the present invention is to propose a long Short Term Memory (LSTM) cyclic neural network prediction model suitable for the temporal and spatial nonlinearity of traffic flow. This model combines the characteristics of strong burst and long-term dependence of actual traffic data to train and quantitatively predict the model. The beneficial effect of the present invention is that the LSTM model realizes the prediction function of network traffic, effectively improves the prediction accuracy, and when the difference of data samples is large, the advantages of the LSTM prediction model are more significant.

【技术实现步骤摘要】
基于LSTM模型的网络流量资源态势预测方法
本专利技术属于网络流量资源态势预测
,特别是一种基于LSTM模型的网络流量资源态势预测方法。
技术介绍
随着网络的普及和发展,网络管理面临许多挑战。无线传感网,Adhoc网络,space-basednetwork等冗杂的异构网络设备让拓扑结构日趋复杂,频繁的信息交互使得网络流量激增,网络运行状况的复杂性和不确定性描述能力相应降低。流量预测已成为流量工程、拥塞控制和网络运维管理研究的核心问题。由于通信网络的多协议特性和业务源的突发性,网络负载常保持在大流量突发与长时间相对静止交替出现的状态,使得流量数据的非线性特点尤为明显。因此,探究适应于通信网络流量数据多变化性特点的预测技术,动态预测未来时刻的流量值,将预测误差控制在一定范围内,能够更好地为通信网络信息反馈和资源调度提供数据支撑,这对通信网络长期部署具有重要的指导意义。流量预测指的是通过对数据预处理之后的历史数据选择适合的模型进行样本学习,达到预测未来某一段时刻内的同一指标值的效果。为了提高预测的精确性,在模型选择上应该适应于历史时间序列的特点。近年来,随着机器学习和深度学习知识背景的丰富和研究领域的扩展,数据的处理不再局限于传统单一数学模型的适应性。基于人工神经网络的深度学习模型能够通过样本的自适应学习,迭代更新网络层与层之间的权值和偏置参数,较好的拟合非线性数据处理问题。通过丰富训练样本和增加隐层数量和隐层神经元个数,能够较大范围调整模型的适应度,在非线性时间序列预测上表现突出,但同时由于对数据特点的敏感性和依赖性,不同场景下所适应的模型存在较大的差异性。通信网络流量会因网络环境、流量采集时间长度以及时间尺度等因素的不同而表现出不同的特性,网络流量预测很难找到一种通用的建模方法,主要原因有:1)数据本身存在较强的随机性,并不是严格按照某种既定规律出现,预测误差难以通过数学统计模型有效把控;2)网络流量存在较多的突发情况,导致流量的非线性剧增,即使采用人工神经网络等非线性模型也很难对其变化规律进行准确建模。
技术实现思路
本专利技术的专利技术目的在于:针对上述存在的问题,探究了适用于流量时空非线性特点的长短期记忆(LongShort-TermMemory,LSTM)循环神经网络预测模型。该模型结合实际流量数据突发性较强和长程依赖的特点进行模型训练和定量预测。本专利技术采用的技术方案如下,基于LSTM模型的网络流量资源态势预测方法,其特征在于,包括以下步骤:S1、数据预处理:通过对固定频率下采样所得的通信网络ODij流数据进行处理,得到N个连续周期下的时间序列X(t)=[x1,x2,...,xN];其中ODij流的定义为主机i到主机j的端到端流量;S2、建立LSTM模型:确定神经网络中输入神经元个数R,输出神经元个数M以及隐层神经元数量,完成从输入空间UR到输出空间UM的映射,即根据前R个时刻流量值预测后M个时刻流量值,设定步长τ进行相空间分解与重构,建立训练样本输入X到输出Y的映射:其中yi=x(m-i)τ;其中,X中的每一行对应一个训练输入样本,长度为τ,经过LSTM模型正向传播映射得到输出样本标签值yi',与真实流量值yi进行误差损失计算,反馈训练LSTM模型;S3、根据S1获取的数据,对S2建立的LSTM模型进训练,获得训练好的LSTM模型,具体为:S31、从S1中获得的数据中切割出训练数据n,并按S2中设定步长τ,将训练数据分为n/τ+1个样本集,进行空间重构,按列存储为输入矩阵X以及其对应矩阵Y;S32、对矩阵按列进行归一化处理,将数据转换到[0,1]范围内,建立标准化数据;所述归一化采用公式其中xmin和xmax分别为该组样本的最小值和最大值,xi为样本组中对应每一个流量值,i取1,2,…τ;S33、设定随机初始权值对LSTM网络进行初始化,并输入样本集对网络进行训练,根据训练中最优均方误差PMSE所对应参数建立一个τ输入1输出的神经网络;S4、采用步骤S1的方法获得流量数据,利用步骤S3中训练好的LSTM模型,得出预测结果。本专利技术的有益效果为,本专利技术通过LSTM模型实现对网络流量的预测功能,有效的提高了预测准确性,并且当数据样本差异性较大时,LSTM预测模型的优势更加显著。附图说明图1为基于LSTM的流量预测算法流程;图2为实验数据图,其中,图(a)为不同采样粒度下的单条OD流,图(b)为不同OD流的流量形态;图3为基于LSTM的网络流量预测;图4为不同步长和隐层神经元数量下的流量预测效果对比,其中,图(a)为固定神经元数量探究不同步长参数产生的影响,图(b)为固定步长探究不同隐层神经元数量的影响;图5为不同采样粒度下对流量预测结果的影响;图6为不同流量形态下所探究算法与常用其他算法的预测情况对比结果,其中对比算法包括PSO-LSSVM、BP、Elman算法,其中,图(a)为训练效果对比图,图(b)为预测相对误差对比图。具体实施方式下面结合附图和实施例,详细描述本专利技术的技术方案。如图1所示,为本专利技术的基于LSTM的流量预测算法流程,主要包括:根据历史数据获得样本数据,即对数据预处理:通过对固定频率下采样所得的通信网络ODij流(主机i到主机j的端到端流量)数据进行处理,得到N个连续周期下的时间序列X(t)=[x1,x2,...,xN]。1)对于单一OD流数据,通过二次采样将数据进一步离散化,得到不同采样周期下的时间序列数据;2)选取同一网络下多条不同特点的OD流进行等时间间隔采样,得到多条时间序列数据。网络模型设计,对LSTM网络模型进行设计,确定神经网络中输入神经元个数R,输出神经元个数M以及隐层神经元数量,完成从输入空间UR到输出空间UM的映射。对于具有单一量化指标的时间序列预测,根据前R个时刻流量值预测后M个时刻流量值可选取步长τ进行相空间分解与重构,转化为X到Y的映射问题:其中yi=x(m-i)τ;其中X中的每一行对应一个训练输入样本,长度为τ,经过LSTM模型正向传播映射得到输出样本标签值yi',与真实流量值yi进行误差损失计算,反馈训练LSTM模型。神经网络模型的参数设置,如LSTM网络的逻辑门权值参数。在预测过程中,通过迭代寻优的方法自适应调整这些参数,参数的选择标准采用终止代数K前的最优均方误差PMSE,即当达到收敛时停止训练和参数更新。其中k表示当前迭代次数;LSTM能够很好的学习数据间的非线性映射,在LSTM模型训练过程中,每个LSTM神经元细胞的输入都包含上时刻单元状态Ct-1和上时刻LSTM输出ht-1以及当前时刻输入Xt三部分组成,同时神经单元内的输入门、遗忘门和输出门完成了信息选择和信息转换的功能,具体如下:遗忘门用来选择上一个时刻的信息被保留或忘记,1表示保留,0表示丢弃,wf、bf分别为神输入门对应权值和偏置参数,ht-1表示上一时刻输出信息,Xt为当前时刻的输入:ft=σ(wf·[ht-1,Xt]+bf)∈{0,1}输入门负责计算当前输入的保留信息it和新状态信息Ct'的产生,wi、bi、wc、bc为遗忘门对应权值和偏置参数:所以当前LSTM的隐层神经元状态更新为Ct=ft*Ct-1+it*Ct';输出门表示当前时刻的输出信息ht,是上一时刻状态、当前输入和本文档来自技高网
...

【技术保护点】
1.基于LSTM模型的网络流量资源态势预测方法,其特征在于,包括以下步骤:S1、数据预处理:通过对固定频率下采样所得的通信网络ODij流数据进行处理,得到N个连续周期下的时间序列X(t)=[x1,x2,...,xN];其中ODij流的定义为主机i到主机j的端到端流量;S2、建立LSTM模型:确定神经网络中输入神经元个数R,输出神经元个数M以及隐层神经元数量,完成从输入空间UR到输出空间UM的映射,即根据前R个时刻流量值预测后M个时刻流量值,设定步长τ进行相空间分解与重构,建立训练样本输入X到输出Y的映射:

【技术特征摘要】
1.基于LSTM模型的网络流量资源态势预测方法,其特征在于,包括以下步骤:S1、数据预处理:通过对固定频率下采样所得的通信网络ODij流数据进行处理,得到N个连续周期下的时间序列X(t)=[x1,x2,...,xN];其中ODij流的定义为主机i到主机j的端到端流量;S2、建立LSTM模型:确定神经网络中输入神经元个数R,输出神经元个数M以及隐层神经元数量,完成从输入空间UR到输出空间UM的映射,即根据前R个时刻流量值预测后M个时刻流量值,设定步长τ进行相空间分解与重构,建立训练样本输入X到输出Y的映射:其中yi=x(m-i)τ;其中,X中的每一行对应一个训练输入样本,长度为τ,经过LSTM模型正向传播映射得到输出样本标签值yi',与真实流量值yi进行误差损失计算,反馈训练LSTM模型;S3、根据S1获取的数据,对S2建立的LSTM模型进训练,获得训练好的LSTM模型,具体为:S31、从S1中获得的数据中切割出训练数据n,并按S2中设定...

【专利技术属性】
技术研发人员:胡孟婷苏俭郭伟
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1