一种流量数据的处理方法和装置制造方法及图纸

技术编号:37769981 阅读:9 留言:0更新日期:2023-06-06 13:33
本发明专利技术实施例提供了一种流量数据的处理方法和装置,所述方法包括:获取真实流量数据,并根据所述真实流量数据,生成第一特征向量,基于所述第一特征向量,对预置的生成对抗网络进行训练,并调用训练好的生成对抗网络,生成仿真流量数据,将所述真实流量数据和所述仿真流量数据作为训练样本,对预置的流量识别模型进行训练,并采用训练好的流量识别模型,对实时流量数据进行识别,实现了基于生成对抗模型生成大规模仿真流量数据,可以实现借助少量真实的视频流量样本,可以快速生成大规模网络视频流量数据,帮助提升视频流量识别准确率。帮助提升视频流量识别准确率。帮助提升视频流量识别准确率。

【技术实现步骤摘要】
一种流量数据的处理方法和装置


[0001]本专利技术涉及计算机领域,特别是涉及一种流量数据的处理方法和装置。

技术介绍

[0002]SDWAN(Software Defined Wide Area Network,软件定义广域网)智能网关通过部署在用户接入侧,可以实现用户一站入云、组网、互联。在产品的使用过程中,用户希望SDWAN智能网关能对视频流量数据进行准备识别,以保证其传输质量,而由于视频流量数据大多为UDP(User Datagram Protocol,用户数据报协议)传输类型,没有明显字符串特征,往往需要基于业务流量会话的统计特征,并借助机器学习等一些统计模型进行识别。
[0003]然而,机器学习模型需要基于大规模数据集进行训练获取最优参数,从而对流量会话进行准确识别,但采集大规模的视频流量数据需要耗费大量的人力和时间成本,训练样本不足会导致流量识别模型在训练过程中有过拟合或无法收敛等现象,进而导致模型的识别准备率较低。

技术实现思路

[0004]鉴于上述问题,提出了以便提供克服上述问题或者至少部分地解决上述问题的一种流量数据的处理方法和装置,包括:
[0005]一种流量数据的处理方法,所述方法包括:
[0006]获取真实流量数据,并根据所述真实流量数据,生成第一特征向量;
[0007]基于所述第一特征向量,对预置的生成对抗网络进行训练,并调用训练好的生成对抗网络,生成仿真流量数据;
[0008]将所述真实流量数据和所述仿真流量数据作为训练样本,对预置的流量识别模型进行训练,并采用训练好的流量识别模型,对实时流量数据进行识别。
[0009]可选地,所述生成对抗网络包括生成网络和判别网络,所述基于所述第一特征向量,对预置的生成对抗网络进行训练,包括:
[0010]调用所述生成对抗网络中生成网络,生成第二特征向量;
[0011]基于所述第一特征向量和所述第二特征向量,对所述生成对抗网络中生成网络和判别网络进行对抗迭代训练。
[0012]可选地,所述基于所述第一特征向量和所述第二特征向量,对所述生成对抗网络中生成网络和判别网络进行对抗迭代训练,包括:
[0013]对所述生成对抗网络中生成网络进行训练,以最大化所述第一特征向量与所述第二特征向量之间的距离。
[0014]可选地,所述基于所述第一特征向量和所述第二特征向量,对所述生成对抗网络中生成网络和判别网络进行对抗迭代训练,包括:
[0015]对所述生成对抗网络中判别网络进行训练,以最小化所述第一特征向量与所述第二特征向量之间的距离。
[0016]可选地,所述第一特征向量与所述第二特征向量之间的距离为根据所述第一特征向量与所述第二特征向量在特征空间中的分布计算得到。
[0017]可选地,所述生成网络为基于长短期记忆模型实现。
[0018]可选地,所述判别网络为基于支持向量机实现。
[0019]可选地,所述第一特征向量和所述第二特征向量包括时间间隔向量和报文长度向量。
[0020]可选地,所述时间间隔向量由相邻两个报文到达的时间间隔组成。
[0021]可选地,所述报文长度向量由所有的报文的报文长度组成。
[0022]可选地,所述实时流量数据为SDWAN智能网关接收到的流量数据。
[0023]可选地,所述实时流量数据为视频流量数据。
[0024]一种流量数据的处理装置,所述装置包括:
[0025]第一特征向量生成模块,用于获取真实流量数据,并根据所述真实流量数据,生成第一特征向量;
[0026]仿真流量数据生成模块,用于基于所述第一特征向量,对预置的生成对抗网络进行训练,并调用训练好的生成对抗网络,生成仿真流量数据;
[0027]实时流量数据识别模块,用于将所述真实流量数据和所述仿真流量数据作为训练样本,对预置的流量识别模型进行训练,并采用训练好的流量识别模型,对实时流量数据进行识别。
[0028]一种电子设备,其特征在于,包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上所述的流量数据的处理方法。
[0029]一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如上所述的流量数据的处理方法。
[0030]本专利技术实施例具有以下优点:
[0031]在本专利技术实施例中,通过获取真实流量数据,并根据所述真实流量数据,生成第一特征向量,基于所述第一特征向量,对预置的生成对抗网络进行训练,并调用训练好的生成对抗网络,生成仿真流量数据,将所述真实流量数据和所述仿真流量数据作为训练样本,对预置的流量识别模型进行训练,并采用训练好的流量识别模型,对实时流量数据进行识别,实现了基于生成对抗模型生成大规模仿真流量数据,可以实现借助少量真实的视频流量样本,可以快速生成大规模网络视频流量数据,帮助提升视频流量识别准确率。
附图说明
[0032]为了更清楚地说明本专利技术的技术方案,下面将对本专利技术的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0033]图1是本专利技术一实施例提供的一种系统架构的示意图;
[0034]图2是本专利技术一实施例提供的一种流量数据的处理方法的步骤流程图;
[0035]图3是本专利技术一实施例提供的另一种流量数据的处理方法的步骤流程图;
[0036]图4是本专利技术一实施例提供的另一种流量数据的处理方法的步骤流程图;
[0037]图5是本专利技术一实施例提供的一种流量数据的处理装置的结构框图。
具体实施方式
[0038]为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0039]在SDWAN智能网关中,为了对视频流量进行传输质量保证首先需要对其进行准备识别,但现有流量识别模型因缺少大规模真实的视频业务流量数据,往往导致训练过程中模型过拟合,无法对流量准备识别。
[0040]基于此,本专利技术实施例提出基于生成对抗网络(Generative Adversarial Networks,GAN)模型生成大规模仿真网络视频流量数据,可以实现借助少量真实的视频流量样本,可以快速生成大规模网络视频流量数据,帮助提升视频流量识别准确率。
[0041]如图1所示,本专利技术实施例主要模块及功能如下:
[0042](1)流量特征向量构建模块
[0043]该模块的主要目标是构建真实流量样本的特征向量;根据视频流量数据与其他业务流量数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种流量数据的处理方法,其特征在于,所述方法包括:获取真实流量数据,并根据所述真实流量数据,生成第一特征向量;基于所述第一特征向量,对预置的生成对抗网络进行训练,并调用训练好的生成对抗网络,生成仿真流量数据;将所述真实流量数据和所述仿真流量数据作为训练样本,对预置的流量识别模型进行训练,并采用训练好的流量识别模型,对实时流量数据进行识别。2.根据权利要求1所述的方法,其特征在于,所述生成对抗网络包括生成网络和判别网络,所述基于所述第一特征向量,对预置的生成对抗网络进行训练,包括:调用所述生成对抗网络中生成网络,生成第二特征向量;基于所述第一特征向量和所述第二特征向量,对所述生成对抗网络中生成网络和判别网络进行对抗迭代训练。3.根据权利要求2所述的方法,其特征在于,所述基于所述第一特征向量和所述第二特征向量,对所述生成对抗网络中生成网络和判别网络进行对抗迭代训练,包括:对所述生成对抗网络中生成网络进行训练,以最大化所述第一特征向量与所述第二特征向量之间的距离。4.根据权利要求2或3所述的方法,其特征在于,所述基于所述第一特征向量和所述第二特征向量,对所述生成对抗网络中生成网络和判别网络进行对抗迭代训练,包括:对所述生成对抗网络中判别网络进行训练,以最小化所述第一特征向量与所述第二特征向量之间的距离。5.根据权利要求4所述的方法,其特征在于,所述第一特征向量与所述第二特征向量之间的距离为根据所述第一特征向量与所述第二特征向量在特征空间中的分布计算得到。6.根据权利要求2所述的方法,其特征在于,所述生成网络为基于长短期记忆模型实现。...

【专利技术属性】
技术研发人员:吴婧庞海烨刘邦运王宁李政吕玉超
申请(专利权)人:天翼云科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1