当前位置: 首页 > 专利查询>清华大学专利>正文

基于知识增强生成对抗网络的网络流量生成方法及装置制造方法及图纸

技术编号:31080574 阅读:24 留言:0更新日期:2021-12-01 11:55
本发明专利技术提供一种基于知识增强生成对抗网络的网络流量生成方法及装置,该方法包括:根据设备及相关的用户、平台、位置和环境各属性确定知识图谱,基于知识图谱嵌入模型,得到每个设备的知识图谱嵌入向量;将每个设备的知识图谱嵌入向量,输入训练完成的生成对抗网络模型的生成器网络,输出生成网络数据,其为包括设备类型、流量序列长度属性的网络流量;其中,生成对抗网络模型,是基于多个已知流量设备的知识图谱嵌入向量,输入生成器网络,输出生成网络数据,再利用判别器对真实流量数据和生成网络数据进行对抗训练后得到。该方法需要数据量较少,能够对设备类型进行可靠区分,网络数据的真实性高。通过较少的数据,得到可靠的大规模物联网流量。规模物联网流量。规模物联网流量。

【技术实现步骤摘要】
基于知识增强生成对抗网络的网络流量生成方法及装置


[0001]本专利技术涉及互联网
,尤其涉及一种基于知识增强生成对抗网络的网络流量生成方法及装置。

技术介绍

[0002]网络流量生成(Network Traffic Generation)是指对某一个互联网中存在的实体,生成其在指定时间片段内的流量数据序列,典型的应用场景是在网络硬件承压能力测试时,通过生成指定数量、类别的实体在指定时段内的流量,并在待测试平台中传输,根据传输的准确性和时效来判断网络硬件是否能够满足设定的要求。而在现有的实际生产应用下,大量网络流量数据的生成主要设计三种方法:1)根据预设参数的网络流量分布模型生成,例如泊松分布;2)根据给定的网络流量特点生成,例如数据包大小、到达时间间隔等;3)根据给定的互联网协议生产,如TCP。这些方法能偶生成大量的网络流量,但真实性、准确性无法得到保证。
[0003]物联网网络流量生成是指生成物联网设备的网络流量。物联网是一种计算设备、机械、数字机器相互关系的系统,具备通用唯一识别码,并具有通过网络传输数据的能力,无需人与人、或是人与设备的交互。物联网相关的功能主要通过物联网设备实现,例如智慧医疗设备、智能家居设备等。物联网设备通常通过网络连接到云平台,接受指令并行使功能,其网络流量受到物联网用户、服务商、使用环境等等多方因素的影响。
[0004]当前使用机器学习方法进行网络流量生成任务时,主要将其视作时间序列生成问题的子问题进行分析,生成一段时间内的网络流量特征序列。常用的传统方法主要包括生成对抗网络模型(GenerativeAdversarial Network model,简称GAN模型)等。其中,原始的生成对抗网络模型在面对复杂多变的时序序列时难以保证生成样本的多样性和真实性。物联网网络流量受多种环境、人为因素影响,时序上复杂多变,分布非常不均衡,而现有的物联网网络流量生成工作主要针对单一场景下的少量设备,实用性不足。因此,如何生成大量真实可靠的物联网设备网络流量成为了亟待解决的技术问题。

技术实现思路

[0005]针对现有技术存在的问题,本专利技术提供一种基于知识增强生成对抗网络的网络流量生成方法及装置。
[0006]本专利技术提供一种基于知识增强生成对抗网络的网络流量生成方法,包括:根据设备及相关的用户、平台、位置和环境各属性确定知识图谱,基于知识图谱嵌入模型,得到每个设备对应的知识图谱嵌入向量;将每个设备的知识图谱嵌入向量,输入训练完成的生成对抗网络模型的生成器网络,输出生成网络数据,所述生成网络数据,为包括设备类型、流量序列长度属性的网络流量;其中,所述生成对抗网络模型,是基于多个已知流量设备的知识图谱嵌入向量,输入生成器网络,输出生成网络数据,再利用判别器对真实流量数据和所述生成网络数据进行对抗训练后得到。
[0007]根据本专利技术一个实施例的基于知识增强生成对抗网络的网络流量生成方法,所述将每个设备的知识图谱嵌入向量,输入训练完成的生成对抗网络模型的生成器网络之前,还包括:根据样本知识图谱嵌入向量,输入构建的生成对抗网络模型的生成器网络,得到样本生成网络数据;根据样本生成网络数据,和样本的真实网络数据的各属性进行判别,以对所述构建的生成对抗网络模型进行训练,得到所述训练完成的生成对抗网络模型;其中,所述各属性包括,网络流量序列中各元素的到达时间间隔、数据包个数、数据包平均包长以及网络流量的序列长度。
[0008]根据本专利技术一个实施例的基于知识增强生成对抗网络的网络流量生成方法,所述基于设备及相关的用户、平台、位置和环境各属性确定知识图谱,包括:将设备标识作为头实体,将包括用户、平台、位置和环境作为尾实体,构建知识图谱。
[0009]根据本专利技术一个实施例的基于知识增强生成对抗网络的网络流量生成方法,所述将每个设备的知识图谱嵌入向量,输入训练完成的生成对抗网络模型的生成器网络,输出生成网络数据,包括:将知识图谱嵌入向量和随机噪声作为设备类型生成器的输入,输出生成的设备类型;将知识图谱嵌入向量,生成的设备类型和随机噪声作为网络流量序列长度生成器的输入,输出生成的网络流量序列长度;将知识图谱嵌入向量,生成的设备类型和生成的网络流量序列长度,输入采用循环神经网络和自注意力机制相结合的网络流量序列生成器,输出生成网络数据。
[0010]根据本专利技术一个实施例的基于知识增强生成对抗网络的网络流量生成方法,所述对所述构建的生成对抗网络模型进行训练,包括:通过多层感知机作为判别器,判别器以真实数据和生成的数据作为输入,输出判别结果;根据所述判别结果和预设的损失函数,对所述构建的生成对抗网络模型进行训练。
[0011]根据本专利技术一个实施例的基于知识增强生成对抗网络的网络流量生成方法,所述根据所述判别结果和预设的损失函数,对所述构建的生成对抗网络模型进行训练,包括:采用添加梯度惩罚的 Wasserstein距离作为损失函数,对所述构建的生成对抗网络模型进行训练。
[0012]根据本专利技术一个实施例的基于知识增强生成对抗网络的网络流量生成方法,所述损失函数包括:
[0013][0014]其中,D(O)和分别表示真实数据和生成数据的判别结果,和分别表示真实数据和生成数据的分布,表示真实

生成样本对之间的均匀采样,和分别表示样本的判别结果和分布。
[0015]本专利技术还提供一种基于知识增强生成对抗网络的网络流量生成装置,包括:向量表达模块,用于根据设备及相关的用户、平台、位置和环境各属性确定知识图谱,基于知识图谱嵌入模型,得到每个设备对应的知识图谱嵌入向量;流量生成模块,用于将每个设备的知识图谱嵌入向量,输入训练完成的生成对抗网络模型的生成器网络,输出生成网络数据,所述生成网络数据,为包括设备类型、流量序列长度属性的网络流量;其中,所述生成对抗
网络模型,是基于多个已知流量设备的知识图谱嵌入向量,输入生成器网络,输出生成网络数据,再利用判别器对真实流量数据和所述生成网络数据进行对抗训练后得到。
[0016]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述基于知识增强生成对抗网络的网络流量生成方法的步骤。
[0017]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述基于知识增强生成对抗网络的网络流量生成方法的步骤。
[0018]本专利技术提供的基于知识增强生成对抗网络的网络流量生成方法及装置,只需对设备属性进行知识图谱的表达,需要数据量较少,而通过设备属性生成的嵌入向量,使设备相关的背景信息关联到网络流量中,并且对设备类型进行可靠区分,增强生成网络数据的真实性。最后,再通过生成对抗网络进行学习,从而通过较少的数据,得到可靠的大规模物联网流量。
附图说明
[0019]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识增强生成对抗网络的网络流量生成方法,其特征在于,包括:根据设备及相关的用户、平台、位置和环境各属性,确定知识图谱,基于知识图谱嵌入模型,得到每个设备对应的知识图谱嵌入向量;将每个设备的知识图谱嵌入向量,输入训练完成的生成对抗网络模型的生成器网络,输出生成网络数据;所述生成网络数据,为包括设备类型、流量序列长度属性的网络流量;其中,所述生成对抗网络模型,是基于多个已知流量设备的知识图谱嵌入向量,输入生成器网络,输出生成网络数据,再利用判别器对真实流量数据和所述生成网络数据进行对抗训练后得到。2.根据权利要求1所述的基于知识增强生成对抗网络的网络流量生成方法,其特征在于,所述将每个设备的知识图谱嵌入向量,输入训练完成的生成对抗网络模型的生成器网络之前,还包括:根据样本知识图谱嵌入向量,输入构建的生成对抗网络模型的生成器网络,得到样本生成网络数据;根据样本生成网络数据,和样本的真实网络数据的各属性进行判别,以对所述构建的生成对抗网络模型进行训练,得到所述训练完成的生成对抗网络模型;其中,所述各属性包括,网络流量序列中各元素的到达时间间隔、数据包个数、数据包平均包长以及网络流量的序列长度。3.根据权利要求1所述的基于知识增强生成对抗网络的网络流量生成方法,其特征在于,所述根据设备及相关的用户、平台、位置和环境各属性,确定知识图谱,包括:将设备标识作为头实体,将包括用户、平台、位置和环境作为尾实体,构建知识图谱。4.根据权利要求1所述的基于知识增强生成对抗网络的网络流量生成方法,其特征在于,所述将每个设备的知识图谱嵌入向量,输入训练完成的生成对抗网络模型的生成器网络,输出生成网络数据,包括:将知识图谱嵌入向量和随机噪声作为设备类型生成器的输入,输出生成的设备类型;将知识图谱嵌入向量,生成的设备类型和随机噪声作为网络流量序列长度生成器的输入,输出生成的网络流量序列长度;将知识图谱嵌入向量,生成的设备类型和生成的网络流量序列长度,输入采用循环神经网络和自注意力机制相结合的网络流量序列生成器,输出生成网络数据。5.根据权利要求1所述的...

【专利技术属性】
技术研发人员:李勇惠铄迪金德鹏
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1