System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及异常检测领域,具体是一种基于生成对抗网络的信息物理系统异常检测方法。
技术介绍
1、信息物理系统(cps,cyber-physical systems))是通常为关键任务而设计的互连物理系统。cps的一些示例包括水处理和分配工厂、天然气分配系统、炼油厂、发电厂、电网和自动驾驶汽车。物联网iot的出现将进一步推动用于各种任务的cps的激增,从而导致许多系统和设备通过网络自主通信和运行。而网络攻击是cps最受关注的潜在威胁之一。
2、传统上,统计过程控制spc方法如cusum、ewma和shewhart图表是异常检测的常用解决方案,随着物联网的出现,这些传统的检测技术无法应对cps日益动态和复杂的性质。因此,研究人员已经超越了基于规范或签名的技术,并开始利用有监督和无监督的机器学习技术,从大数据中开发出更智能和适应性更强的方法来识别异常或入侵。然而,即使使用机器学习技术,检测时间序列中的异常仍然具有挑战性。首先,大多数监督技术需要足够可靠的正常数据和标记的异常类来学习,但在实践中情况并非如此,因为异常通常很少见。其次,现有的大多数无监督方法都是通过线性投影和变换构建的,但复杂cps的多元时间序列隐藏的内在相关性往往存在非线性。当前大多数技术还采用当前状态与预测正常范围之间的简单比较,这对于异常检测来说是不够的,因为控制界限不够灵活并且无法有效识别间接攻击。
技术实现思路
1、针对
技术介绍
中提到的cps异常检测问题,以及传统的检测技术无法应对cps日益动态和复杂
2、一种基于生成对抗网络的信息物理系统异常检测方法,包括如下步骤:
3、步骤一、建立由多个时间序列之间的非线性相关性组成的gan模型,所述gan模型包括构建为长短期递归神经网络lstm-rnn的生成器g和判别器d;
4、步骤二、通过捕获时间序列的特征训练所述gan模型;
5、步骤三、利用步骤二训练所得gan模型检测复杂信息物理系统cps中的异常情况。
6、进一步的,步骤一中建立由多个时间序列之间的非线性相关性组成的gan模型,具体包括:
7、将gan模型的生成器g和判别器d替换为长短期循环神经网络lstm-rnn,用于处理信息物理系统cps的时间序列数据,长短期循环神经网络lstm-rnn通过记忆细胞以向后或向前的时间步获取信息来学习复杂的时间序列,gan模型训练如下:
8、
9、生成器g是一个lstm-rnn模型,隐式地定义生成样本的概率分布,写成grnn(z),其中z是来自随机潜在空间的分布,判别器d是另一个lstm-rnn模型,被训练以最小化其预测和序列标签之间的平均负交叉熵,判别器d损失为:
10、
11、其中xi,i=1,...,m,m为需要识别为真实的训练样本,grnn(zi),i=1,...,m,m为生成的应被识别为假的样本;同时,训练生成器g以混淆判别器d,使判别器d能够识别尽可能多的生成的真实样本,生成器g损失为:
12、
13、生成器g损失和判别器d损失由优化器共同处理,并用于grnn和drnn的参数更新,grnn和drnn分别表示循环神经网络中的生成器和判别器的参数。
14、进一步的,步骤二通过捕获时间序列的特征训练所述gan模型,具体包括:
15、所述生成器g利用潜在空间的样本生成假样本,并将生成的假样本传递给判别器d,判别器d分辨出假样本和真实样本;
16、基于判别器d的分辨结果,gan模型更新判别器d和生成器g的参数,将生成器g进行训练以欺骗判别器d,为假样本分配真实的标签;
17、通过对抗性的迭代训练,生成器g将捕获训练的时间序列数据隐藏分布,用于生成真实的样本,通过生成真实的样本,生成器g学习到训练数据的隐藏分布,从而生成逼真的样本,并准确地区分真实样本和生成的逼真的样本。
18、进一步的,所述潜在空间的样本是从一个随机噪声向量中采样得到,在训练过程中通过计算生成样本与真实样本之间的误差,并使用反向传播算法获取梯度信息,所述梯度信息用于更新潜在空间的样本。
19、进一步的,经过训练的生成器g生成真实的样本,是从潜在空间到真实数据空间的映射:g(z):z→x,表示为反映正态数据分布的不显式系统模型,如果潜在空间中的输入接近,则生成器g输出相似的样本,如果在测试数据xtes的潜在空间中找到对应的zk,则xtes和g(zk)之间的相似性可反映xtes遵循g分布的程度,xtes和g(zk)之间的残差用来识别测试数据中的异常;
20、从潜在空间中采样随机集z1,并通过将其输入生成器g来获得重建的原始样本g(z1),然后,使用从xtes和g(z)定义的误差函数获得的梯度来更新来自潜在空间的样本:
21、
22、如果经过足够多的迭代轮次后误差足够小,则样本zk被记录为测试样本的潜在空间中的相应映射,测试样本在时间t处的残差计算如下:
23、
24、异常检测的异常得分为:
25、
26、其中是n个变量在时间步t的测量值。
27、进一步的,所述步骤三具体包括:
28、首先,考虑长度为t2的m维时间序列x={x(t),t=1,...,t},其中x(t)∈rm是m变量在时间实例t的m维向量,通过在原始数据流上采用长度为t的窗口来获得多个预定义时间序列gan模型基于真实样本普通时间序列数据集xreal进行训练,并生成逼真的合成样本xtes,测试时间序列数据集xatt和xtes,采用主成分分析pca将高维数据投影到投影空间中;
29、然后,将数据输入gan模型:映射如下:
30、
31、其中m为原始维度,n为保留主成分的个数,然后将投影变量输入gan-ad模型并根据方程输出异常分数,应用以下标签分配函数来识别测试时间序列集xtes在时间步t的第i个变量是否受到攻击;
32、
33、其中t=1,...,t,i=1,...,n,如果异常分数的残差h(.,.)高于某个值τ,则检测到异常。
34、本专利技术具有如下优点:
35、1.本专利技术提出了一种基于gan的新型无监督异常检测方法,用于检测具有网络传感器和执行器的复杂多进程网络物理系统的异常,也就是网络攻击,解决了传统的检测技术无法应对cps日益动态和复杂的问题。
36、2.本专利技术利用gan模型采用多个时间序列进行训练,通过采用长短期循环神经网络lstm-rnn来捕获时间依赖性,将gan从图像生成领域应用于时间序列生成;
37、3.本专利技术统一使用高维的正常序列来训练gan模型,以区分真假并同时从特定潜在空间重建测试序列,将经过训练的判别器计算出的判别损失与重建序列和真实测试序列之间的残差损失结合在一起本文档来自技高网...
【技术保护点】
1.一种基于生成对抗网络的信息物理系统异常检测方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的基于生成对抗网络的信息物理系统异常检测方法,其特征在于,步骤一中建立由多个时间序列之间的非线性相关性组成的GAN模型,具体包括:
3.根据权利要求2所述的基于生成对抗网络的信息物理系统异常检测方法,其特征在于,步骤二通过捕获时间序列的特征训练所述GAN模型,具体包括:
4.根据权利要求3所述的基于生成对抗网络的信息物理系统异常检测方法,其特征在于,所述潜在空间的样本是从一个随机噪声向量中采样得到,在训练过程中通过计算生成样本与真实样本之间的误差,并使用反向传播算法获取梯度信息,所述梯度信息用于更新潜在空间的样本。
5.根据权利要求4所述的基于生成对抗网络的信息物理系统异常检测方法,其特征在于,经过训练的生成器G生成真实的样本,是从潜在空间到真实数据空间的映射:G(Z):Z→X,表示为反映正态数据分布的不显式系统模型,如果潜在空间中的输入接近,则生成器G输出相似的样本,如果在测试数据Xtes的潜在空间中找到对应的Zk,则Xtes和G
6.根据权利要求5所述的基于生成对抗网络的信息物理系统异常检测方法,其特征在于,所述步骤三具体包括:
...【技术特征摘要】
1.一种基于生成对抗网络的信息物理系统异常检测方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的基于生成对抗网络的信息物理系统异常检测方法,其特征在于,步骤一中建立由多个时间序列之间的非线性相关性组成的gan模型,具体包括:
3.根据权利要求2所述的基于生成对抗网络的信息物理系统异常检测方法,其特征在于,步骤二通过捕获时间序列的特征训练所述gan模型,具体包括:
4.根据权利要求3所述的基于生成对抗网络的信息物理系统异常检测方法,其特征在于,所述潜在空间的样本是从一个随机噪声向量中采样得到,在训练过程中通过计算生成样本与真实样本之间的误差,并使用反向传播算法...
【专利技术属性】
技术研发人员:牛犁青,冯刚平,陈剑,徐挺,袁安琪,夏胜冬,李国瑞,姚天禄,
申请(专利权)人:湖北华中电力科技开发有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。