System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于水利模型,具体涉及一种基于规则配置和ai学习的水利行业模拟仿真数据生成方法、工具、设备及其介质。
技术介绍
1、随着水利工程规模的扩大和复杂性的增加,对水利数据的需求日益增长。水利工程的安全运行关系到人民群众的生命财产安全和社会的稳定。通过对水利工程的实时监测和数据分析,可以及时发现工程的安全隐患,采取有效的措施进行预防和治理。
2、水利数据用于工程设计、建设、管理,还用于政策制定、灾害预警、水资源调度等多个方面。但目前水利行业的数据生产主要依赖于实际监测和人工模拟。实际监测受限于设备成本和地理环境的限制,往往难以覆盖所有需要的数据点;而人工模拟仿真数据主要面向通用领域,如何实现水利行业模拟仿真数据的生成仍有待研究。同时,模拟的数据难以应用于实际的项目应用场所中。
技术实现思路
1、为解决以上问题,本专利技术的目的是提供一种基于规则配置和ai学习的水利行业模拟仿真数据生成方法,同时还公开了其工具、设备和介质。本专利技术通过规则配置和ai对历史数据的学习,能够生产出符合水利行业当前业务规则的模拟仿真数据,为系统开发提供脱离生产环境的开发与测试环境,确保生产数据的安全性,提高系统开发效率与测试准确性。同时,模拟的数据可应用于实际的项目应用场景中。
2、一种基于规则配置和ai学习的水利行业模拟仿真数据生成方法,包括如下步骤:
3、s1、系统化收集并上传数据,数据包括必需的历史数据及其相关辅助数据;
4、s2、自定义数据生成规则
5、s3、数据预处理;
6、s4、构建lstm(长短期记忆)模型;
7、s5、残差处理;
8、s6、构建变分自编码器(variational autoencoder, vae)。
9、本专利技术的方法通过基于规则配置和ai学习,实现水利行业模拟仿真数据,并对其方法进行进一步的优化改进。
10、进一步的,s3数据预处理的方法包括:
11、s31、采用多项式插值技术处理历史数据中的缺失值,并利用箱形图统计方法对异常值进行识别,随后通过多项式插值对异常数据进行调整;
12、多项式插值公式:
13、
14、其中,是插值多项式的系数;
15、s32、将历史数据中的日期时间数据转换为秒,利用正弦和余弦变换捕捉日期时间数据“一天中的时间”、“一年中的时间”信号;
16、日期时间正余弦变换公式:
17、
18、
19、其中, timestamps是对应原始日期时间数据的unix时间戳;period 是周期,它可以是“一天”或“一年”;
20、s33、加载处理后的历史数据,将其按7:2:1的比例划分为训练集、验证集、测试集;
21、s34、对训练集、验证集、测试集数据进行标准化处理;
22、s35、通过定义输入窗口的宽度(用于预测的时间步)、标签窗口的宽度(需要预测的未来时间步数)、输入和标签的时间步数偏移、训练集数据、验证集数据、测试集数据、目标标签名称来定义一个数据窗口;
23、s36、将训练、验证、测试集转变为序列数据集,并将数据集中的每个窗口分割输入和标签。
24、进一步的,s4构建lstm(长短期记忆)模型的具体方法为:
25、s41、定义lstm层的数量及每层lstm中神经单元数量、输出数据的维度等信息。
26、lstm单元的公式:
27、
28、其中,分别是遗忘门、输入门、新的候选细胞状态、细胞状态、输出门和隐藏状态;
29、s42、定义全连接层的数量及每层全连接中神经元数量、激活函数,初始化全连接层的权重为零;
30、全连接层公式:
31、
32、其中,y是输出,w是权重矩阵,b是偏置向量,σ是激活函数;
33、s43、定义reshape层,将输出重塑为[输出步长、特征数量]的形状;
34、s44、定义模型的损失函数(均方误差、交叉熵损失)、优化器、周期等信息后,利用构建好数据集窗口进行模型训练;
35、均方误差公式:
36、
37、交叉熵损失公式:
38、
39、其中,yi是真实值(标签),是预测值(标签),n是数据点的数量;
40、s45、利用训练好的lstm模型对模型的训练集、验证集、测试集进行预测,得到预测值并计算残差。
41、进一步的,s5残差处理的具体方法为:
42、s51、利用单位根检验(adf检验)、box-ljung检验等方法验证残差是一个白噪声序列。
43、单位根检验公式:
44、
45、其中,yt是序列;δ表示一阶差分;α是常数项;β是时间趋势系数;t是时间变量;p是滞后阶数;γi是相应滞后项的系数;ϵt是误差项;
46、box-ljung检验的公式:
47、
48、其中,p 是检验的滞后阶数;n是序列的长度;是第k阶滞后自相关系数;
49、s52、对于非白噪声序列,采用高斯回归模型进行处理,直至残差满足白噪声标准;
50、
51、
52、其中,y是因变量;x1,x2,…,xk是自变量;k(x,y)是径向基核函数;γ是径向基核的参数;是点 x和 y之间的欧几里得距离;
53、s53、结合模型预测值和高斯回归模型残差预测值,生成一组新的预测值,对达到预定精度要求的预测值认定为真实值,反之则视为干扰数据。
54、进一步的,s6构建变分自编码器(variational autoencoder, vae)的具体方法为:
55、s61、定义vae编码器:明确输入数据的维度,设定合适的隐藏层维度,定义潜在空间的表示维度,并选择适当的激活函数以增强模型的非线性学习能力。
56、vae编码器公式:
57、
58、其中,z 是潜在空间的表示,μ 和 σ 是编码器输出的均值和标准差,ϵ是从标准正态分布中采样的随机变量。
59、s62、定义vae解码器:确定输出数据的维度,配置相应的隐藏层结构,并选用恰当的激活函数以恢复数据至原始空间。
60、vae编码器公式:
61、
62、其中,是重构的输入数据,g是解码器函数。
63、s63、设定vae模型训练的轮数、每次训练时使用的样本数量、输出信息的详细程度、模型优化器的选择。
64、s64、根据用户设定规则(数据范围)重构损失函数(重构损失、kl散度)。
65、
66、
67、
68、
69、其本文档来自技高网...
【技术保护点】
1.一种基于规则配置和AI学习的水利行业模拟仿真数据生成方法,其特征在于:包括如下步骤:
2.如权利要求1所述的方法,其特征在于:S3数据预处理包括以下步骤:
3.如权利要求1所述的方法,其特征在于:S4构建LSTM模型的具体方法为:
4.如权利要求1所述的方法,其特征在于:S5残差处理的具体方法为:
5.如权利要求1所述的方法,其特征在于:S6构建变分自编码器的具体方法为:
6.一种水利行业模拟仿真数据生成工具,其特征在于:包括:
7.一种电子设备,其特征在于:包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,其中处理器被配置为执行以实现上述权利要求1-5所述的基于规则配置和AI学习的水利行业模拟仿真数据生成方法。
8.一种非临时性计算机可读存储介质,其特征在于:当存储介质中的计算机程序由电子设备的处理器执行时,使得电子设备能够执行实现上述权利要求1-5所述的基于规则配置和AI学习的水利行业模拟仿真数据生成方法。
【技术特征摘要】
1.一种基于规则配置和ai学习的水利行业模拟仿真数据生成方法,其特征在于:包括如下步骤:
2.如权利要求1所述的方法,其特征在于:s3数据预处理包括以下步骤:
3.如权利要求1所述的方法,其特征在于:s4构建lstm模型的具体方法为:
4.如权利要求1所述的方法,其特征在于:s5残差处理的具体方法为:
5.如权利要求1所述的方法,其特征在于:s6构建变分自编码器的具体方法为:
6.一种水利行业模拟仿真数据生...
【专利技术属性】
技术研发人员:朱浩,付万超,顾纪铭,黄振山,
申请(专利权)人:江苏水科尚禹能源技术研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。