【技术实现步骤摘要】
配电网电压数据清洗平台及其清洗方法
[0001]本专利技术属于大数据清洗及电力系统相关
,具体涉及配电网电压数据清洗平台及其清洗方法。
技术介绍
[0002]随着社会的不断发展,用电量不断增加,电力系统日渐复杂,电网规模不断扩大。电力系统中各类设备实时数据的增加导致电网数据量飞速增长,数据异常、冗余、遗漏等问题严重影响了电网安全。数据质量的好坏、清洗出来的数据是否能够直观的展示直接影响到了调度人员能否快速、准确地对电力系统出现的问题作出重要的决策。因此,开发一个基于数据清洗的可视化平台有着重要意义。
技术实现思路
[0003]本专利技术的目的在于提供配电网电压数据清洗平台,以解决上述
技术介绍
中提出的电网数据量飞速增长,数据异常、冗余、遗漏等问题严重影响了电网安全和影响到了调度人员能否快速、准确地对电力系统出现的问题作出重要的决策问题。
[0004]为实现上述目的,本专利技术提供如下技术方案:配电网电压数据清洗平台,包括pycharm平台,所述pycharm平台包括Python环境、Django环境、网站平台;
[0005]Django环境,Django环境用于提供Web后端开发和Web前端开发数据库;
[0006]Python环境,Python环境用于采集并搭建配电网电压数据结构以及数据预处理,并根据算法的数学模型将LSTM神经网络、聚类分析法、关联规则分析法运用于配电网数据清洗,得出四大分类指标以及离群点的数据,同时将以上所述数据传送到Web前端页面;
[000 ...
【技术保护点】
【技术特征摘要】
1.配电网电压数据清洗平台,包括pycharm平台,其特征在于:所述pycharm平台包括Python环境、Django环境、网站平台;Django环境,Django环境用于提供Web后端开发和Web前端开发数据库;Python环境,Python环境用于采集并搭建配电网电压数据结构以及数据预处理,并根据算法的数学模型将LSTM神经网络、聚类分析法、关联规则分析法运用于配电网数据清洗,得出四大分类指标以及离群点的数据,同时将以上所述数据传送到Web前端页面;网站平台,用于将后端输送到前端的数据以可视化的图形展示。2.根据权利要求1所述的配电网电压数据清洗平台,其特征在于:所述四大分类指标以及离群点的数据为准确率、召回率、辨识率、F1分数。3.根据权利要求1所述的配电网电压数据清洗平台,其特征在于:所述Django环境具有自带数据库。4.根据权利要求1所述的配电网电压数据清洗平台,其特征在于:所述网站平台主要利用js,css实现对前端页面的开发,利用echarts实现对可视化图形的配置。5.配电网电压数据清洗方法,根据权利要求1
‑
4所述的配电网电压数据清洗平台,其特征在于,包括以下步骤:步骤1:在pycharm平台搭建并部署Python以及Django环境;步骤2:根据算法的数学模型实现LSTM神经网络、聚类分析法、关联规则分析法的逻辑运算以及登录、注册功能和连接数据库的逻辑实现,得出准确率、召回率、辨识率、F1分数这四大分类指标以及离群点的数据,并将所述数据传送到前端页面同时将前端页面注册功能所输入的数据反馈回Django自带的数据库;步骤3:搭建一个网站平台,将后端输送到前端的数据以可视化的图形展示。6.根据权利要求5所述的配电网电压数据清洗方法,其特征在于:所述步骤2中的LSTM神经网络的配电网电压清洗方法,包括以下步骤:S1:对配电网电压的大数据进行数据的导入以及数据的预处理;S2:搭建LSTM神经网络模型对数据样本进行训练得出最优训练模型;S3:将测试数据代入步骤2的最优LSTM神经网络训练模型得出预测值;S4:计算出步骤3得出的预测值与测试集的实际值的误差,并将误差形成一个集合即S;S5:根据误差集合S是否服从均值为μ和标准差为σ的高斯分布判断异常值与正常值;S6:根据实际值的正常值、异常值的个数和由算法判断出正常值、异常值的个数,计算评估指标即准确率、辨识率、召回率、F1分数;其中,S1数据的预处理:包括构建特征数据集、训练批数据、数据归一化、按8:2的比例划分训练集和测试集、数据的噪声加入;其中,S2LSTM模型的训练:将训练的批数据代入已构建好的LSTM神经网络模型,进行训练;其中,S3选取最优的训练模型:将每一次训练的权重保存下来,选取最好的权重作为最优训练模型;其中,S4数据预测:向训练好的模型,输入t
‑
1、t
‑
2时刻的实际数据值x
t
‑1和x
t
‑2,得t时刻的预测值y
t
,以此类推;其中,S5计算预测值与实际值的误差:先将数据进行反归一化,然后将同一时刻的预测
值与实际值之差形成...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。