本发明专利技术提供一种基于电量数据污染源排放监测方法及系统,包括:进行数据获取,获取训练组数据和测试组数据;对获取的数据进行数据处理,进行数据合并后编码处理,处理后的数据进行切分,有标签值作为训练集,无标签值作为测试集;数据建模,将处理后的数据进行调参,调至最优参数后得到模型评分,选用lgbm算法作为最终模型;模型验证,使用混淆矩阵对最终模型的好坏的程度进行验证;数据预测,使用训练好的lgbm算法进行预测,识别污染源超限排放的用户。本发明专利技术解决了现有电力污染源超限排放难以准确监测的缺陷,实现低成本、高效率的电力污染源超限排放的监测。染源超限排放的监测。染源超限排放的监测。
【技术实现步骤摘要】
一种基于电量数据污染源排放监测方法及系统
[0001]本专利技术涉及电力监测
,尤其涉及一种基于电量数据污染源排放监测方法及系统。
技术介绍
[0002]当前,运用大数据提升国家治理现代化水平,支撑管理和社会治理模式创新已成为社会共识。
[0003]传统的污染源超限监测一般采用污染源监测系统,这样的系统大多需要耗费大量金钱成本与时间成本。传统技术不区分行业类别,难以通过能耗数据对生产异常行为进行监测分析,使监管部门的监管效率降低。
技术实现思路
[0004]本专利技术提供一种基于电量数据污染源排放监测方法及系统,用以解决现有电力污染源超限排放难以准确监测的缺陷,实现低成本、高效率的电力污染源超限排放的监测。
[0005]本专利技术提供一种基于电量数据污染源排放监测方法,包括:
[0006]进行数据获取,获取训练组数据和测试组数据;
[0007]对获取的数据进行数据处理,进行数据合并后编码处理,处理后的数据进行切分,有标签值作为训练集,无标签值作为测试集;
[0008]数据建模,将处理后的数据进行调参,调至最优参数后得到模型评分,选用lgbm算法作为最终模型;
[0009]模型验证,使用混淆矩阵对最终模型的好坏的程度进行验证;
[0010]数据预测,使用训练好的lgbm算法进行预测,识别污染源超限排放的用户。
[0011]根据本专利技术提供的一种基于电量数据污染源排放监测方法,所述进行数据获取,获取训练组数据和测试组数据,具体包括:<br/>[0012]所述训练组数据为:第一用户基本信息表、第一用户日用电量明细表和第一行业户均月用电表;
[0013]所述测试组数据为:第二用户基本信息表、第二用户日用电量明细表和第二行业户均月用电表;
[0014]所述训练组数据和测试组数据中均包括:用户用电量、行业编码、行业平均月度用电量、用户所在区县。
[0015]根据本专利技术提供的一种基于电量数据污染源排放监测方法,对获取的数据进行数据处理,具体过程为:
[0016]根据用户ID列将训练组数据和测试组数据进行合并,生成第三用户基本信息表、第三用户日用电量明细表和第三行业户均月用电表;
[0017]对每张表进行缺失值查看,对存在缺失值部分进行数据补齐;
[0018]将第三用户日用电量明细表进行分组统计,根据用户ID列进行求和,得到月度用
电量总和,剔除峰谷平电量;
[0019]将第三行业户均月用电量进行分组统计,根据用户所在区域与行业编码进行分组统计,分别求出行业平均月用电量平均值、中位数、偏度及总和;
[0020]通过用户ID合并第三用户基本信息表和第三用户日用电量明细表,得到用户月度用电明细表;
[0021]通过行业编码与用户所在区域合并用户月度用电明细表与行业表,得到最终结果表;
[0022]对合并后的最终结果表中的文本字段进行编码处理,使用类别变量编码库进行编码,并将用户ID列与用户所在区县列剔除,数据处理后进行切分。
[0023]根据本专利技术提供的一种基于电量数据污染源排放监测方法,所述数据建模的具体过程为:
[0024]根据处理后的数据进行建模,对于训练集数据集按7:3的比例进行切分,70%作为训练,30%作为测试。;
[0025]分别使用lgbm算法与随机森林算法进行拟合,对算法使用网格搜索、学习曲线方法进行调参,调至最优参数后得到模型评分;
[0026]对lgbm算法和随机森林算法评分进行对比,最终选用lgbm算法为最终模型。
[0027]根据本专利技术提供的一种基于电量数据污染源排放监测方法,所述模型验证具体过程为:
[0028]使用混淆矩阵来验证模型的好坏程度,混淆矩阵也称误差矩阵,通过n行n列的矩阵形式进行表示;
[0029]准确率=分类正确的样本数量占总样本数量的百分比。
[0030]根据本专利技术提供的一种基于电量数据污染源排放监测方法,所述数据预测具体过程为:
[0031]使用训练好的lgbm算法模型进行预测,得到多个超限用户,计算测试集数准确率,确定能够正确识别污染源超限排放用户的概率。
[0032]本专利技术还提供一种基于电量数据污染源排放监测系统,所述系统包括:
[0033]数据获取模块,用于进行数据获取,获取训练组数据和测试组数据;
[0034]数据处理模块,用于对获取的数据进行数据处理,进行数据合并后编码处理,处理后的数据进行切分,有标签值作为训练集,无标签值作为测试集;
[0035]数据建模模块,用于将处理后的数据进行调参,调至最优参数后得到模型评分,选用lgbm算法作为最终模型;
[0036]模型验证模块,用于使用混淆矩阵对最终模型的好坏的程度进行验证;
[0037]数据预测模块,用于使用训练好的lgbm算法进行预测,识别污染源超限排放的用户。
[0038]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述基于电量数据污染源排放监测方法。
[0039]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述基于电量数据污染源排放监测方法。
[0040]本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述基于电量数据污染源排放监测方法。
[0041]本专利技术提供的一种基于电量数据污染源排放监测方法及系统,通过不同用户不同行业用电量数据来进行污染源超限排放识别,可根据用户用电量、行业编码、用户用电类型、行业平均月度用电量等数据来进行污染源是否超限排放识别;可根据用户用电量、行业编码、用户用电类型、行业平均月度用电量等数据来进行污染源是否超限排放识别,并且整个流程可以延展到任意用电用户污染源超限研判中,提升电量数据污染源超限排放监测的准确率,降低成本,扩展应用范围。
附图说明
[0042]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0043]图1是本专利技术提供的一种基于电量数据污染源排放监测方法方法的流程示意图;
[0044]图2是本专利技术提供的一种基于电量数据污染源排放监测系统模块连接示意图;
[0045]图3是本专利技术提供的电子设备的结构示意图。
[0046]附图标记:
[0047]110:数据获取模块;120:数据处理模块;130:数据建模模块;140:模型验证模块;150:数据预测模块;
[0048]810:处理器;820:通信接口;830:存储器;840:通信总线
具体实施方式
...
【技术保护点】
【技术特征摘要】
1.一种基于电量数据污染源排放监测方法,其特征在于,包括:进行数据获取,获取训练组数据和测试组数据;对获取的数据进行数据处理,进行数据合并后编码处理,处理后的数据进行切分,有标签值作为训练集,无标签值作为测试集;数据建模,将处理后的数据进行调参,调至最优参数后得到模型评分,选用lgbm算法作为最终模型;模型验证,使用混淆矩阵对最终模型的好坏的程度进行验证;数据预测,使用训练好的lgbm算法进行预测,识别污染源超限排放的用户。2.根据权利要求1所述的基于电量数据污染源排放监测方法,其特征在于,所述进行数据获取,获取训练组数据和测试组数据,具体包括:所述训练组数据为:第一用户基本信息表、第一用户日用电量明细表和第一行业户均月用电表;所述测试组数据为:第二用户基本信息表、第二用户日用电量明细表和第二行业户均月用电表;所述训练组数据和测试组数据中均包括:用户用电量、行业编码、行业平均月度用电量、用户所在区县。3.根据权利要求1所述的基于电量数据污染源排放监测方法,其特征在于,对获取的数据进行数据处理,具体过程为:根据用户ID列将训练组数据和测试组数据进行合并,生成第三用户基本信息表、第三用户日用电量明细表和第三行业户均月用电表;对每张表进行缺失值查看,对存在缺失值部分进行数据补齐;将第三用户日用电量明细表进行分组统计,根据用户ID列进行求和,得到月度用电量总和,剔除峰谷平电量;将第三行业户均月用电量进行分组统计,根据用户所在区域与行业编码进行分组统计,分别求出行业平均月用电量平均值、中位数、偏度及总和;通过用户ID合并第三用户基本信息表和第三用户日用电量明细表,得到用户月度用电明细表;通过行业编码与用户所在区域合并用户月度用电明细表与行业表,得到最终结果表;对合并后的最终结果表中的文本字段进行编码处理,使用类别变量编码库进行编码,并将用户ID列与用户所在区县列剔除,数据处理后进行切分。4.根据权利要求1所述的基于电量数据污染源排放监测方法,其特征在于,所述数据建模的具体过程为:根据处理后的数据进行建...
【专利技术属性】
技术研发人员:周祖煜,张浩,陈煜人,张澎彬,林波,白博文,莫志敏,李天齐,刘俊,
申请(专利权)人:杭州领见数字农业科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。