System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于数据分析,具体涉及一种污染源在线监测数据中的造假数据分析方法。
技术介绍
1、污染源是指产生污染物的地点、设施、活动或现象,它可以通过不同的途径释放污染物到环境中,从而对空气、水、土壤和生态系统造成负面影响。工业生产过程中,许多工厂和企业会排放大量的废气、废水和固体废弃物。这些排放物可能含有多种有害物质,如重金属、有机溶剂、酸碱等,对环境造成严重污染。随着环境污染问题的日益严重,各国政府对污染源的监管越来越严格。污染源在线监测系统作为一种有效的监管手段,能够实时监测污染源的排放情况,为政府决策提供科学依据。然而,由于各种原因,污染源在线监测数据中可能存在异常值和造假现象,这严重影响到了环境监管的准确性和有效性。因此,研究一种能够有效识别和分析污染源在线监测数据中的异常值和造假方法具有重要意义。
技术实现思路
1、本专利技术提供一种污染源在线监测数据中的造假数据分析方法,用以解决现有技术中污染源在线监测数据存在造假的问题。
2、一种污染源在线监测数据中的造假数据分析方法,包括:
3、从指定数据源采集历史污染源监测数据,并对所述历史污染源监测数据进行预处理之后,得到用于训练算法模型的样本数据;
4、采用深度学习模型构建造假数据分析模型,并以所述样本数据为基础,采用多层次信息探索算法对造假数据分析模型进行训练,得到训练之后的造假数据分析模型;
5、采集待分析的污染源在线监测数据,并提取所述污染源在线监测数据的特征之后,将提取的
6、在一种可能的实施方式中,从指定数据源采集历史污染源监测数据,并对所述历史污染源监测数据进行预处理之后,得到用于训练算法模型的样本数据,包括:
7、从指定数据源采集历史污染源监测数据;
8、对所述历史污染源监测数据依次进行数据完整性检查、时间序列分析以及数据平滑处理,得到完整的历史污染源监测数据;
9、针对完整的历史污染源监测数据,获取工作人员根据历史造假事件并通过人机交互输入的企业数据画像;其中,所述企业数据画像包括正常数据类型以及多种类的异常数据类型;
10、将完整的历史污染源监测数据作为训练数据,将完整的历史污染源监测数据所对应的企业数据画像作为训练标签,得到用于训练算法模型的样本数据。
11、在一种可能的实施方式中,所述历史污染源监测数据至少包括时间特征、气象条件特征、污染物浓度特征以及排放源特性特征;
12、其中,所述时间特征包括小时、日、月以及年;
13、所述气象条件特征包括温度、湿度、风速、风向以及大气压力;
14、所述污染物浓度特征包括so2浓度、no x浓度、pm2.5浓度以及pm10浓度; x表示数字下标,且 x=1、2以及3;
15、所述排放源特性特征包括排放源类型、排放源规模、产能以及排放源的运营时间。
16、在一种可能的实施方式中,对所述历史污染源监测数据依次进行数据完整性检查、时间序列分析以及数据平滑处理,得到完整的历史污染源监测数据,包括:
17、检查所述历史污染源监测数据中是否存在缺失值,若是,则采用缺失值前后邻近的数据的均值进行逐一补全,得到完整性检查之后的历史污染源监测数据,否则直接将原有的历史污染源监测数据作为完整性检查之后的历史污染源监测数据;
18、针对完整性检查之后的历史污染源监测数据,确定时间序列中是否存在缺失的历史污染源监测数据,若是,则采用该缺失历史污染源监测数据前后邻近的历史污染源监测数据的均值进行逐一补全,得到时间序列分析之后的历史污染源监测数据,否则直接将原有的历史污染源监测数据座位时间序列分析之后的历史污染源监测数据;
19、其中,所述时间序列是指将某一个时间点上采集的历史污染源监测数据看作一帧数据,将多个连续时间点上的多帧数据连接起来所得到的数据;
20、针对完整性检查之后的历史污染源监测数据,对历史污染源监测数据进行数据平滑处理,得到完整的历史污染源监测数据。
21、在一种可能的实施方式中,采用深度学习模型构建造假数据分析模型,包括:采用卷积神经网络构建造假数据分析模型。
22、在一种可能的实施方式中,以所述样本数据为基础,采用多层次信息探索算法对造假数据分析模型进行训练,得到训练之后的造假数据分析模型,包括:
23、采用混沌序列初始化策略对造假数据分析模型的超参数进行初始化,以获取多个在超参数解空间内均匀分布的超参数个体;
24、针对每一个超参数个体,将所述超参数个体应用至造假数据分析模型之后,根据样本数据获取造假数据分析模型输出的误差函数值,并将所述误差函数值转换为适应度值,得到超参数个体所对应的适应度值;
25、根据所述超参数个体所对应的适应度值,确定最优超参数个体;
26、以每个超参数个体对应的适应度值为基础,对超参数个体执行邻域信息探索策略,得到一级信息探索之后的超参数个体;
27、针对一级信息探索之后的超参数个体,根据所述最优超参数个体对超参数个体执行全局最优位置信息探索策略,得到二级信息探索之后的超参数个体;
28、针对二级信息探索之后的超参数个体,根据所述最优超参数个体对超参数个体执行种群信息交互探索策略,得到三级信息探索之后的超参数个体;
29、针对三级信息探索之后的超参数个体,对超参数个体执行信息跳跃探索策略,得到四级信息探索之后的超参数个体;
30、判断是否满足迭代结束条件,若是,则根据四级信息探索之后的超参数个体重新获取最优超参数个体,并将重新获取的最优超参数个体作为造假数据分析模型的最终超参数,得到训练之后的造假数据分析模型,否则返回确定超参数个体所对应的适应度值的步骤。
31、在一种可能的实施方式中,针对每一个超参数个体,将所述超参数个体应用至造假数据分析模型之后,根据样本数据获取造假数据分析模型输出的误差函数值,并将所述误差函数值转换为适应度值,得到超参数个体所对应的适应度值,包括:
32、针对每一个超参数个体,将所述超参数个体应用至造假数据分析模型之后,采用均方根误差函数并根据样本数据获取造假数据分析模型输出的误差函数值;
33、将造假数据分析模型输出的误差函数值与预设的常数项相加之后,取倒数,得到超参数个体所对应的适应度值;
34、其中,预设的常数项设置为0.0001。
35、在一种可能的实施方式中,以每个超参数个体对应的适应度值为基础,对超参数个体执行邻域信息探索策略,得到一级信息探索之后的超参数个体,包括:
36、以每个超参数个体对应的适应度值为基础,确定超参数个体的探索步长为:
37、<本文档来自技高网...
【技术保护点】
1.一种污染源在线监测数据中的造假数据分析方法,其特征在于,包括:
2.根据权利要求1所述的污染源在线监测数据中的造假数据分析方法,其特征在于,从指定数据源采集历史污染源监测数据,并对所述历史污染源监测数据进行预处理之后,得到用于训练算法模型的样本数据,包括:
3.根据权利要求2所述的污染源在线监测数据中的造假数据分析方法,其特征在于,对所述历史污染源监测数据依次进行数据完整性检查、时间序列分析以及数据平滑处理,得到完整的历史污染源监测数据,包括:
4.根据权利要求1所述的污染源在线监测数据中的造假数据分析方法,其特征在于,采用深度学习模型构建造假数据分析模型,包括:采用卷积神经网络构建造假数据分析模型。
5.根据权利要求2所述的污染源在线监测数据中的造假数据分析方法,其特征在于,以所述样本数据为基础,采用多层次信息探索算法对造假数据分析模型进行训练,得到训练之后的造假数据分析模型,包括:
6.根据权利要求5所述的污染源在线监测数据中的造假数据分析方法,其特征在于,针对每一个超参数个体,将所述超参数个体应用至造假数据分析
7.根据权利要求5所述的污染源在线监测数据中的造假数据分析方法,其特征在于,以每个超参数个体对应的适应度值为基础,对超参数个体执行邻域信息探索策略,得到一级信息探索之后的超参数个体,包括:
8.根据权利要求7所述的污染源在线监测数据中的造假数据分析方法,其特征在于,针对一级信息探索之后的超参数个体,根据所述最优超参数个体对超参数个体执行全局最优位置信息探索策略,得到二级信息探索之后的超参数个体,包括:
9.根据权利要求8所述的污染源在线监测数据中的造假数据分析方法,其特征在于,针对二级信息探索之后的超参数个体,根据所述最优超参数个体对超参数个体执行种群信息交互探索策略,得到三级信息探索之后的超参数个体,包括:
10.根据权利要求9所述的污染源在线监测数据中的造假数据分析方法,其特征在于,针对三级信息探索之后的超参数个体,对超参数个体执行信息跳跃探索策略,得到四级信息探索之后的超参数个体,包括:
...【技术特征摘要】
1.一种污染源在线监测数据中的造假数据分析方法,其特征在于,包括:
2.根据权利要求1所述的污染源在线监测数据中的造假数据分析方法,其特征在于,从指定数据源采集历史污染源监测数据,并对所述历史污染源监测数据进行预处理之后,得到用于训练算法模型的样本数据,包括:
3.根据权利要求2所述的污染源在线监测数据中的造假数据分析方法,其特征在于,对所述历史污染源监测数据依次进行数据完整性检查、时间序列分析以及数据平滑处理,得到完整的历史污染源监测数据,包括:
4.根据权利要求1所述的污染源在线监测数据中的造假数据分析方法,其特征在于,采用深度学习模型构建造假数据分析模型,包括:采用卷积神经网络构建造假数据分析模型。
5.根据权利要求2所述的污染源在线监测数据中的造假数据分析方法,其特征在于,以所述样本数据为基础,采用多层次信息探索算法对造假数据分析模型进行训练,得到训练之后的造假数据分析模型,包括:
6.根据权利要求5所述的污染源在线监测数据中的造假数据分析方法,其特征在于,针对每一个超参数个体,将所述超参数个体应用至造假数据...
【专利技术属性】
技术研发人员:苏晓君,
申请(专利权)人:成都中环科创科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。