【技术实现步骤摘要】
一种居民用电数据挖掘中应用贝叶斯估计补充缺失值的方法
本专利技术涉及电力负荷预测
,具体涉及一种居民用电数据挖掘中对居民用电数据中的缺失值应用贝叶斯估计补充缺失数据的方法。
技术介绍
对居民用电消费受较多因素的影响,掌握居民用电习惯及其主要影响因素间的规律对电力系统调度,电力市场化的推进,智能化城市管理都具有重要意义。要对居民用电数据进行分析挖掘的第一步就是收集完整有效的居民用电数据。但是居民用电数据的数据集会因为各种原因(例如突发事件导致的数据丢失等)而包含缺失值,这些缺失值通常会被留为空白,或是被标记为占位符。当数据挖掘模型训练一个包含很多缺失值的数据集时,缺失值的存在会很大程度上影响机器学习模型的表现。数据阿挖掘中的一些算法会假设所有值都是数值型且包含意义的,当这些缺失值被引入数据挖掘模型中会给模型的分析结果带来不可控的影响和准确性损失的后果。面对这种情况,一种更策略是插补缺失值,也就是从观测的数据中推测出缺失值的大小,其中一种比较好的方法就是贝叶斯估计。本专利技术公开了一种对居民数据的缺失值应用贝叶斯估计的方法补充缺失数据,达到保证居民用电数据完整性的目的。
技术实现思路
本专利技术提出了一种针对居民用电数据中的缺失值应用贝叶斯估计补充缺失数据的方法,其特点在于利用贝叶斯估计方法算出极大似然数以补充居民用电数据集中的缺失值。贝叶斯估计是统计学中一种对模型的参数确定的方法,认为数据集中的各个参数是服从某种概率分布的,已有的数据只是在这种参数的分布下产生的。所以,直观理解上,就是 ...
【技术保护点】
1.本专利技术一种居民用电数据挖掘中应用贝叶斯估计补充缺失值的方法的特征在于,包括:/n步骤一、
【技术特征摘要】
1.本发明一种居民用电数据挖掘中应用贝叶斯估计补充缺失值的方法的特征在于,包括:
步骤一、数据预处理:对采集到的原始居民用电数据按时间序列排列,确定数据集起止时间,检查数据在时间序列上的缺省,标明缺省值并记录缺省的起止时间;
步骤二、贝叶斯估计补充缺失值:将经过步骤1预处理的居民用电数据标注时间戳后进行贝叶斯估计运算,补充在某些时间段没有相对应的数据,电力负荷数据在时间序列上的连贯性;
具体采用的计算方法如下:
1).通过数据集的分布形态确定确失值参数θ的先验分布函数P(θ);
2).由整体数据集的D={x1,x2,…,xn}求出样本的联合分布函数P(D|θ),它是针对于θ的一个函数;
3).利用贝叶斯公式,求出θ的后验分布:
;
4).求出贝叶斯估计值:
;
其中为计算目标所求的最大似然数,用于补充缺失值,计算方法中的先验分布函数P
(θ)及样本的联合分布函数...
【专利技术属性】
技术研发人员:周浩,顾一峰,胡炳谦,韩俊,
申请(专利权)人:上海积成能源科技有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。