System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于决策树和朴素贝叶斯算法的光伏异常数据识别方法技术_技高网

基于决策树和朴素贝叶斯算法的光伏异常数据识别方法技术

技术编号:40873030 阅读:16 留言:0更新日期:2024-04-08 16:40
本发明专利技术提供了一种基于决策树和朴素贝叶斯算法的光伏异常数据识别方法,包括:获取分布式光伏系统的待测数据,所述待测数据包括:光伏系统运行过程中所包含的历史数据和实时运行数据;获取所述待测数据中与异常状态相关的特征数据,得到特征数据集;构建决策树模型和朴素贝叶斯模型;通过多数投票法,对所述决策树模型和所述朴素贝叶斯模型进行集成,得到集成模型;将所述特征数据集输入集成模型,得到分布式光伏系统的异常状态数据。本发明专利技术解决了现有技术中对于分布式光伏异常数据的识别准确度低下的问题。

【技术实现步骤摘要】

本专利技术涉及光伏异常数据识别,特别是涉及一种基于决策树和朴素贝叶斯算法的光伏异常数据识别方法


技术介绍

1、随着能源需求的进一步增加以及光伏产业的不断发展,太阳能成为重要的能量来源,光伏发电系统在能源供应中的重要性也逐渐显露出来。由于光伏发电系统受光照、温度、负载变化等诸多因素影响,使得光伏发电系统运行数据十分庞杂,针对光伏发电系统异常数据的识别和处理对系统性能至关重要,目前对于分布式光伏异常数据的识别准确度较为低下。


技术实现思路

1、为了克服现有技术的不足,本专利技术的目的是提供一种基于决策树和朴素贝叶斯算法的光伏异常数据识别方法,本专利技术解决了现有技术中对于分布式光伏异常数据的识别准确度低下的问题。

2、为实现上述目的,本专利技术提供了如下方案:

3、一种基于决策树和朴素贝叶斯算法的光伏异常数据识别方法,包括:

4、获取分布式光伏系统的待测数据,所述待测数据包括:光伏系统运行过程中所包含的历史数据和实时运行数据;

5、获取所述待测数据中与异常状态相关的特征数据,得到特征数据集;

6、构建决策树模型和朴素贝叶斯模型;

7、通过多数投票法,对所述决策树模型和所述朴素贝叶斯模型进行集成,得到集成模型;

8、将所述特征数据集输入集成模型,得到分布式光伏系统的异常状态数据。

9、优选地,所述决策树模型的构建方法为:

10、根据所述特征数据集的特征属性类型对所述特征数据集进行分类,得到分类数据集;

11、根据所述分类数据集构建所述决策树模型。

12、优选地,根据所述特征数据集的特征属性类型对所述特征数据集进行分类,得到分类数据集,包括:

13、计算得到期望信息总量,并根据所述期望信息总量得到信息增益;

14、利用信息增益,根据特征数据集的特征属性类型对所述特征数据集中的元祖进行分类得到子特征数据集;

15、判断子特征数据集中的元祖是否均为同一类别,若是,则得到分类数据集,若否,则继续对所述元祖进行分类,直至元祖的特征属性类型相同。

16、优选地,所述期望信息总量的计算公式为:

17、

18、i(d)为期望信息总量,m为特征属性的取值数量;pi为特征数据集中各特征属性属于第i个类别的概率

19、优选地,所述信息增益的计算公式为:

20、g(a,d)=i(d)-ia(d);

21、其中,g(a,d)为信息增益,ia(d)为子特征数据集完成分类所需要的信息量。

22、优选地,所述朴素贝叶斯模型的构建方法为:

23、对所述分类数据集的每个类别进行计算,得到所述分类数据的先验概率;

24、基于朴素贝叶斯算法,根据所述先验概率进行计算,得到后验概率;

25、基于贝叶斯定理,根据所述后验概率构建所述朴素贝叶斯模型。

26、优选地,将所述特征数据集输入集成模型,得到分布式光伏系统的异常状态数据,包括:

27、获取所述分类数据集的后验概率的最大值;

28、根据所述分类数据集的后验概率的最大值确定特征数据集中异常的特征属性;

29、根据所述异常的特征属性确定异常数据。

30、优选地,所述特征属性包括:

31、光伏板温度、电流、电压、发电功率。

32、根据本专利技术提供的具体实施例,本专利技术公开了以下技术效果:

33、本专利技术提供了一种基于决策树和朴素贝叶斯算法的光伏异常数据识别方法,本专利技术能够对分布式光伏异常数据进行快速识别。决策树模型构建过程中,通过自顶而下递归的分治方法,分布式光伏数据集根据被分类对象的特征递归地被分为较小的分区,每次划分得到的各分区中,各元组相较划分前更趋于同一种类,即该分区中趋于同一种类的元组比例更大,完成数据的分类。朴素贝叶斯模型构建过程中,以贝叶斯定理为基础,假设收集到的各个光伏数据特征相互独立,先确定数据特征属性,通过给定的训练集,学习从输入到输出的联合概率分布,再基于学习到的模型,输入x求出使得后验概率最大的输出值y。最后通过投票法对数据集进行10次重复交叉验证分类,对多个分类结果进行集成,每个像素最终确定为10次中出现次数最多的那个类,以减少样本的选择对分类结果的影响,实现对分布式光伏异常数据的准确识别。

本文档来自技高网...

【技术保护点】

1.一种基于决策树和朴素贝叶斯算法的光伏异常数据识别方法,其特征在于,包括:

2.根据权利要求1所述的一种基于决策树和朴素贝叶斯算法的光伏异常数据识别方法,其特征在于,所述决策树模型的构建方法为:

3.根据权利要求2所述的一种基于决策树和朴素贝叶斯算法的光伏异常数据识别方法,其特征在于,根据所述特征数据集的特征属性类型对所述特征数据集进行分类,得到分类数据集,包括:

4.根据权利要求3所述的一种基于决策树和朴素贝叶斯算法的光伏异常数据识别方法,其特征在于,所述期望信息总量的计算公式为:

5.根据权利要求4所述的一种基于决策树和朴素贝叶斯算法的光伏异常数据识别方法,其特征在于,所述信息增益的计算公式为:

6.根据权利要求2所述的一种基于决策树和朴素贝叶斯算法的光伏异常数据识别方法,其特征在于,所述朴素贝叶斯模型的构建方法为:

7.根据权利要求6所述的一种基于决策树和朴素贝叶斯算法的光伏异常数据识别方法,其特征在于,将所述特征数据集输入集成模型,得到分布式光伏系统的异常状态数据,包括:

8.根据权利要求7所述的一种基于决策树和朴素贝叶斯算法的光伏异常数据识别方法,其特征在于,所述特征属性包括:

...

【技术特征摘要】

1.一种基于决策树和朴素贝叶斯算法的光伏异常数据识别方法,其特征在于,包括:

2.根据权利要求1所述的一种基于决策树和朴素贝叶斯算法的光伏异常数据识别方法,其特征在于,所述决策树模型的构建方法为:

3.根据权利要求2所述的一种基于决策树和朴素贝叶斯算法的光伏异常数据识别方法,其特征在于,根据所述特征数据集的特征属性类型对所述特征数据集进行分类,得到分类数据集,包括:

4.根据权利要求3所述的一种基于决策树和朴素贝叶斯算法的光伏异常数据识别方法,其特征在于,所述期望信息总量的计算公式为:

5....

【专利技术属性】
技术研发人员:何玉灵宋海博段正茂孙凯焦凌钰解奎卢洪昌於咸豪
申请(专利权)人:华北电力大学保定
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1