本发明专利技术公开了一种基于决策树的光伏发电助学方法,所述方法具体包括如下步骤:S1、将历史补助对象的特征属性及补助等级作为训练样本集S中的样本数据,基于样本数据构建决策树;S2、基于决策树来判定补助对象的补助等级;S3、基于光伏日总发电量确定各补助等级的用电补助量。用决策树对学生特征属性信息进行分类,准确的筛选出那些生活困难和表现优异的同学,根据校园电力调度平台直接将光伏发电并网产生的经济效益转到对应学生的用电账户中,用校园光伏平台发电承担其宿舍部分或全部用电,开展助学新形式。
【技术实现步骤摘要】
基于决策树的光伏发电助学方法
本专利技术属于自学习
,更具体地,本专利技术涉及一种基于决策树的光伏发电助学方法。
技术介绍
随着我国文化教育事业的支持度不断提升。其中作为文化建设的重要组成部分,高校也进行着飞速的发展,招生数量逐年提升,越来越多的人可以进入高校学习。但是依旧还有一部分学生处于贫困状态,因此国家在高等教育阶段建立起国家奖学金、国家助学金、国家助学贷款、勤工助学、学费减免等多种形式的高校家庭经济困难学生资助政策。人为制定的助学资助条件,在满足助学资助条件的学生中,通过投票的方式或者是主观判定来确定助学补助等级,上述补助等级的评定方式主观性相对强,容易出现补助等级评定不准确的问题。
技术实现思路
本专利技术提供一种基于决策树的光伏发电助学方法,基于决策树来确定补助对象的补助等级,提高补助等级评定的客观性及精准度。本专利技术是这样实现的,基于决策树的光伏发电助学方法,所述方法具体包括如下步骤:S1、将历史补助对象的特征属性及补助等级作为训练样本集S中的样本数据,基于样本数据构建决策树;S2、基于决策树来判定补助对象的补助等级;S3、基于光伏日总发电量确定各补助等级的用电补助量。进一步的,决策树的构建方法具体包括如下步骤:S11、根据训练样本集S计算补助等级的类别信息熵;S12、对各特征属性进行划分,将每个特征属性分成若干个子属性,计算分类方式的条件熵,S13、将补助等级的类别信息熵与每种分类方式的条件熵的差值作为对应分类方式下的属性信息增益;S14、计算特征属性的属性分割信息量;S15、基于属性分割信息量及属性信息增益计算各特征属性的信息增益率,将信息增益率最高的特征属性作为决策树的根节点,若该特征属性下的特定子属性对应一个补助等级,则将该特征属性下的子属性作为叶子节点,否则作为分支继续分裂;S16、去除作为根节点及分叉节点的特征属性;S17、执行步骤S11至步骤S16,将信息增益率最高的特征属性作为下一级分叉节点,直至所有特征属性都已被使用,最终形成决策树;进一步的,补助等级的类别信息熵计算公式具体如下:其中,|Sj|为各补助等级的样本数,|S|是总的样本数,βN为各特征属性的权重之和,m表示补助等级的数量。进一步的,分类分方式的条件熵计算公式具体如下:将特征属性Ax分成A1、A2、…、AP个子属性,将训练样本集S中的样本映射到各子属性对应的样本子集中,其中,Ai为特征属性Ax的i个子属性,P为特征属性Ax的子属性数量,|Ai|是特征属性Ax第i个子属性Ai对应样本子集中的样本数,|S|是总样本数,βx为特征属性Ax对应的权重参数,βN为各特征属性的权重之和,|Aij|表示样本子集Ai中获得第j个补助等级的样本数,βxi为特征属性Ax第i个子属性Ai的权重参数,Info(Ai)表示特征属性Ax第i个子属性Ai对应子集的信息熵。进一步的,特征属性的属性分割信息量计算公式具体如下:其中,|Ai|是特征属性Ax第i个子属性Ai对应样本子集中的样本数,|S|是总样本数,βx为特征属性Ax对应的权重参数,βN为各特征属性的权重之和。进一步的,信息增益率的计算公式具体如下:其中,Gain(Ax)为分类方式下的属性信息增益,SplitInfo(Ax)为特征属性的属性分割信息量。进一步的,特征属性包括:贫困程度、公益活动记录、违规用电记录、校园消费记录及成绩等级。用决策树对学生特征属性信息进行分类,准确的筛选出那些生活困难和表现优异的同学,根据校园电力调度平台直接将光伏发电并网产生的经济效益转到对应学生的用电账户中,用校园光伏平台发电承担其宿舍部分或全部用电,开展助学新形式。附图说明图1为本专利技术实施例提供的基于决策树的光伏发电助学方法流程图;图2为本专利技术实施例提供的特征属性简化后的决策树示意图。具体实施方式下面对照附图,通过对实施例的描述,对本专利技术的具体实施方式作进一步详细的说明,以帮助本领域的技术人员对本专利技术的专利技术构思、技术方案有更完整、准确和深入的理解。图1为本专利技术实施例提供的基于决策树的光伏发电助学方法流程图,该方法具体包括如下步骤:S0、将历史补助对象的特征属性及补助等级作为训练样本集S中的样本数据,特征属性包括:贫困程度、公益活动记录、违规用电记录、校园消费记录及成绩等级。S1、根据训练样本集S计算补助等级的类别信息熵,其计算公式具体如下:其中,|Sj|为各补助等级的样本数,|S|是总的样本数,βN为各特征属性的权重之和,m表示补助等级的数量。在本专利技术实施例中,类别信息熵表示所有样本中各种补助等级类别出现的不确定性的和,信息熵值越大,不确定性就越大,而当信息熵值为0时,则表示只有一种补助等级类别。由于学生的各种特征属性对补助等级判定结果的影响因子不一样,如学生的成绩比参加过公益活动影响力大,学生成绩中优秀比及格的影响力大,在决策树的基础上,对各个特征属性和各个特征属性下的子属性给予一个权重参数β。S2、对各特征属性进行划分,将每个特征属性分成若干个子属性,计算分类方式的条件熵,其计算公式具体如下:将特征属性Ax分成A1、A2、…、AP个子属性,将总样本数据映射到各子属性对应的样本子集中,其中,Ai为特征属性Ax的i个子属性,P为特征属性Ax的子属性数量,|Ai|是特征属性Ax第i个子属性Ai对应样本子集中的样本数,|S|是总样本数,βx为特征属性Ax对应的权重参数,βN为各特征属性的权重之和,|Aij|表示样本子集Ai中获得第j个补助等级的样本数,βxi为特征属性Ax第i个子属性Ai的权重参数,Info(Ai)表示特征属性Ax第i个子属性Ai对应子集的信息熵。每种分类方式的条件熵表示在该分类方式下各种子属性类别出现的不确定性之和,条件熵越大,表示这个属性中拥有的样本类别越乱。S3、将补助等级的类别信息熵与每种分类方式的条件熵的差值作为对应分类方式下的属性信息增益,其计算公式具体如下:Gain(Ax)=Info(S)-Info(Ax)属性信息增益表示信息不确定性减少的程度。信息增益越大,表示该属性可以更好的减少划分后样本的不确定性,选择该属性作为下一级的分裂节点有利于更好的完成分类目标。S4、计算特征属性的属性分割信息量,其计算公式具体如下:属性分割信息量用于考虑某种属性进行分裂时分支的数量信息和尺寸信息,有利于提升资格判断的准确性。S5、基于属性分割信息量及属性信息增益计算各特征属性的信息增益率,将信息增益率最高的特征属性作为决策树的根节点,若该特征属性下的特定子属性对应一个补助等级,则将该特征属性下的子属性作为叶子节点,否则作为分支继续分裂,信息增益率的计算公式具体如下:S6、去除作为本文档来自技高网...
【技术保护点】
1.一种基于决策树的光伏发电助学方法,其特征在于,所述方法具体包括如下步骤:/nS1、将历史补助对象的特征属性及补助等级作为训练样本集S中的样本数据,基于样本数据构建决策树;/nS2、基于决策树来判定补助对象的补助等级;/nS3、基于光伏日总发电量确定各补助等级的用电补助量。/n
【技术特征摘要】
1.一种基于决策树的光伏发电助学方法,其特征在于,所述方法具体包括如下步骤:
S1、将历史补助对象的特征属性及补助等级作为训练样本集S中的样本数据,基于样本数据构建决策树;
S2、基于决策树来判定补助对象的补助等级;
S3、基于光伏日总发电量确定各补助等级的用电补助量。
2.如权利要求1所述基于决策树的光伏发电助学方法,其特征在于,决策树的构建方法具体包括如下步骤:
S11、根据训练样本集S计算补助等级的类别信息熵;
S12、对各特征属性进行划分,将每个特征属性分成若干个子属性,计算分类方式的条件熵,
S13、将补助等级的类别信息熵与每种分类方式的条件熵的差值作为对应分类方式下的属性信息增益;
S14、计算特征属性的属性分割信息量;
S15、基于属性分割信息量及属性信息增益计算各特征属性的信息增益率,将信息增益率最高的特征属性作为决策树的根节点,若该特征属性下的特定子属性对应一个补助等级,则将该特征属性下的子属性作为叶子节点,否则作为分支继续分裂;
S16、去除作为根节点及分叉节点的特征属性;
S17、执行步骤S11至步骤S16,将信息增益率最高的特征属性作为下一级分叉节点,直至所有特征属性都已被使用,最终形成决策树。
3.如权利要求2所述基于决策树的光伏发电助学方法,其特征在于,补助等级的类别信息熵计算公式具体如下:
其中,|Sj|为各补助等级的样本数,|S|是总的样本数,βN为各特征属性的权重之和,m表示补助等级的数量。
【专利技术属性】
技术研发人员:葛愿,汤程,徐正伟,高文根,余诺,范晓东,林其友,
申请(专利权)人:安徽工程大学,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。