一种电力金融风险的分析检测方法及系统技术方案

技术编号:38360207 阅读:11 留言:0更新日期:2023-08-05 17:29
本发明专利技术公开了一种电力金融风险的分析检测方法及系统,涉及电力金融系统的风险分析和风险预测技术领域,包括:利用随机森林模型,对电力系统客户行为数据,获取对用户行为的影响最大的关键特征;基于关键特征,通过贝叶斯优化算法对随机森林模型中的各项参数进行优化,并采取放回抽取方法进行模型的准确性测试;采集关于电力系统客户行为数据的样本数据,通过准确性测试后的随机森林模型进行预测,根据生成的AUC值对应的客户行为特征,分析得出样本数据中潜在的电力金融风险;本发明专利技术将电力客户群体的特征属性和优化随机森林模型相结合,利用数据挖掘提取用户特征向量,建立更为适合电力系统的预测模型,实现了对于电力金融风险潜在风险的预测。在风险的预测。在风险的预测。

【技术实现步骤摘要】
一种电力金融风险的分析检测方法及系统


[0001]本专利技术涉及电力金融系统的风险分析和风险预测
,具体而言,涉及一种电力金融风险的分析检测方法及系统。

技术介绍

[0002]近年来,电力系统的网络规模不断扩大,电网业务的形式也逐步呈现多样化的趋势,能源流、数据流、现金流等多流合一的电力系统生态质量,决定着该领域的健康发展程度。因此,研究如何有效评估电力系统业务的发展水平并做出预测具有实际意义。
[0003]目前诸多金融风险的分析与预测都将研究对象集中于社会面金融问题,所解决问题大多为较大范围金融预测趋势,方法大多采用回归或神经网络等方式,这些方式存在的主要问题是不能客观准确处理具有复杂特征值的数据样本,具有欠拟合或过拟合等问题。虽然人工神经网络、决策树模型、支持向量机模型、回归算法等预测方法被用于系统性金融风险的预测当中,并表现出了较好的分类判断效果,但是这些预测方法没有充分考虑电力系统用户的各项特殊属性。各种回归分类算法是较决策树模型和神经网络算法在分类预测方面应用较早的方法,随着在各个领域应用的深入,算法自身的局限性也逐渐显现出来。比如线性回归是采用超平面来拟合所有的训练数据,但如果数据不呈线性分布关系时,线性模型得到的结果是欠拟合的。针对这些缺陷提现了许多改进的方法,比如挖掘更多的特征,比如不同的特征之间的组合,但这样做会使得模型更复杂,而且好的特征选取并不是一件简单的事。或者通过修改线性回归使其变为局部加权线性回归(LWR),该方法使得在不添加新特征的前提下,获得近似的效果。但是,LWR也有不足。其最大的缺点是空间开销比较大,在线性回归模型中,当训练得到参数的最优解,就可以得到新数据的预测输出,但LWR除了保留参数得到最优解外,还要保留全部的训练数据,以求取每一个训练数据对应于新数据的权重值;因此可见,现有模型仍未在该领域取得理想效果。

技术实现思路

[0004]为了解决上述问题,本专利技术的目的是提供一种电力金融风险的分析检测方法及系统,通过贝叶斯算法快速并能准确找出最优参数组合的优势,结合随机森林模型的快速收敛能力和优秀的分类能力进而对电力系统用户行为进行判断及进行金融风险预测。
[0005]为了实现上述技术目的,本申请提供了一种电力金融风险的分析检测方法,包括以下步骤:
[0006]利用随机森林模型,对电力系统客户行为数据,获取对用户行为的影响最大的关键特征;
[0007]基于关键特征,通过贝叶斯优化算法对随机森林模型中的各项参数进行优化,并采取放回抽取方法进行模型的准确性测试;
[0008]采集关于电力系统客户行为数据的样本数据,通过准确性测试后的随机森林模型进行预测,根据生成的AUC值对应的客户行为特征,分析得出样本数据中潜在的电力金融风
险。
[0009]优选地,在获取电力系统客户行为数据的过程中,根据电力系统的客户缴费情况,通过数据准备、规律寻找和规律表示三个步骤对电力企业用户缴费数据进行特征提取、预处理、挖掘分析,获取用于表征客户缴费的行为数据,生成电力系统客户行为数据。
[0010]优选地,在获取关键特征的过程中,基于随机森林模型,使用feature_importances方法,通过获取电力系统客户行为数据的每个特征属性在随机森林模型中的重要程度,提取关键特征。
[0011]优选地,在对随机森林模型进行优化的过程中,通过贝叶斯优化算法的先验函数和采集函数,对随机森林模型进行优化,其中,先验函数为高斯过程回归,采集函数为PI函数。
[0012]优选地,在对随机森林模型进行优化的过程中,利用控制变量方法对随机森林模型的各项参数进行初步调整优化,获取满足关键特征的变量组合,并通过贝叶斯优化算法对随机森林模型进行进一步优化后,进行准确性测试。
[0013]优选地,在进行准确性测试的过程中,获取优化后的随机森林模型的ROC曲线;
[0014]依据ROC曲线的曲线下面积,生成AUC值。
[0015]本专利技术公开了一种电力金融风险的分析检测系统,包括:
[0016]数据收集模块,用于获取电力系统客户行为数据;
[0017]数据分析模块,用于利用随机森林模型,对电力系统客户行为数据,获取对用户行为的影响最大的关键特征,并通过贝叶斯优化算法对随机森林模型中的各项参数进行优化,采取放回抽取方法进行模型的准确性测试;
[0018]风险预测模块,用于获取采集的关于电力系统客户行为数据的样本数据,通过准确性测试后的随机森林模型进行预测,根据生成的AUC值对应的客户行为特征,分析得出样本数据中潜在的电力金融风险。
[0019]优先地,数据收集模块还用于根据电力系统的客户缴费情况,通过数据准备、规律寻找和规律表示三个步骤对电力企业用户缴费数据进行特征提取、预处理、挖掘分析,获取用于表征客户缴费的行为数据,生成电力系统客户行为数据。
[0020]本专利技术公开了以下技术效果:
[0021]本专利技术将电力客户群体的特征属性和优化随机森林模型相结合,利用数据挖掘提取用户特征向量,借助随机森林在分类方面准确性和收敛速度兼顾的优势以及贝叶斯算法在寻求最优参数集合的优秀表现建立更为适合电力系统的预测模型,实现了对于电力金融风险的潜在风险的预测;
[0022]本专利技术利用贝叶斯算法优化的随机森林算法相较于神经网络模型更简单,训练速度更快,且适合处理较大规模数据。
附图说明
[0023]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0024]图1是本专利技术所述的随机森林模型在电力系统金融风险预测模型判断流程图;
[0025]图2是本专利技术所述的整体算法流程图;
[0026]图3是本专利技术所述的特征变量重要性饼状图。
具体实施方式
[0027]为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0028]如图1

3所示,本专利技术提出的基于改进的随机森林模型的电力金融风险分析预测方法,其处理过程包括:
[0029](1)利用数据清洗和数据挖掘技术对于某段时间内的电力系统客户行为进行数据的提取与分析,并进行初步处理,可将原始数据的特征属性分析提取,为后续的模型训练提供可靠的数据支撑;...

【技术保护点】

【技术特征摘要】
1.一种电力金融风险的分析检测方法,其特征在于,包括以下步骤:利用随机森林模型,对电力系统客户行为数据,获取对用户行为的影响最大的关键特征;基于所述关键特征,通过贝叶斯优化算法对所述随机森林模型中的各项参数进行优化,并采取放回抽取方法进行模型的准确性测试;采集关于所述电力系统客户行为数据的样本数据,通过准确性测试后的随机森林模型进行预测,根据生成的AUC值对应的客户行为特征,分析得出所述样本数据中潜在的电力金融风险。2.根据权利要求1所述一种电力金融风险的分析检测方法,其特征在于:在获取电力系统客户行为数据的过程中,根据电力系统的客户缴费情况,通过数据准备、规律寻找和规律表示三个步骤对电力企业用户缴费数据进行特征提取、预处理、挖掘分析,获取用于表征客户缴费的行为数据,生成所述电力系统客户行为数据。3.根据权利要求2所述一种电力金融风险的分析检测方法,其特征在于:在获取关键特征的过程中,基于所述随机森林模型,使用feature_importances方法,通过获取所述电力系统客户行为数据的每个特征属性在所述随机森林模型中的重要程度,提取所述关键特征。4.根据权利要求3所述一种电力金融风险的分析检测方法,其特征在于:在对随机森林模型进行优化的过程中,通过所述贝叶斯优化算法的先验函数和采集函数,对所述随机森林模型进行优化,其中,所述先验函数为高斯过程回归,所述采集函数为PI函数。5.根据权利要求...

【专利技术属性】
技术研发人员:陆玮王鹏吴小志胡健夏心锋郭源李倩倩刘莉莉
申请(专利权)人:南瑞集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1