一种基于长短期记忆网络的电力数据征信标签应用方法技术

技术编号:33280719 阅读:11 留言:0更新日期:2022-04-30 23:41
本发明专利技术公开了一种基于长短期记忆网络的电力数据征信标签应用方法。该方法包括:构建企业电力数据征信标签指标;基于深度神经网络对电力数据征信标签进行分类;利用时间序列模型分析企业电力数据征信标签,得到企业信用水平的量化值。本发明专利技术能够构建有效的企业电力数据征信标签指标,形成包含公司治理、公司发展质量和公司发展环境等多方面的企业电力数据征信标签指标,并运用深度神经网络对企业电力数据征信标签进行分类和计算,得到企业电力信用水平的量化值,进而为金融机构做出是否对企业进行信贷的决策提供支撑。业进行信贷的决策提供支撑。业进行信贷的决策提供支撑。

【技术实现步骤摘要】
一种基于长短期记忆网络的电力数据征信标签应用方法


[0001]本专利技术涉及数据标签
,更具体地,涉及一种基于长短期记忆 网络的电力数据征信标签应用方法。

技术介绍

[0002]目前,随着面向数据征信的开放性和合规性日益健全,电力领域数据 在经济建设和社会发展中发挥着不可或缺的作用。电力大数据主要来源于 电力生产和电能使用的发电、输电、变电、配电、用电和调度各个环节, 包含电网运行和设备检测或监测数据、电力企业营销数据,电力企业管理 数据等多维度数据。由于电力大数据具有可信度高、时效性强、连续性好、 完整性好、覆盖面广等特点,在数字经济浪潮的驱动下,利用电力大数据, 分析预测企业能源消费和使用情况,对用户实施精准画像,对于提升电力 数据在经济发展中的作用和地位,推进国家治理现代化具有重要意义。对 电力大数据进行深度挖掘和创新应用,可促进供需对接、要素重组、融通 创新的平台型企业建设,带动产业链上下游共同发展,推动共享型企业构 建。
[0003]随着信息系统功能建设的不断完善,大数据研究应用的深入开展,电 力信息化应用的深度和广度不断增强,然而大数据技术的实用化遇到了一 些瓶颈。一方面,随着系统运行累积下来的大量信息堆积在系统中,应用 不足,信息化建设的成效没能被充分发挥;另一方面,数字信息需要结合 专业和相关系统知识才能深入理解的现状造成了应用功能使用门槛越来越 高。大量应用系统建设导致了普通业务人员大量学习成本的投入,影响了 信息系统应用的广度和服务能力提升,也导致信息系统有效改进需求匮乏。 如何将这些信息数据转化为便于理解、使用的日常生产知识,实现信息系 统建设与日常生产实践相互促进的良性互动格局已经成为未来信息化深入 开展建设的重要难题。
[0004]综上,在网络与大数据技术飞速发展的时代,如何构建更具说服力的 企业电力数据征信标签指标,研究其信用水平一直是金融领域研究的热点 问题。

技术实现思路

[0005]本专利技术的目的是克服上述现有技术的缺陷,提供一种基于长短期记忆 网络的电力数据征信标签应用方法,该方法包括以下步骤:
[0006]构建企业电力数据征信标签指标;
[0007]基于深度神经网络对电力数据征信标签进行分类;
[0008]利用时间序列模型分析企业电力数据征信标签,得到企业信用水平的 量化值。
[0009]与现有技术相比,本专利技术的优点在于,提供一种应用企业电力数据征 信标签应用方法,用来解决金融领域对于企业信用水平进行评价问题。本 专利技术基于ADF检验、VAR自回归模型、Granger因果检验构建有效的企业 电力数据征信标签指标,形成包含公司治理、公司发展质量和公司发展环 境等多方面的企业电力数据征信标签指标;运用LSTM深度神经网络对企 业电力数据征信标签进行分类和计算,得到企业电力信用水平的量化值, 进而
为金融机构做出是否对企业进行信贷的决策提供支撑。
[0010]通过以下参照附图对本专利技术的示例性实施例的详细描述,本专利技术的其 它特征及其优点将会变得清楚。
附图说明
[0011]被结合在说明书中并构成说明书的一部分的附图示出了本专利技术的实 施例,并且连同其说明一起用于解释本专利技术的原理。
[0012]图1是根据本专利技术一个实施例的基于长短期记忆网络的电力数据征信 标签应用方法的流程图。
具体实施方式
[0013]现在将参照附图来详细描述本专利技术的各种示例性实施例。应注意到: 除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、 数字表达式和数值不限制本专利技术的范围。
[0014]以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作 为对本专利技术及其应用或使用的任何限制。
[0015]对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨 论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
[0016]在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例 性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的 值。
[0017]应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一 旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步 讨论。
[0018]简言之,本专利技术提供一种应用企业电力数据征信标签应用方法,首先 应用ADF检验(Augmented Dickey

Fuller test)、VAR(Vector Auto

regressiveModel)自回归模型、Granger因果检验构建有效的企业电力数据征信标签 指标;然后,应用深度神经网络进行标签分类;最后,利用LSTM深度神 经网络对企业电力数据征信标签进行计算,得到企业电力信用水平的量化 值。
[0019]具体地,参见图1所示,所提供的基于长短期记忆网络的电力数据征 信标签应用方法包括以下步骤。
[0020]S1,利用ADF检验、VAR自回归模型、Granger因果检验构建有效 的企业电力数据征信标签指标。
[0021]在该步骤中,可对数据集进行抽样,样本数计算得到的重要性分数稳 定性进行对比,确定输入样本数进行重要性计算。
[0022]电力指数数据的平稳性指随着时间的推移,时间序列的统计规律不会 发生变化。从直观的曲线来看,如果一个时间序列是平稳的,那么其序列 曲线围绕其均值上下波动。如果时间序列的均值、方差和自协方差不随时 间发生变化,且序列的各阶自协方差仅与滞后阶数有关,则称时间序列y
t
是 弱平稳的。非平稳性即指随着时间的变化,时间序列的统计规律也发生变 化。实际中,只有极少数时间数据是平稳的。
[0023]ADF检验可以判断时间序列的平稳性,如果时间序列仍不平稳,则需 要进行差分
计算来调整,一阶差分仍不平稳的再进行二阶差分。在ADF检 验之前,需要考虑不含截距项、含截距项但不含趋势项、含截距项和趋势 项三种形式的检验回归模型,它们分别对应如下回归模型:
[0024][0025]其中,Δy
t
是y
t
的一阶差分序列;a是截距项,为常数;δ
t
是时间趋势; ε
t
是独立同分布,且服从均值为零,方差为σ2的正态分布;γ和β是序列系 数;是因变量y
t
的之后差分项,可用来控制高阶序列相关;l是因 变量的滞后阶数。
[0026]企业征信标签模型只有通过了ADF检验,才可以进行VAR自回归模 型等分析。VAR向量自回归模型是一种不以经济理论为基础的变量组合模 型。VAR采用多方程联立的形式,在模型的每一个方程中,模型的全部内 生变量的滞后值通过回归分析组成内生变量的表达式。并用该方法对全部 内生变量所存在的动态关系进行估计,其一般形式表示为:
[0027]Y
t
=A1Y
t
‑1+A2Y
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于长短期记忆网络的电力数据征信标签应用方法,包括以下步骤:步骤S10,构建企业电力数据征信标签指标;步骤S20,基于深度神经网络对电力数据征信标签进行分类;步骤S30,利用时间序列模型分析企业电力数据征信标签,得到企业信用水平的量化值。2.根据权利要求1所述的方法,其特征在于,所述企业电力数据征信标签指标基于ADF检验、VAR自回归模型和Granger因果检验构建,并且是反映公司治理、公司发展质量和公司发展环境三个方面的征信标签指标。3.根据权利要求1所述的方法,其特征在于,所述Granger因果检验用于判断企业征信标签变量之间的因果关系,并判断变量之间的影响方向。4.根据权利要求1所述的方法,其特征在于,所述时间序列模型是长短期记忆网络。5.根据权利要求4所述的方法,其特征在于,所述长短期记忆网络是双向网络。6.根据权利要求1所述的方法,其特征在于,所述基于深度神经网络对电力数据征信标签进行分类包括:计算大类标签,表示为:其中,p(c=CLASSES|T
n
)表示第n个文本的类别为CLASSES的标签的概率,并利用标签类别计算分类损失,表示为:L
C



C
y
n
log(p(c=Classes|T
n
))计算对应小类的分类概率,表示为:其中,p(c=classes|T
n
)表示第n个文本属于第CLASSES个大类标签下第classes个小类标签的概率,并利用小类标签结果计算分类损失,表示为:L
classes



classes
y
n
log(p(c=classes|T
n
))...

【专利技术属性】
技术研发人员:毕超陈嘉翊杨培
申请(专利权)人:国网雄安金融科技集团有限公司国网征信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1