AI驱动的协作企业多维信用特征提取与评价方法技术

技术编号:33133653 阅读:23 留言:0更新日期:2022-04-17 00:55
本发明专利技术公开AI驱动的协作企业多维信用特征提取与评价方法,应用于企业信用评估领域,针对现有技术存在的企业信用评估准确率不够高的问题;本发明专利技术采用更多的财务数据指标,而且加入对企业信用评论的文本数据指标,从多个维度刻画企业形象,采用多个模型提取特征,能够有效地提高企业信用评估的准确性。够有效地提高企业信用评估的准确性。够有效地提高企业信用评估的准确性。

【技术实现步骤摘要】
AI驱动的协作企业多维信用特征提取与评价方法


[0001]本专利技术属于数据处理领域,特别涉及一种企业信用评价技术。

技术介绍

[0002]企业信用风险评估从20世纪60年代以来就一直是国际学术界和金融界研究的重要课题。大量的市场调查研究和长期的实践表明,导致我国企业应收账款拖欠的主要原因是事前没有对企业的信用进行充分评估。金蝶云
·
苍穹生态圈中也存在相同问题,对生态圈中的协作企业信用进行评估,降低企业违约事件发生的概率,为企业的合理销售提供技术支持是金蝶云
·
苍穹企业协同与生态圈构建的基础。以金蝶云
·
苍穹生态圈中的企业为研究对象,利用大数据分析技术、机器学习方法、深度学习技术,对生态圈中企业的信用进行评估。
[0003]目前主要有以下两种处理方法:
[0004]1、专家经验的方法:企业有经验的专家根据几个企业的财务指标制定一个经验公式,通过公式得到企业的信用评分,进而划分企业的信用等级。这类方法通常只能考虑企业财务相关的少数指标,对企业的形象刻画不够全面,对经验公式的要求非常高,具有较大的错误率。
[0005]2、机器学习的方法:这类方法采用传统的机器学习模型,如SVM、xgboost等。这些模型可以处理较多的财务数据指标,但无法对文本评论数据进行有效的处理,而且单个模型的准确率有限,效果不太理想。
[0006]现有技术主要存在以下缺点:
[0007](1)基于专家经验的方法考虑的财务指标不够全面,对经验的依赖太强,准确率不高。
[0008](2)机器学习的方法模型单一,无法处理文本评论数据,对企业的形象刻画不够全面,准确率不够高。

技术实现思路

[0009]为解决上述技术问题,本专利技术提出一种AI驱动的协作企业多维信用特征提取与评价方法,不仅采用更多的财务数据指标,而且加入对企业信用评论的文本数据指标,从多个维度刻画企业形象,采用多个模型提取特征,能够有效地提高企业信用评估的准确性。
[0010]本专利技术采用的技术方案为:AI驱动的协作企业多维信用特征提取与评价方法,包括:
[0011]S1、获取财务数据与文本数据;本专利技术中的数据获取方式主要为数据平台或者企业主动提供的数据;
[0012]S2、对获取到的财务数据与文本数据进行预处理;
[0013]S3、对预处理后的财务数据与文本数据进行数据不平衡处理;
[0014]S4、建立基于Stacking算法企业信用评估方法模型;
[0015]S5、采用步骤S3得到的数据对基于Stacking算法企业信用评估方法模型进行训练;
[0016]S6、采用训练好的基于Stacking算法企业信用评估方法模型得到待评估企业信用等级。
[0017]本专利技术的有益效果:本专利技术的方法包括以下优点:
[0018]1、采用生成对抗网络生成少数类别数据,即信用评价为低的类别,解决数据不平衡问题;
[0019]2、加入多个财务数据指标和文本评论数据,全面刻画企业形象;
[0020]3、采用集成学习中的Stacking算法,提高准确度。
附图说明
[0021]图1为本专利技术实施例中提供的生成财务收据的网络模型;
[0022]图2为本专利技术实施例中提供的生成文本数据的网络模型;
[0023]图3为Stacking算法模型结构图;
[0024]图4为评论文本特征提取模块;
[0025]图5为本专利技术方法的流程图。
具体实施方式
[0026]为便于本领域技术人员理解本专利技术的
技术实现思路
,下面结合附图对本
技术实现思路
进一步阐释。
[0027]本专利技术的方法包括:
[0028](1)财务数据预处理:本专利技术的财务数据来自万德数据库,对财务数据进行主成分分析处理;
[0029](2)文本数据预处理:本专利技术的文本数据来自大族激光,文本主要是对买方的赊账、还款、历史违约情况的记录,依次对文本进行噪声去除、停用词去除以及文本的词向量化处理;
[0030](3)生成少数类别数据:采用生成对抗网络分别训练、生成财务数据和文本评论数据;
[0031](4)企业信用评估模型:建立基于Stacking算法企业信用评估方法模型,并训练模型,对未知企业的信用进行评估。
[0032](5)模型训练:对网络模型进行训练;
[0033](6)结果预测:在测试集上对模型效果进行测试。
[0034]步骤(1)中财务数据的主成分分析处理采用SPSS软件的主成分分析功能,将19个财务指标转化成10个主成分指标。19个指标具体划分为五类:偿债能力、经营能力、盈利能力、发展能力、风险水平;偿债能力包括的指标有:流动比率、速动比率、现金比率、资产负债率、产权比率;经营能力包括的指标有:应收账款周转率、存货周转率、总资产周转率;盈利能力包括的指标有:总资产净利率、净资产收益率、营业净利率、投资收益率;发展能力包括的指标有:固定资产增长率、总资产增长率、净资产收益增长率、净利润增长率、营业收入增长率;风险水平包括的指标有:财务杠杆、经营杠杆率;
[0035]步骤(2)中噪声去除采用python的内置模块re正则化对评论文本进行去噪处理,并且采用Word2vec进行词向量转化。
[0036]步骤(3)中生成少数类别数据采用TensorFlow框架分别搭建生成财务数据和文本数据的神经网络模型,如图1、图2所示,图1的训练数据是步骤(1)得到的主成分数据,图2的训练数据是步骤(2)得到的文本数据,训练网络,最终用训练好的网络生成数据。经步骤(3)的处理可以解决数据不平衡问题,因为在实际中信用好的数据总是远远多于信用不好的,用这些数据训练模型会导致模型预测结果总是偏向于好的种类,是无意义的,生成少数类数据扩充数据集,使模型更好地学习不同种类数据特征,做有效地预测;
[0037]如图1所示,步骤(3)中生成财务数据的神经网络模型包括:生成器与鉴别器;其生成器中包括输入的随机噪声、全连接层、Dropout层、全连接层、输出层,其鉴别器中包括输入层、全连接层、Dropout层、输出层;随机噪声作为生成器的输入,生成器的输出与真实数据作为鉴别器的输入,生成器的输出为0,1标签,其中0表示生成数据与真实数据不同,1表示生成数据与真实数据相同。
[0038]如图2所示,步骤(3)中生成文本数据的神经网络模型包括:生成器与鉴别器;其生成器中包括输入的随机噪声与Self

Attention层;其鉴别器中包括输入层、Bilstm层和输出层层;随机噪声作为生成器的输入,生成器的输出与真实数据作为鉴别器的输入,输出为0,1标签,其中0表示生成数据与真实数据不同,1表示生成数据与真实数据相同;
[0039]训练时将随机噪声和真实数据输入模型中,采用Adam算法进行训练,当误差当模型产生的损失值满足设定要求或者最大迭代次数时,终止模型训练;一般设定损失值本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.AI驱动的协作企业多维信用特征提取与评价方法,其特征在于,包括:S1、获取财务数据与文本数据;S2、对获取到的财务数据与文本数据进行预处理;S3、对预处理后的财务数据与文本数据进行数据不平衡处理;S4、建立基于Stacking算法企业信用评估方法模型;S5、采用步骤S3得到的数据对基于Stacking算法企业信用评估方法模型进行训练;S6、采用训练好的基于Stacking算法企业信用评估方法模型得到待评估企业信用等级。2.根据权利要求1所述的AI驱动的协作企业多维信用特征提取与评价方法,其特征在于,所述财务数据包括19个指标:流动比率、速动比率、现金比率、资产负债率、产权比率、应收账款周转率、存货周转率、总资产周转率、总资产净利率、净资产收益率、营业净利率、投资收益率、固定资产增长率、总资产增长率、净资产收益增长率、净利润增长率、营业收入增长率、财务杠杆、经营杠杆率。3.根据权利要求2所述的AI驱动的协作企业多维信用特征提取与评价方法,其特征在于,步骤S1所述的文本数据具体为企业的赊账、还款、历史违约情况的文本记录。4.根据权利要求2所述的AI驱动的协作企业多维信用特征提取与评价方法,其特征在于,步骤S2所述对步骤S1获取到的财务数据进行预处理,具体为采用主成分分析将19个财务指标转化成10个主成分指标。5.根据权利要求1

4任一所述的AI驱动的协作企业多维信用特征提取与评价方法,其特征在于,步骤S4所述基于Stacking算...

【专利技术属性】
技术研发人员:廖伟智黄鹏伟
申请(专利权)人:电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1