System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种自动获取企业经营交易特征数据建模方法技术_技高网

一种自动获取企业经营交易特征数据建模方法技术

技术编号:39970864 阅读:13 留言:0更新日期:2024-01-09 00:46
本发明专利技术公开了一种自动获取企业经营交易特征数据建模方法,确定企业财务数据的预测目标以及各目标的影响因素;选取样本企业,采集样本企业的历史财务数据,并预处理;将获得的所有影响因素作为原始特征,根据原始特征衍生新特征,提取原始特征数据集和衍生特征数据集;利用回归分析计算相关系数,并由原始特征数据集和衍生特征数据集生成样本集;构建卷积神经网络模型;对构建的卷积神经网络模型进行训练和测试,优化和确定卷积神经网络模型的参数。本发明专利技术通过模型预测企业财务数据,便于客观了解企业财务状态,能够更加准确的体现企业的基本情况,具有较高的针对性和实用性,同时降低了人力成本,提高了预测数据的获取效率。

【技术实现步骤摘要】

本专利技术涉及企业数据处理,特别涉及一种自动获取企业经营交易特征数据建模方法


技术介绍

1、企业的数据包括时间序列特征的数据和非时间序列特征的数据,其中,时间序列特征的数据主要是财务数据,非时间序列特征的数据主要是非财务数据,其中,财务数据是衡量一个公司偿债能力、发展能力、盈利能力、经营能力的重要指标,非财务数据包括注册资本、成立年限、教育背景、企业主从业年限等企业信息,能够在一定程度上反应一个公司的实力。

2、大数据背景下,互联网金融数据日益复杂化,通过使用在互联网上采集到的中小微企业基本信息、动态财务指标,构建全面客观的线上数据采集系统,使用深度学习方法,能够有效处理具有时间序列特征的复杂金融数据和具有非时序特征的企业信息。卷积神经网络作为深度学习方法,能够对具有时间序列特点的财务数据与复杂的金融数据进行更深层准确地判断。近年来,卷积神经网络被引入到互联网、金融领域,评估个人信用、客户信用与企业信用风险。卷积神经网络不仅可以从数据中自动提取特征,同时其网络结构具有很强的学习能力。通过对网络结构的调整,卷积神经网络不仅可以对具有时间序列特征的数据进行深度学习,进行精准预测分析,还可以对企业信息等非财务数据进行分析。

3、针对现有技术中对于企业的数据处理的模型存在不精确的问题,并且还存在成本高、复杂、时效低等问题。故此,我们提出了一种自动获取企业经营交易特征数据建模方法。


技术实现思路

1、本专利技术的主要目的在于提供一种自动获取企业经营交易特征数据建模方法,可以有效解决
技术介绍
中的问题。

2、为实现上述目的,本专利技术采取的技术方案为:

3、一种自动获取企业经营交易特征数据建模方法,包括以下步骤:

4、s1、确定企业财务数据的预测目标以及各目标的影响因素;

5、s2、针对不同行业不同规模企业选取样本企业,采集样本企业的历史财务数据,并对数据预处理;

6、s3、将s1获得的所有影响因素作为原始特征,根据原始特征衍生新特征,提取原始特征数据集和衍生特征数据集;

7、s4、针对不同行业不同规模企业,对企业财务数据的预测目标向量与各特征,利用回归分析计算相关系数,根据相关系数阈值进行特征筛选,并由原始特征数据集和衍生特征数据集生成样本集;

8、s5、构建卷积神经网络模型;

9、s6、对构建的卷积神经网络模型进行训练和测试,优化和确定卷积神经网络模型的参数。

10、优选的,在所述s1中,所述企业财务数据的预测目标包括:营业收入,利润总额,净利润,所得税,总资产及销售量。

11、优选的,在所述s2中,所述采集的财务数据包括:企业的工商变更信息、违法涉诉信息、欠税欠薪信息、经营异常信息、税务申报信息、发票交易信息及企业舆情信息。

12、优选的,在所述s2中,所述预处理包括缺失值处理和标准化分组处理。

13、优选的,所述缺失值处理为对下载的数据集进行缺失值填充,即用该指标序列的全局平均值填充当前缺失值,获得一个完整数据集。

14、优选的,所述标准化分组处理为将采集的财务数据设置企业所属行业和规模的标签,相同标签的数据分为一组。

15、优选的,在所述s6中,所述对构建的卷积神经网络模型进行训练和测试的方法为将s4生成的样本集进行随机划分,分为训练集和测试集,以训练集数据为输入,对卷积神经网络模型进行迭代训练,然后以测试集对模型进行测试,并根据测试结果进行参数调整。

16、优选的,在所述s6中,对卷积神经网络模型进行优化具体采用:目标损失函数为“binary-crossentropy”,优化器为adam,衡量模型好坏的标准是精度accuracy,之后在训练模型过程中,validation-split取值0.2,每个epoch前随机打乱输入样本的顺序,每批训练的数据量大小为20,训练300次。

17、与现有技术相比,本专利技术具有如下有益效果:

18、1、本专利技术采集样本企业的历史财务数据,并对数据进行缺失值处理和标准化分组处理,然后根据原始特征衍生新特征,提取原始特征数据集和衍生特征数据集,并利用回归分析计算相关系数,根据相关系数阈值进行特征筛选,并由原始特征数据集和衍生特征数据集生成样本集,能够更加准确的体现企业的基本情况。

19、2、本专利技术利用构建卷积神经网络模型对不同行业不同规模的企业财务数据进行处理,通过模型预测企业财务数据,为后续财务管理和生成经营提供了客观数据,以便于企业管理者指导进一步的投资和生产管理,也为企业估值提供了一种比较可信的获取方式,便于用户客观了解企业财务状态,同时拓展了深度学习算法的应用范围,方法具有较高的针对性和实用性,在卷积神经网络的具体应用中具有较高的创新性。

20、3、本专利技术构建的模型也降低了人力成本,并提高了预测数据的获取效率。

本文档来自技高网...

【技术保护点】

1.一种自动获取企业经营交易特征数据建模方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的一种自动获取企业经营交易特征数据建模方法,其特征在于:在所述S1中,所述企业财务数据的预测目标包括:营业收入,利润总额,净利润,所得税,总资产及销售量。

3.根据权利要求1所述的一种自动获取企业经营交易特征数据建模方法,其特征在于:在所述S2中,所述采集的财务数据包括:企业的工商变更信息、违法涉诉信息、欠税欠薪信息、经营异常信息、税务申报信息、发票交易信息及企业舆情信息。

4.根据权利要求1所述的一种自动获取企业经营交易特征数据建模方法,其特征在于:在所述S2中,所述预处理包括缺失值处理和标准化分组处理。

5.根据权利要求4所述的一种自动获取企业经营交易特征数据建模方法,其特征在于:所述缺失值处理为对下载的数据集进行缺失值填充,即用该指标序列的全局平均值填充当前缺失值,获得一个完整数据集。

6.根据权利要求4所述的一种自动获取企业经营交易特征数据建模方法,其特征在于:所述标准化分组处理为将采集的财务数据设置企业所属行业和规模的标签,相同标签的数据分为一组。

7.根据权利要求1所述的一种自动获取企业经营交易特征数据建模方法,其特征在于:在所述S6中,所述对构建的卷积神经网络模型进行训练和测试的方法为将S4生成的样本集进行随机划分,分为训练集和测试集,以训练集数据为输入,对卷积神经网络模型进行迭代训练,然后以测试集对模型进行测试,并根据测试结果进行参数调整。

8.根据权利要求1所述的一种自动获取企业经营交易特征数据建模方法,其特征在于:在所述S6中,对卷积神经网络模型进行优化具体采用:目标损失函数为“binary-crossentropy”,优化器为Adam,衡量模型好坏的标准是精度accuracy,之后在训练模型过程中,validation-split取值0.2,每个epoch前随机打乱输入样本的顺序,每批训练的数据量大小为20,训练300次。

...

【技术特征摘要】

1.一种自动获取企业经营交易特征数据建模方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的一种自动获取企业经营交易特征数据建模方法,其特征在于:在所述s1中,所述企业财务数据的预测目标包括:营业收入,利润总额,净利润,所得税,总资产及销售量。

3.根据权利要求1所述的一种自动获取企业经营交易特征数据建模方法,其特征在于:在所述s2中,所述采集的财务数据包括:企业的工商变更信息、违法涉诉信息、欠税欠薪信息、经营异常信息、税务申报信息、发票交易信息及企业舆情信息。

4.根据权利要求1所述的一种自动获取企业经营交易特征数据建模方法,其特征在于:在所述s2中,所述预处理包括缺失值处理和标准化分组处理。

5.根据权利要求4所述的一种自动获取企业经营交易特征数据建模方法,其特征在于:所述缺失值处理为对下载的数据集进行缺失值填充,即用该指标序列的全局平均值填充当前缺失值,获得一个完整数据集。

6.根据权利要求4...

【专利技术属性】
技术研发人员:曹洪基杨云港袁鹏孙明明张茜茜刘杰姚斌张跃陈柏林
申请(专利权)人:深圳市中壬银兴信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1