System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及单据数据处理,尤其涉及一种基于自编码器的单据智能评价方法及系统。
技术介绍
1、在经济全球化和数字化转型的风潮中,众多企业纷纷建立了自身的财务共享中心,即专门用于处理和分享财务信息的平台。财务共享中心每天都会收到海量并且种类繁多的单据,如何高效、精准、迅速地处理它们,对于资金配置、库存管理及供应链优化至关重要。然而,传统的手工处理方法既耗时又易错,已无法满足企业快速发展的要求。因此,很多企业开始寻求使用计算机代替人力进行单据处理的解决方案,而通过提取处理单据的评价向量信息进行单据处理过程优化就是该解决方案中至关重要的一步。
2、当前对提取处理单据的评价向量信息技术中,大多依赖人力编码或基于统计的特征提取技术。其中广泛应用的有主成分分析(principal component analysis,pca)和特征选择等方法,这些技术可以简单地处理样本数据,并且技术难度低,可以快速提取评价信息向量并且进行分析。尽管简单且易于上手,但面对数据量的爆炸式增长,上述方法已经无法应对海量的单据数据,且特征提取精度有限。
技术实现思路
1、本专利技术实施例提供了一种基于自编码器的单据智能评价方法及系统,用于解决如下技术问题:现有的单据智能评价方法中,单据评价向量信息的提取技术无法应对爆炸式增长的单据数据,且特征提取精度有限,不利于单据的智能评价。
2、本专利技术实施例采用下述技术方案:
3、一方面,本专利技术实施例提供了一种基于自编码器的单据智能评价
4、对自编码器进行结构优化,得到新型自编码器;
5、通过所述新型自编码器,对所述单据评价数据集进行特征提取,得到评价数据特征信息;
6、通过所述评价数据特征信息,训练分类模型;
7、通过所述新型自编码器以及训练好的分类模型,对目标单据评价数据进行分类识别,生成单据评价报告。
8、在一种可行的实施方式中,在财务共享中心系统中收集单据评价数据,并进行预处理,得到单据评价数据集,具体包括:
9、在财务共享中心系统中大规模提取各类单据的单据评价数据;其中,所述各类单据至少包括报销单据、销售订单以及采购订单;
10、通过one-hot编码方式,将提取出的单据评价数据转换为数值型数据;
11、通过z-score标准化方法,对所述数值型数据进行标准化处理;
12、采用离差标准化方法,对经过标准化处理后的数值型数据进行归一化处理;
13、对归一化处理后的数据进行扩充,并转换为二维数据,得到所述单据评价数据集。
14、在一种可行的实施方式中,对自编码器进行结构优化,得到新型自编码器,具体包括:
15、设置自编码器的输入向量为x∈rl;
16、在所述自编码器的每一个隐藏层中添加预设编码函数hi=σ(ωihi-1+bi),进行结构优化,以将自编码器每一个隐藏层学习到的输入向量进行编码并映射为xi∈rl;其中,i=(1,2,……,n),n为隐藏层的个数,σ为激活函数,ω为隐藏层卷积核的参数,b为卷积核的偏置,hi则为经过第i个隐藏层后输入向量的编码表示,l为输入向量的维度,rl为原始数据样本集;
17、通过结构优化后的所述自编码器输出所述原始数据样本集的特征重构误差;
18、基于所述特征重构误差,对所述自编码器进行误差调整,得到所述新型自编码器。
19、在一种可行的实施方式中,通过结构优化后的所述自编码器输出所述原始数据样本集的特征重构误差,具体包括:
20、将所述原始数据样本集输入结构优化后的所述自编码器中,输出对应的特征重构结果集;
21、根据获取结构优化后的自编码器的特征重构误差其中,m为训练样本的个数,xi为第i个原始数据样本,yi为第i个原始数据样本xi的特征重构结果。
22、在一种可行的实施方式中,基于所述特征重构误差,对所述自编码器进行误差调整,得到所述新型自编码器,具体包括:
23、将所述特征重构误差反向传播到所述自编码器的输入层,同时更新每一个隐藏层的权重和偏置;
24、误差调整之后,重新计算自编码器的特征重构误差,直至所述特征重构误差小于预设阈值,保存此时的自编码器,得到所述新型自编码器。
25、在一种可行的实施方式中,通过所述评价数据特征信息,训练分类模型,具体包括:
26、通过支持向量机svm算法,构建分类模型;所述分类模型中包含多个分类器,用于分别识别不同种类的单据评价数据;
27、将所述评价数据特征信息作为所述分类模型的输入,并选择径向基函数作为svm算法的核函数,训练所述分类模型;
28、在所述新型自编码器的输出层之后连接所述分类模型。
29、在一种可行的实施方式中,在通过所述评价数据特征信息,训练分类模型之后,所述方法还包括:
30、通过t-sne降维技术将测试集中的评价数据向量进行降维,并进行可视化处理;
31、将处理后的所述测试集应用于训练后的分类模型上,并计算输出值与实际值之间的余弦距离,以评估分类模型的分类性能;
32、若所述分类性能未达到预设要求,则对所述分类模型进行进一步调优。
33、在一种可行的实施方式中,通过所述新型自编码器以及训练好的分类模型,对目标单据评价数据进行分类识别,生成单据评价报告,具体包括:
34、将所述目标单据评价数据输入所述新型自编码器中进行特征提取,得到对应的目标特征重构结果;
35、将所述新型自编码器的输出层输出的所述目标特征重构结果,直接输入所述分类模型中,进行分类识别,得到分类结果;
36、根据所述分类结果,生成所述单据评价报告。
37、在一种可行的实施方式中,根据所述分类结果,生成所述单据评价报告,具体包括:
38、在所述分类结果中提取所述目标单据评价数据的单据类型、评价类型以及问题类型,并填入预设评价报告模板中,生成所述单据评价报告。
39、另一方面,本专利技术实施例还提供了一种基于自编码器的单据智能评价系统,所述系统包括:
40、数据准备模块,用于在财务共享中心系统中收集单据评价数据,并进行预处理,得到单据评价数据集;
41、特征提取模块,用于对自编码器进行结构优化,得到新型自编码器;通过所述新型自编码器,对所述单据评价数据集进行特征提取,得到评价数据特征信息;
42、单据智能评价模块,用于通过所述评价数据特征信息,训练分类模型;通过所述新型自编码器以及训练好的分类模型,对目标单据评价数据进行分类识别,生成单据评价报告。
43、与现有技术相比,本专利技术实施例提供的一种基于自编码器的单据智能评价方法及系统,具有如下有益效果:
44本文档来自技高网...
【技术保护点】
1.一种基于自编码器的单据智能评价方法,其特征在于,所述方法包括:
2.根据权利要求1所述的一种基于自编码器的单据智能评价方法,其特征在于,在财务共享中心系统中收集单据评价数据,并进行预处理,得到单据评价数据集,具体包括:
3.根据权利要求1所述的一种基于自编码器的单据智能评价方法,其特征在于,对自编码器进行结构优化,得到新型自编码器,具体包括:
4.根据权利要求3所述的一种基于自编码器的单据智能评价方法,其特征在于,通过结构优化后的所述自编码器输出所述原始数据样本集的特征重构误差,具体包括:
5.根据权利要求3所述的一种基于自编码器的单据智能评价方法,其特征在于,基于所述特征重构误差,对所述自编码器进行误差调整,得到所述新型自编码器,具体包括:
6.根据权利要求1所述的一种基于自编码器的单据智能评价方法,其特征在于,通过所述评价数据特征信息,训练分类模型,具体包括:
7.根据权利要求1所述的一种基于自编码器的单据智能评价方法,其特征在于,在通过所述评价数据特征信息,训练分类模型之后,所述方法还包括:
...【技术特征摘要】
1.一种基于自编码器的单据智能评价方法,其特征在于,所述方法包括:
2.根据权利要求1所述的一种基于自编码器的单据智能评价方法,其特征在于,在财务共享中心系统中收集单据评价数据,并进行预处理,得到单据评价数据集,具体包括:
3.根据权利要求1所述的一种基于自编码器的单据智能评价方法,其特征在于,对自编码器进行结构优化,得到新型自编码器,具体包括:
4.根据权利要求3所述的一种基于自编码器的单据智能评价方法,其特征在于,通过结构优化后的所述自编码器输出所述原始数据样本集的特征重构误差,具体包括:
5.根据权利要求3所述的一种基于自编码器的单据智能评价方法,其特征在于,基于所述特征重构误差,对所述自编码器进行误差调整,得到所述新型自编码器,具体...
【专利技术属性】
技术研发人员:张成竹,王金丽,任聪,马士中,徐同明,杨斌,赵玉海,李绍轩,
申请(专利权)人:浪潮通用软件有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。