System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及费用分摊,尤其是涉及一种基于大模型的生产经营费用分摊系统。
技术介绍
1、目前,建立构建业财融合的财务报告分析体系,建立纵贯企业全部经营管理链条,覆盖企业各个产品、市场、项目的多维度指标体系已成为各企业的必要要求。现有企业已下发业财融合分产品评价分析体系文件,文件中对建立以产品线为链条,穿透收入、成本、投资到现金流的管理闭环提出了明确要求,并将此项工作纳入效能提升考核方案中。文件要求专业公司根据业务与通信主业主营业务相关性分类施策,在单位范围内试点开展分产品评价分析体系工作。
2、将企业的经营成本、投资以及研发投入与产品对应,形成闭环管理对于企业的可持续发展至关重要,但实际操作中,无论业财融合、成本分摊至产品还是动因关联,都存在难点需逐一解决:
3、一、在使用传统收支统计方法同时支撑开发运营多个产品时,各个产品之间的支出成本往往难以准确地分摊。这可能导致资源分配不均匀,某些产品可能会承担不合理的成本,而另一些产品可能会得到不应有的资源投入。
4、二、目前企业的大多经营成本都通过间接分摊至产品,没有真正建立资源的投入产出关系,尤其大型国企,历史情况复杂,且财务模型架构和业务架构长久未变,业务与财务部门又往往使用不同的数据和指标来衡量业绩和成本,导致难以计算真实业绩,故急需找到最优演进路径以适应业务发展。
5、三、闭环管理中收入报账、申请支出、费用报销等环节需建立关联,但传统方式必须依赖人工操作关联支出和收入。耗时耗力不说,还增加了额外投入,难以长久维系和运营,无法管理动
技术实现思路
1、本专利技术的目的就是为了提供一种实现生产经营费用智能分摊的基于大模型的生产经营费用分摊系统。
2、本专利技术的目的可以通过以下技术方案来实现:
3、一种基于大模型的生产经营费用分摊系统,包括:
4、规则算法自维模块:用于监控事件变动,对于已产生的生产经营的收支数据,分别采用决策树和第一星辰大模型进行动态维护打标规则和动态打标;
5、实时收支归集模块:用于获取实时收支数据,并根据动态打标结果,分别采用距离计算方法和文本处理大模型进行处理并相互验证,以判断所述实时收支数据的归属产品种类,实现实时收支数据的费用分摊。
6、进一步地,所述决策树的构建过程表示为打标规则的生成过程,所述决策树的构建过程包括:
7、1)对已产生的收支数据进行特征归一化;
8、2)基于特征归一化结果,结合现有业务规则,对各个特征数据赋予不同的权重因子;
9、3)将特征归一化结果作为整个数据集,计算整个数据集的熵;
10、4)基于所述权重因子和熵,计算各个特征数据的信息增益,并选取信息增益最大的特征数据作为当前节点的分割特征;
11、5)基于剩余数据集,重复步骤4)-5),直至构建到叶节点,得到构建好的决策树。
12、进一步地,所述归一化的表达式为:
13、
14、式中,x为原始数据,min(x)为数据集中最小的数值,用于将数据的下界调整为0,max(x)为数据集中最大的数值,用于将数据的上界调整为1,x′为归一化后的数据。
15、进一步地,所述信息增益的计算表达式为:
16、
17、式中,p1表示数据集中第一个类别的样本数量,p2:表示数据集中第二个类别的样本数量,p1+p2表示数据集的总样本数量,表示第一个类别在整个数据集中的比例,表示第二个类别在整个数据集中的比例,entropy(d)表示整个数据集d的熵,数据集中不确定性的程度,gain(d,a)表示在数据集d中,特征a的信息增益,∣dv∣表示在数据集d中,特征a的取值为v的子集dv的样本数量,∣d∣表示数据集d的总样本数量,entropy(dv):表示特征a的取值为v时,对应子集dv的熵,values(a)表示特征a取值的集合,wa表示特征a的权重因子,用于调整特征的优先级。
18、进一步地,所述第一星辰大模型的训练步骤包括:
19、获取历史生产经营费用相关数据,包括规则和法规类数据、历史财务数据;
20、调取第一星辰大模型,并采用所述历史生产经营费用相关数据进行调优,实现模型本地化,得到训练好的第一星辰大模型。
21、进一步地,所述采用距离计算方法进行处理的步骤包括:
22、基于所述实时收支数据,采用ocr模式识别其中的非结构化数据,获得其中的关键结构化数据,并与实时收支数据中的结构化数据共同对各个产品的历史收支数据的均值向量进行余弦距离计算,根据余弦距离计算结果判断所述实时收支数据的归属产品种类,其中余弦距离计算表达式为:
23、
24、式中,a表示实时收支数据对应的向量,b表示均值向量,向量a和b均有n个元素,分别表示为a=[a1,a2,...,ai,...an]和b=[b1,b2,...,bi,...bn],cos(θ)表示向量a和b之间夹角θ的余弦值;
25、基于所述实时收支数据,计算其与所有产品不同时间段的聚类中心的欧式距离,并根据欧式距离计算结果判断实时收支数据的归属产品种类,其中所述聚类中心通过对各个产品的历史收支数据进行k-means聚类处理得到的,所述欧式距离的计算表达式为:
26、
27、式中,d(x,y)表示向量x和向量y之间的欧式距离,x表示实时收支数据对应的向量,y表示聚类中心对应的向量,向量x和y均包含n个元素,分别表示为x=(x1,x2...,xi,...xn)和y=(y1,y2,...,yi,...yn);
28、判断所述余弦距离计算结果对应的判断结果和欧式距离计算结果对应的判断结果是否相同,若不相同,则所述实时收支数据通过人工判断其归属产品种类,实现实时收支数据的分摊,若相同,则所述余弦距离计算结果对应的判断结果或欧式距离计算结果对应的判断结果作为最终结果,实现实时收支数据的分摊。
29、进一步地,采用文本处理大模型进行处理的步骤包括:
30、将所述实时收支数据进行预处理,生成特征向量,并采用预先训练好的文本处理大模型进行预测,输出所述实时收支数据的归属产品种类和动因结果;
31、所述文本处理大模型的训练步骤包括:
32、基于各个产品历史业务和财务的收支数据,采用ocr模式识别其中的非结构化数据,获得其中的关键结构化数据,并与其中的结构化数据共同向量化,形成特征向量,其中历史收支数据包含两种标签,分别为动因标签和产品标签;
33、搭建文本处理大模型,设置训练参数,其中所述文本处理大模型包括共享编码器、动因识别解码器、产品分类解码器;
34、对所述特征向量进行分词处理,对所述标签进行编码,并共同输出编码器中进行处理,再采用动因识别解码器、产品分类解码器分别识别动因标签和产品标签,通过不断训练,得到训练好的本文档来自技高网...
【技术保护点】
1.一种基于大模型的生产经营费用分摊系统,其特征在于,包括:
2.根据权利要求1所述的一种基于大模型的生产经营费用分摊系统,其特征在于,所述决策树的构建过程表示为打标规则的生成过程,所述决策树的构建过程包括:
3.根据权利要求2所述的一种基于大模型的生产经营费用分摊系统,其特征在于,所述归一化的表达式为:
4.根据权利要求2所述的一种基于大模型的生产经营费用分摊系统,其特征在于,所述信息增益的计算表达式为:
5.根据权利要求1所述的一种基于大模型的生产经营费用分摊系统,其特征在于,所述第一星辰大模型的训练步骤包括:
6.根据权利要求1所述的一种基于大模型的生产经营费用分摊系统,其特征在于,所述采用距离计算方法进行处理的步骤包括:
7.根据权利要求1所述的一种基于大模型的生产经营费用分摊系统,其特征在于,采用文本处理大模型进行处理的步骤包括:
8.根据权利要求1所述的一种基于大模型的生产经营费用分摊系统,其特征在于,还包括趋势预测和辅助决策模块(3),所述趋势预测和辅助决策模块(3)的执行步骤包括:
9.根据权利要求8所述的一种基于大模型的生产经营费用分摊系统,其特征在于,所述预处理步骤包括:
10.根据权利要求1所述的一种基于大模型的生产经营费用分摊系统,其特征在于,所述规则算法自维模块中,在决策树和第一星辰大模型的打标结果不一致时,则采用人工进行打标;所述实时收支归集模块中,在距离计算方法和文本处理大模型的处理结果不一致时,采用人工进行判断。
...【技术特征摘要】
1.一种基于大模型的生产经营费用分摊系统,其特征在于,包括:
2.根据权利要求1所述的一种基于大模型的生产经营费用分摊系统,其特征在于,所述决策树的构建过程表示为打标规则的生成过程,所述决策树的构建过程包括:
3.根据权利要求2所述的一种基于大模型的生产经营费用分摊系统,其特征在于,所述归一化的表达式为:
4.根据权利要求2所述的一种基于大模型的生产经营费用分摊系统,其特征在于,所述信息增益的计算表达式为:
5.根据权利要求1所述的一种基于大模型的生产经营费用分摊系统,其特征在于,所述第一星辰大模型的训练步骤包括:
6.根据权利要求1所述的一种基于大模型的生产经营费用分摊系统,其特征在于,所述采用距离计算方法进行处理的...
【专利技术属性】
技术研发人员:贾泉臻,周晓辉,崔隆,吴仲文,卢丹,高千惠,朱运坤,
申请(专利权)人:号百信息服务有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。