System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于人工智能的电子票据数据管理系统及方法技术方案_技高网

一种基于人工智能的电子票据数据管理系统及方法技术方案

技术编号:43860633 阅读:7 留言:0更新日期:2024-12-31 18:49
本发明专利技术公开了一种基于人工智能的电子票据数据管理系统及方法,属于人工智能技术领域。本发明专利技术收集电子票据中的票据数据,利用特征提取算法,从票据数据中提取特征,对于交易物品明细中的物品名称通过预定义的物品分类模型进行分类,并与商品数据库中的标准编码进行匹配;检查票据数据是否有修改痕迹,进行历史数据的比对,检测一致性,当发现异常时,退回电子票据并标记相应的收款用户;当票据数据无异常和不一致时,分析电子票据中的金额是否超出常规交易范围,生成票据数据的风险评级;对收款用户进行风险评级,分析收款用户在一段时期范围内同种类型的价格区间;加权整合生成电子票据综合风险评级,将电子票据数据传递进入报销平台。

【技术实现步骤摘要】

本专利技术涉及人工智能,具体是一种基于人工智能的电子票据数据管理系统及方法


技术介绍

1、随着信息化的发展和电子票据的普及,越来越多的预算单位和企业开始使用电子票据进行财务管理、报销和交易结算。电子票据相较于传统纸质票据具有无纸化、环保、便捷等优势。然而,随着电子票据的应用逐渐广泛,电子票据管理系统的安全性、数据一致性以及审核效率等问题也日益显现。尤其是随着电子交易量的增加,如何高效、准确地管理大量电子票据数据,防止票据数据篡改和欺诈行为,成为一个亟待解决的问题。

2、现有的电子票据管理系统中,人工核对仍然占据重要地位。由于票据数据量庞大,手动审核容易出现漏查、误查等情况,导致审核效率低,存在较高的人为错误风险。传统的票据异常检测依赖于规则制定或简单的阈值设定,无法动态适应复杂的交易模式,特别是对于不同收款用户和交易类型的细微差别,难以实现智能化、精准化的风险识别。对电子票据的风险评估主要依赖人工经验,缺乏基于历史数据的智能化风险评估模型,无法有效识别潜在风险。此外,对收款用户的交易行为也缺乏深入分析,导致在面对高风险交易时无法及时应对。


技术实现思路

1、本专利技术的目的在于提供一种基于人工智能的电子票据数据管理系统及方法,以解决现有技术中提出的问题。

2、为实现上述目的,本专利技术提供如下技术方案:

3、一种基于人工智能的电子票据数据管理方法,所述方法包括以下步骤:

4、s100、通过与收款用户或财务系统的对接,收集电子票据中的票据数据,利用特征提取算法,从票据数据中提取票据代码、金额、开票日期、交款用户、收款用户和交易物品明细;对于交易物品明细中的物品名称通过预定义的物品分类模型进行分类,并与商品数据库中的标准编码进行匹配;

5、s200、通过数字签名和sha-256哈希算法,检查票据数据是否有修改痕迹,进行历史数据的比对,检测票据数据是否与之前的数据记录一致,当发现异常时,退回电子票据并标记相应的收款用户;

6、s300、当票据数据无异常和不一致的地方时,利用k-means聚类算法和孤独森林算法,检测电子票据中相同收款用户和同种类型物品的历史电子票据数据,分析电子票据中的金额是否超出常规交易范围,生成票据数据的风险评级;对收款用户进行风险评级,分析收款用户在一段时期范围内同种类型的价格区间,价格区间越大,收款用户的风险评级越高;

7、s400、加权整合票据数据的风险评级和收款用户的风险评级,生成电子票据综合风险评级,对不同风险评级的票据采取相应的措施;通过加密算法将电子票据数据传递进入报销平台,根据交款用户的需求配置跨单位审批流程,并指定各交款用户的审批权限。

8、根据步骤s100,根据不同输入源对票据数据进行格式转换,将所有票据数据采用json格式,清理不完整、重复或无效的票据数据;

9、票据代码是电子票据的唯一标识,通过正则表达式定位并提取票据中的代码字段;如果电子票据文件结构标准化,则根据票据代码所在的预定义位置自动识别票据代码;

10、利用自然语言处理,分析票据文本中的上下文,以定位与金额相关的字段;提取的金额字段将通过格式验证,确保提取结果符合票据金额的格式要求;对于涉及不同货币的电子票据,提取金额时同时识别币种符号,标记该票据所使用的币种;

11、开票日期是票据生成的时间信息,使用正则表达式匹配日期格式,从票据中自动提取开票日期;根据电子票据的标准结构,预先定位开票日期所在的区域进行提取;通过关键词匹配,定位交款用户和收款用户所在的字段;

12、识别票据中包含的表格结构,将每一行中的物品名称和数量解析并提取;对于未采用表格结构的票据,通过自然语言处理,从票据文本中提取物品的物品名称和数量;提取出的物品名称通过预定义的物品分类模型进行分类,并与商品数据库中的标准编码进行匹配。

13、根据步骤s100,为构建物品分类模型,需要从电子票据历史数据、商品数据库和供应商目录中收集历史交易数据和商品数据;依据相关行业标准或自定义的单位需求,预先定义一套分类标准,将所有物品根据其特性和用途分为不同的类别,分类标准的制定包括以下因素:物品的物理属性、物品的功能用途、行业规定和供应商分类习惯;

14、基于收集到的历史交易数据和商品数据,使用决策树算法对物品分类模型进行训练,训练的目标是通过学习标注的历史数据,自动识别新物品的分类属性;从物品名称中提取关键特征,使用决策树算法,训练模型以自动识别不同物品的类别,通过交叉验证和历史分类结果的反馈,逐步优化分类模型,提升分类准确率;管理员根据新出现的物品或业务需求,对分类规则进行手动修正;

15、训练时,将收集到的历史交易数据按照一定比例划分为训练集和验证集,例如,80%的数据用于训练,20%的数据用于模型验证和测试。在训练过程中,使用物品的特征向量作为输入,物品的类别作为输出标签。决策树会根据物品特征,如名称中的关键词、规格、品牌等,逐步划分数据集,并在每一个分支点选择能够最大化区分不同物品类别的特征。每个节点在分裂时,决策树会评估不同特征的划分效果,选择最能有效区分数据的特征进行分裂。这样,物品的特征逐步被用于划分,直到每个终端节点对应一个特定的物品类别。

16、决策树从根节点开始,通过递归方式对数据进行分裂,直到达到终止条件。终止条件包括:所有样本被正确分类;达到设定的树深度限制或叶节点包含的最小样本数量。

17、为了防止决策树模型过拟合,使用交叉验证技术。通过将训练集划分为多个子集,循环使用不同的子集作为验证集,确保模型在不同的数据分布下都能保持较好的分类准确率。通过剪枝技术,减少决策树的复杂度。根据验证集的分类错误率,对树的分支进行修剪,去除不必要的分支,以提升模型的泛化能力和鲁棒性。系统根据模型对新物品的分类结果与实际分类情况进行对比。如果分类结果与实际不符,将错误信息反馈到模型中,以进一步优化分类算法。经过训练和验证后,决策树分类模型被应用于实际电子票据的物品分类任务中。系统在对新物品进行分类时,会基于训练好的决策树模型进行自动分类。

18、当提取出电子票据中的物品名称后,预定义的物品分类模型自动启动,按以下步骤进行分类:通过分析物品名称中的关键词,与分类模型中的标准化物品名称进行匹配;根据分类标准,进一步细化分类;利用自然语言处理,对物品名称的上下文进行语义分析,如果物品名称的语义存在若干种可能分类,系统会生成若干个候选类别,并根据上下文和历史分类结果确定最合适的类别;将物品名称与分类结果进行比对,确保分类结果与商品数据库中的标准分类一致;根据分类结果,查询商品数据库中的标准编码;每个商品分类对应一个商品编码;匹配成功后,将该物品的标准编码附加到票据数据中,完成物品分类。

19、根据步骤s200,当电子票据首次生成时,对电子票据的票据数据进行数字签名,生成一组唯一的签名信息,所述签名信息与票据数据一起存储;通过sha-256哈希算法,本文档来自技高网...

【技术保护点】

1.一种基于人工智能的电子票据数据管理方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的一种基于人工智能的电子票据数据管理方法,其特征在于:根据步骤S100,根据不同输入源对票据数据进行格式转换,将所有票据数据采用JSON格式,清理不完整、重复或无效的票据数据;

3.根据权利要求1所述的一种基于人工智能的电子票据数据管理方法,其特征在于:根据步骤S100,构建物品分类模型时,从电子票据历史数据、商品数据库和供应商目录中收集历史交易数据和商品数据;依据相关行业标准或自定义的单位需求,预先定义一套分类标准,将所有物品根据其特性和用途分为不同的类别,分类标准的制定包括以下因素:物品的物理属性、物品的功能用途、行业规定和供应商分类习惯;

4.根据权利要求1所述的一种基于人工智能的电子票据数据管理方法,其特征在于:根据步骤S200,当电子票据首次生成时,对电子票据的票据数据进行数字签名,生成一组唯一的签名信息,所述签名信息与票据数据一起存储;通过SHA-256哈希算法,对电子票据的票据数据计算一个哈希值,所述哈希值将作为票据的唯一标识,存储在数据库中;

5.根据权利要求4所述的一种基于人工智能的电子票据数据管理方法,其特征在于:根据步骤S200,为了检测票据数据是否与之前的数据记录一致,进行历史数据的比对;检查同一票据代码的若干次提交版本之间是否存在数据不一致的情况;通过历史记录,比对交款用户和收款用户的历史信息,确保在不同票据中一致;检查票据中的交易物品明细是否与商品数据库中的标准编码一致;如果物品名称与标准编码代表的物品名称不匹配,将认为票据存在异常;根据历史交易记录,检查当前票据的金额是否存在异常波动;

6.根据权利要求1所述的一种基于人工智能的电子票据数据管理方法,其特征在于:根据步骤S300,收集与当前电子票据相关的历史交易数据,包括:收款用户、交易物品类型和交易时间,进行数据清理和标准化处理;

7.根据权利要求6所述的一种基于人工智能的电子票据数据管理方法,其特征在于:根据步骤S300,使用孤立森林进行异常检测,通过构建树结构,将数据空间划分成不同的区域,检测出数据中“孤立”的点;孤立的交易记录代表异常交易金额;构建若干棵随机树,每棵树通过随机选择金额数据的某个维度进行分割,检查当前交易金额在树中的“孤立”程度;如果该交易的孤立程度超过设定的阈值,说明是异常点。

8.根据权利要求7所述的一种基于人工智能的电子票据数据管理方法,其特征在于:根据步骤S300,收集收款用户的交易历史数据、交易物品类型和交易金额;计算收款用户在一段时间段内同种类型物品的价格区间,反映了价格的波动幅度;价格区间的计算步骤如下:

9.根据权利要求1所述的一种基于人工智能的电子票据数据管理方法,其特征在于:根据步骤S400,加权整合票据数据的风险评级和收款用户的风险评级,权重分别占一半,生成了每张电子票据的综合风险评级;根据综合风险评级的高低,将电子票据的种类进行划分,并为每一类设计了相应的处理流程:针对低风险票据,自动通过审核,无需人工干预;针对中风险票据,被自动标记,并进入人工审核流程;通知相关人员对中风险票据进行进一步的检查和确认;人工审核通过后,票据进入报销流程;如果存在问题,则进一步标记为需要处理的票据;针对高风险票据,标记为需要进一步调查,并冻结交易;冻结交易代表该电子票据无法进入报销流程,直到人工确认其安全性和合法性;

10.一种基于人工智能的电子票据数据管理系统,使用权利要求1-9中任一项所述的一种基于人工智能的电子票据数据管理方法,其特征在于,包括:

...

【技术特征摘要】

1.一种基于人工智能的电子票据数据管理方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的一种基于人工智能的电子票据数据管理方法,其特征在于:根据步骤s100,根据不同输入源对票据数据进行格式转换,将所有票据数据采用json格式,清理不完整、重复或无效的票据数据;

3.根据权利要求1所述的一种基于人工智能的电子票据数据管理方法,其特征在于:根据步骤s100,构建物品分类模型时,从电子票据历史数据、商品数据库和供应商目录中收集历史交易数据和商品数据;依据相关行业标准或自定义的单位需求,预先定义一套分类标准,将所有物品根据其特性和用途分为不同的类别,分类标准的制定包括以下因素:物品的物理属性、物品的功能用途、行业规定和供应商分类习惯;

4.根据权利要求1所述的一种基于人工智能的电子票据数据管理方法,其特征在于:根据步骤s200,当电子票据首次生成时,对电子票据的票据数据进行数字签名,生成一组唯一的签名信息,所述签名信息与票据数据一起存储;通过sha-256哈希算法,对电子票据的票据数据计算一个哈希值,所述哈希值将作为票据的唯一标识,存储在数据库中;

5.根据权利要求4所述的一种基于人工智能的电子票据数据管理方法,其特征在于:根据步骤s200,为了检测票据数据是否与之前的数据记录一致,进行历史数据的比对;检查同一票据代码的若干次提交版本之间是否存在数据不一致的情况;通过历史记录,比对交款用户和收款用户的历史信息,确保在不同票据中一致;检查票据中的交易物品明细是否与商品数据库中的标准编码一致;如果物品名称与标准编码代表的物品名称不匹配,将认为票据存在异常;根据历史交易记录,检查当前票据的金额是否存在异常波动;

6.根据权利要求1所述的一种基于人工智能的电子票据数据管理方...

【专利技术属性】
技术研发人员:张向飞陈贝琪沈天杰石蓓杨晨辉朱策
申请(专利权)人:上海市大数据中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1