System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于智能关联图谱的电子凭证数据应用方法及系统技术方案_技高网

一种基于智能关联图谱的电子凭证数据应用方法及系统技术方案

技术编号:41813092 阅读:10 留言:0更新日期:2024-06-24 20:30
本发明专利技术涉及数据处理技术领域,提出一种基于智能关联图谱的电子凭证数据应用方法及系统;包括获取电子凭证数据,并将电子凭证数据录入在财务系统中;提取所述电子凭证数据并形成图谱节点;将所述图谱节点输入预设的关联图谱中形成重构的关联图谱;计算图谱节点和原始图谱节点之间的关联值;若其关联值大于预设值,则所述电子凭证数据可以录入在原始图谱节点对应的报表中,通过智能关联图谱可以帮助系统自动化处理数据,提高数据处理效率,减少人工干预,从而优化业务流程和提升工作效率,同时将电子凭证数据转化成图谱节点的形式,方便用户直观地查看各实体之间的关系和依赖,有利于数据的理解和分析,更容易发现数据之间的联系。

【技术实现步骤摘要】

本专利技术涉及数据处理,特别涉及一种基于智能关联图谱的电子凭证数据应用方法及系统


技术介绍

1、电子会计凭证包括电子发票、铁路电子客票、航空运输电子行程单、电子非税缴款文书等凭证,电子银行回单和电子银行对账单等银行出具的单据,各企业员工可以使用电子凭证在财务系统进行报销、入账、对账等相关事项;目前,员工在使用电子凭证处理相关事项时,通常需要手动下载电子凭证,再由员工将电子凭证中的信息填写为表格、单据等财务文件,再将财务文件和电子凭证共同上传至企业财务系统。例如,从银行、第三方机构或提供电子凭证的官方平台等下载电子凭证,再填写报表、报销单等财务文件后,将财务文件与电子凭证上传至自家公司的财务系统,在现有技术中,需要员工自行进行填写上传,同时在编辑不同财务文件时,财务人员仍需要将数据进行整合调整,导致人工效率低下;

2、公开号为:cn110503537a的中国专利公开了一种财务记账数据智能匹配方法及系统,用于对原始信息内容的训练和预测匹配,包括词语特征提取模块、发票特征提取模块、科目特征提取模块、注意力网络模块和全连接网络层模块,所述原始信息内容将信息传送到词语特征提取模块中,所述原始信息内容包括原始票据信息和公司科目信息;使用财务系统中所获取的原始发票凭证与科目信息,并利用深度神经网络进行训练学习来实现智能匹配,所述词语特征提取模块与发票特征提取模块数据连接,所述词语特征提取模块与科目特征提取模块数据连接;仅仅采用语义进行匹配难以保证其匹配准确度。为此,本专利技术提出一种基于智能关联图谱的电子凭证数据应用方法及系统。


技术实现思路

1、本专利技术针对现有技术中存在的技术问题,提供一种基于智能关联图谱的电子凭证数据应用方法及系统。

2、本专利技术解决上述技术问题的技术方案如下:一种基于智能关联图谱的电子凭证数据应用方法包括以下步骤:

3、s1:获取电子凭证数据,并将电子凭证数据录入在财务系统中;

4、s2:提取所述电子凭证数据并形成图谱节点;

5、s3:将所述图谱节点输入预设的关联图谱中形成重构的关联图谱;

6、s4:计算图谱节点和原始图谱节点之间的关联值;

7、s5:若其关联值大于预设值,则所述电子凭证数据录入在原始图谱节点对应的报表中。

8、进一步的,所述的一种基于智能关联图谱的电子凭证数据应用方法,所述获取电子凭证数据包括通过ocr识别对纸质票据进行数据采集,并生成对应的电子凭证数据。

9、进一步的,所述的一种基于智能关联图谱的电子凭证数据应用方法,对所述电子凭证数据进行提取包括:

10、获取所述电子凭证中的文本数据,将文本数据输入编码器中:

11、对于一个输入的文本数据s,编码器对文本数据中每一个单词的特征表示为;

12、;

13、;

14、其中是第n个单词的输入表示包括单词的词嵌入、位置嵌入和分段嵌入的相加和,表示第n个单词的隐藏状态;

15、用编码器分别学习单词中关于主实体和客实体的特征信息:

16、;

17、;

18、其中,和分别表示输入文本数据中的第n个关于主实体和客实体的特征表示,和分别表示主实体和客实体感知过程中的训练参数,和是主实体和客实体感知过程中的偏置项。

19、进一步的,所述的一种基于智能关联图谱的电子凭证数据应用方法,通过注意力机制对于不同单词进行分类:

20、对于第n个单词关于主实体的特征表示和第m个单词关于客实体的特征表示,计算单词对的分数向量:

21、;

22、其中,和分别表示可训练的参数,表示两个特征信息拼接,b是偏置项;在得到分数向量后,根据与定义的关系集合来预测类别:

23、;

24、k表示第k种关系,表示在第k种关系下的类别分布概率;

25、综合得到编码器中对于所述电子凭证数据的提取:

26、;

27、其中,n表示单词总数,k是关系总数,表示单词对在第k种关系下的类别,log是取对数操作。

28、进一步的,所述的一种基于智能关联图谱的电子凭证数据应用方法,其所述将所述图谱节点输入预设的关联图谱中形成重构的关联图谱步骤中,重构的关联图谱中图谱节点的单条属性信息包括:

29、;

30、其中,和分别是实体的属性和属性值,和是将和映射到统一向量空间的映射向量;通过聚合函数将所有属性值融合,得到实体的属性信息表示:

31、;

32、agg是聚合函数,表示实体所有属性值集合。

33、进一步的,所述的一种基于智能关联图谱的电子凭证数据应用方法,所述计算图谱节点和原始图谱节点之间的关联值步骤中包括:

34、将图谱节点采用三元组进行表示:,原始图谱节点设为::

35、;

36、其中,i是属性值关联值,p表示属性值集合,表示实体与共享的属性值,是实体和共享的属性值,是一个集合中元素的个数。

37、一种基于智能关联图谱的电子凭证数据应用系统,应用于上述的一种基于智能关联图谱的电子凭证数据应用方法,所述系统包括:

38、获取单元:获取电子凭证数据,并将电子凭证数据录入在财务系统中;

39、提取单元:提取所述电子凭证数据并形成图谱节点;

40、输入单元:将所述图谱节点输入预设的关联图谱中形成重构的关联图谱;

41、计算单元:计算图谱节点和原始图谱节点之间的关联值;

42、判断单元:若其关联值大于预设值,则所述电子凭证数据录入在原始图谱节点对应的报表中。

43、本专利技术的有益效果是:

44、自动化处理:通过提取算法和关联图谱技术,实现对电子凭证数据的自动化处理和管理,减少了人工干预和操作,提高了效率和准确性;

45、数据关系可视化:将电子凭证数据转化成图谱节点的形式,方便用户直观地查看各实体之间的关系和依赖,有利于数据的理解和分析,更容易发现数据之间的联系;

46、通过关联值匹配的方式,自动将电子凭证数据录入相关报表中,节省了人工录入和验证的时间,同时防止了数据录入错误和遗漏。

本文档来自技高网...

【技术保护点】

1.一种基于智能关联图谱的电子凭证数据应用方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于智能关联图谱的电子凭证数据应用方法,其特征在于,所述获取电子凭证数据包括通过OCR识别对纸质票据进行数据采集,并生成对应的电子凭证数据。

3.根据权利要求1所述的一种基于智能关联图谱的电子凭证数据应用方法,其特征在于,通过注意力机制对于不同单词进行分类:

4.根据权利要求1所述的一种基于智能关联图谱的电子凭证数据应用方法,其特征在于,所述将所述图谱节点输入预设的关联图谱中形成重构的关联图谱步骤中,重构的关联图谱中图谱节点的单条属性信息包括:

5.根据权利要求4所述的一种基于智能关联图谱的电子凭证数据应用方法,其特征在于,所述计算图谱节点和原始图谱节点之间的关联值步骤中包括:

6.一种基于智能关联图谱的电子凭证数据应用系统,其特征在于,应用于权利要求1-5任一项所述的一种基于智能关联图谱的电子凭证数据应用方法,所述系统包括:

【技术特征摘要】

1.一种基于智能关联图谱的电子凭证数据应用方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于智能关联图谱的电子凭证数据应用方法,其特征在于,所述获取电子凭证数据包括通过ocr识别对纸质票据进行数据采集,并生成对应的电子凭证数据。

3.根据权利要求1所述的一种基于智能关联图谱的电子凭证数据应用方法,其特征在于,通过注意力机制对于不同单词进行分类:

4.根据权利要求1所述的一种基于智能关联图谱的电子...

【专利技术属性】
技术研发人员:范玉平涂震魏强高岐陈瑞兴
申请(专利权)人:江西微博科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1