System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于图像识别,具体涉及基于图像识别的财务数据分析方法及系统。
技术介绍
1、在当今数字化快速发展的商业环境中,企业面临着日益增长的财务数据处理和管理挑战。传统的手工处理财务票据,如发票、收据和账单,不仅耗时费力,还容易出现数据输入错误,影响财务数据的准确性和实时性。因此,越来越多的企业开始关注并投入研究智能识别财务票据信息的技术应用。
2、智能识别技术以其高效、准确和自动化的特点,吸引了企业的广泛关注。通过使用ocr和机器学习算法,智能识别系统能够快速而精确地识别和提取财务票据中的关键信息,如金额、日期、供应商信息等。该技术不仅能大幅减少人工录入的时间和成本,还能有效降低人为错误的风险,提升数据处理的效率和质量。
3、目前,对于财务票据图像数据的提取一直以来都是ocr技术的难点,常规ocr技术对图像中的文字信息进行提取,并不能有效提取和识别表格的文字信息原来的格式,后续还需要利用人工来将文字信息填写到对应的位置,大大降低了工作效率。另外,现有通过常规ocr识别算法提取财务报表数据还经常会出现行列错位的情况。
4、针对现有技术的不足,亟需设计一种基于图像识别的财务数据分析方法及系统以解决上述技术问题。
技术实现思路
1、为解决上述现有技术的中的不足,本专利技术的目的在于克服现有不足,提供一种基于图像识别的财务数据分析方法,其特征在于,包括如下步骤:
2、采集企业财务票据图像数据信息,对所述图像数据信息进行纸张边缘检测,获取到规
3、获取所述源数据库存储的任一的第一处理图像,对所述第一处理图像进行图像识别,得到用于描述任一用户的企业财务票据数据,对所述企业财务票据数据进行识别阈值检测:
4、若所述企业财务票据数据的识别度不低于票据识别阈值,传输所述企业财务票据数据和对应的第一处理图像至第一识别数据库;
5、若所述企业财务票据数据的识别度低于票据识别阈值,传输对应的第一处理图像至第二识别数据库;
6、获取所述第一识别数据库的任一的企业财务票据数据,对所述企业财务票据数据进行用户数据库匹配,将匹配成功的所述企业财务票据数据新增录入所述用户数据库。
7、作为上述方案的进一步优化,对所述第一处理图像进行图像识别具体包括如下:
8、基于图像识别获取用于描述任一用户的企业财务票据图像;
9、对所述企业财务票据图像进行框选识别,将图像进行二值化处理;
10、获取存储于所述源数据库的企业财务票据模板,基于二值化图像,将所述企业财务票据模板与所述二值化图像对比:
11、若基于所述二值化图像与所述企业财务票据模板定位单元格范围内灰度差绝对值不大于检测阈值,标记所述单元格为不合格数据;
12、若基于所述二值化图像与所述企业财务票据模板定位单元格范围内灰度差绝对值大于检测阈值,标记所述单元格为合格数据;
13、获取所述二值化图像与所述企业财务票据模板的所有单元格范围内灰度差绝对值,若存在任一的灰度差绝对值不大于检测阈值,传输所述二值化图像对应第一处理图像至第二识别数据库;否则传输至第一识别数据库。
14、作为上述方案的进一步优化,对所述企业财务票据数据进行识别阈值检测还包括如下:
15、设置一识别阈值t=0.4a+0.2b+0.2c+0.2d;
16、检测所述企业财务票据数据的影响因子a、b、c和d,记任意存在的影响因子为1,否则为0,计算第一处理图像的识别值s,识别阈值t=0.6,则:
17、若s≥t,传输所述企业财务票据数据和对应的第一处理图像至第一识别数据库;
18、若s<t,传输对应的第一处理图像至第二识别数据库;
19、上式中,a为票据种类,b为买方名称,c为买方识别号,d为买方账户信息。
20、作为上述方案的进一步优化,对所述企业财务票据数据进行用户数据库匹配具体包括如下:
21、获取所述第一识别数据库的任一的企业财务票据数据,所述企业财务票据数据用于记录和描述所述企业财务票据信息;
22、遍历所述企业财务票据数据的所有影响因子,检索任一企业财务票据数据的影响因子b和c;
23、若检索到任一企业财务票据数据包含影响因子b,遍历所述用户数据库,匹配与影响因子b关联的所有用户已登记数据;基于遍历到的所有用户已登记数据,将任一企业财务票据数据的影响因子匹配录入;
24、若检索到任一企业财务票据数据包含影响因子c,遍历所述用户数据库,匹配与影响因子c关联的所有用户已登记数据;基于遍历到的所有用户已登记数据,将任一企业财务票据数据的影响因子匹配录入;
25、若检索到任一企业财务票据数据包含影响因子b和c,遍历所述用户数据库,匹配同时包含影响因子b和c的任一所有用户已登记数据;基于遍历到的所有用户已登记数据,将任一企业财务票据数据的影响因子匹配录入。
26、作为上述方案的进一步优化,对所述企业财务票据数据进行用户数据库匹配还包括如下:
27、设置任一的所述企业财务票据数据包括影响因子、联动因子和待选因子;
28、在遍历所述用户数据库匹配到与任一影响因子关联的所有用户已登记数据后,基于所述影响因子新增录入除当前影响因子外所有影响因子至待处理行;
29、基于图像识别获取任一的所述企业财务票据数据影响因子匹配成功所在行的对应联动因子,将基于图像识别的所述联动因子与所述用户数据库匹配:
30、若所述联动因子与所述用户数据库匹配值不小于匹配阈值,复制传输所述用户数据库对应的联动因子新增录入到用户数据库待处理行;
31、若所述联动因子与所述用户数据库匹配值小于匹配阈值,将所述基于图像识别的联动因子对应新增录入到用户数据库待处理行;
32、基于图像识别获取任一的所述企业财务票据数据的待选因子,将所述基于图像识别的待选因子对应新增录入到用户数据库待处理行。
33、作为上述方案的进一步优化,所述任一存在的影响因子还包括与其对应的影响因子属性。
34、作为上述方案的进一步优化,对所述企业财务票据数据遍历检索影响因子a:
35、若未遍历检索到所述企业财务票据数据存在影响因子a,传输所述企业财务票据数据对应第一处理图像至第二识别数据库;
36、若遍历检索到所述企业财务票据数据存在影响因子a,将所述影响因子a与所述源数据库存储的企业财务票据模板匹配,将匹配成功的所述企业财务票据模板复制传输至所述第一识别数据库。
37、本专利技术还公开了一种基于图像识别的财务数据分析系统,所述系统包括如下:
38、第一图像处理模块,用于采集企业财务票据图像数据信息,对所述图像数据信息进行纸张边缘检测,获取到规则的包含企业财务票据的第一处理图像,本文档来自技高网...
【技术保护点】
1.一种基于图像识别的财务数据分析方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种基于图像识别的财务数据分析方法,其特征在于,对所述第一处理图像进行图像识别具体包括如下:
3.根据权利要求2所述的一种基于图像识别的财务数据分析方法,其特征在于,对所述企业财务票据数据进行识别阈值检测还包括如下:
4.根据权利要求3所述的一种基于图像识别的财务数据分析方法,其特征在于,对所述企业财务票据数据进行用户数据库匹配具体包括如下:
5.根据权利要求4所述的一种基于图像识别的财务数据分析方法,其特征在于,对所述企业财务票据数据进行用户数据库匹配还包括如下:
6.根据权利要求5所述的一种基于图像识别的财务数据分析方法,其特征在于,所述任一存在的影响因子还包括与其对应的影响因子属性。
7.根据权利要求6所述的一种基于图像识别的财务数据分析方法,其特征在于,对所述企业财务票据数据遍历检索影响因子a:
8.一种基于图像识别的财务数据分析系统,其特征在于,所述系统包括如下:
9.根据权利要求8所
10.根据权利要求9所述的一种基于图像识别的财务数据分析系统,其特征在于,所述任一存在的影响因子还包括与其对应的影响因子属性。
...【技术特征摘要】
1.一种基于图像识别的财务数据分析方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种基于图像识别的财务数据分析方法,其特征在于,对所述第一处理图像进行图像识别具体包括如下:
3.根据权利要求2所述的一种基于图像识别的财务数据分析方法,其特征在于,对所述企业财务票据数据进行识别阈值检测还包括如下:
4.根据权利要求3所述的一种基于图像识别的财务数据分析方法,其特征在于,对所述企业财务票据数据进行用户数据库匹配具体包括如下:
5.根据权利要求4所述的一种基于图像识别的财务数据分析方法,其特征在于,对所述企业财务票据数据进行用户数据库匹配还包括如下:...
【专利技术属性】
技术研发人员:杨志华,郝源,刘杰,杨晴晴,崔春艳,刘雪丽,年福成,张功营,黄侠,王涛,宋小莉,李翔,王潇潇,陈智,杜超,刘静,汪宇宇,
申请(专利权)人:国网安徽省电力有限公司宿州供电公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。