System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种产业多维度数据融合系统及方法技术方案_技高网

一种产业多维度数据融合系统及方法技术方案

技术编号:44159982 阅读:27 留言:0更新日期:2025-01-29 10:30
本发明专利技术公开了一种产业多维度数据融合系统及方法,涉及电子票据多维度监测技术领域,该方法包括以下步骤:搭建电子票据服务平台,基于MySQL为平台内部企业建立企业档案,收集入驻平台内部企业电子票据信息,包括汇票、销售发票、采购发票,并记录在相关企业档案内;基于企业内部电子票据数据,对票据进行信息提取,针对平台内部入驻企业,检索双方企业档案下辖票据数据。本发明专利技术一种产业多维度数据融合系统及方法,通过融合企业档案、电子票据数据、业务范围画像等多维度数据,对电子票据进行可疑票据的判定,基于企业的实际业务数据,动态生成业务范围画像,增强了确凿可疑票据判定的准确性,减少人工票据核查的工作量,增强了实用性与功能性。

【技术实现步骤摘要】

本专利技术涉及电子票据多维度监测,具体来说,涉及一种产业多维度数据融合系统及方法


技术介绍

1、电子票据是传统纸质票据的电子化形式,主要是在电子商务、在线支付等交易活动中产生的票据,电子票据包括但不限于电子发票、电子收据、电子支票,电子票据的出现虽然提高了交易效率,但同时也给犯罪分子提供了新的作案手段,因此需要对电子票据进行可疑度分析,以判定该票据是否为可疑票据;

2、但现有票据服务平台对电子票据可疑度判定多是通过人工对电子票据逐一进行查验,主观性强且工作量大,难以融合双方企业多维度数据对电子票据的可疑度进行量化评估,存在实用性低下的问题,无法对可疑电子票据进行等级划分,且无法基于双方企业的实际业务画像对电子票据可疑度进行进一步判定,存在功能性低下的问题;

3、针对相关技术中的问题,目前尚未提出有效的解决方案。


技术实现思路

1、针对相关技术中的问题,本专利技术提出一种产业多维度数据融合系统及方法,以克服现有相关技术所存在的上述技术问题。

2、为此,本专利技术采用的具体技术方案如下:

3、一种产业多维度数据融合方法,该方法包括以下步骤:

4、s1、搭建电子票据服务平台,基于mysql为平台内部企业建立企业档案,收集入驻平台内部企业电子票据信息,包括汇票、销售发票、采购发票,并记录在相关企业档案内;

5、s2、基于企业内部电子票据数据,对票据进行信息提取,针对平台内部入驻企业,检索双方企业档案下辖票据数据,对双方企业进行业务范围画像建立,基于业务画像重合度判定可疑票据,并进行可疑票据标注;

6、s3、针对非平台内部入驻企业,检索平台内部储存所有票据数据,生成关联企业清单,基于关联企业档案中票据数据,生成业务范围画像,判定可疑票据并基于判定结果进行可疑票据标注;

7、s4、当不存在关联企业时,收集企业经营范围,结合当前企业业务范围画像,对可疑票据进行判定,并基于判定结果标注可疑票据。

8、作为优选的实施方式,所述s2包括以下子步骤:

9、s21、基于企业档案内部电子票据数据,提取票据信息,其具体的步骤为:

10、针对企业档案中的汇票,基于ocr工具查找包含“收款人”、“出票人”关键字内容,提取关键字后方的企业名称;

11、针对企业档案中的销售发票,基于ocr工具查找包含“购买方”、“销售方”关键字内容,提取关键字后方的企业名称;

12、针对企业档案中的采购发票,基于ocr工具查找包含“销售方”、“购买方”关键字内容,提取关键字后方的企业名称;

13、s22、基于双方企业名称,检索双方企业档案下辖的电子票据数据,构建双方企业业务范围画像,基于业务画像的重合度,判定当前电子票据的可疑性。

14、作为优选的实施方式,所述s22包括以下子步骤:

15、s221、基于双方企业名称,检索平台内部双方企业档案,汇总双方企业档案中销售发票数据以及采购发票数据,基于ocr工具提取商品名称字段,通过相似度对提取的商品名称进行归类,其算法公式为:

16、;

17、其中,为相似度,代表相似度阈值,当≥时,则将两个商品名称归为一类,当<时,则代表两个商品不为一类商品;

18、s222、对销售发票以及采购发票中归类后的商品类别,分别计算不同商品类别的权重占比,建立企业a与企业b的采购业务画像以及销售业务画像,其具体的步骤为:

19、针对采购发票,对每个商品类别,分别累加商品类别下所有采购发票的金额,获得商品类别下所有采购发票的总金额,同时累加所有采购发票总金额获得采购总金额,分别计算不同商品类别的采购权重占比,其算法公式为:

20、;

21、其中,代表商品类别在当前企业下的采购权重占比;

22、针对销售发票,对每个商品类别,分别累加商品类别下所有销售发票的金额,获得商品类别下所有销售发票的总金额,同时累加所有销售发票总金额获得销售总金额,分别计算不同商品类别的销售权重占比,其算法公式为:

23、;

24、其中,代表商品类别在当前企业下的销售权重占比,针对企业a与企业b,分别建立商品类别的采购业务画像与销售业务画像,其步骤为:

25、企业a:、;

26、企业b:、;

27、其中,代表企业a在商品类别1上的采购权重,代表企业a在商品类别1上的销售权重,代表企业b在商品类别1上的采购权重,代表企业b在商品类别1上的销售权重;

28、s223、结合当前电子票据的类型,基于余弦相似度方法计算当前企业a与企业b的业务重合度,其具体的步骤为:

29、当电子票据为企业a的汇票且收款人为企业b,或电子票据为企业a的采购发票且销售方为企业b时,计算企业a的采购业务画像与企业b的销售业务画像的相似度,其具体的算法公式为:

30、;

31、其中,代表采购业务画像相似度,当时,代表企业a的采购业务与企业b的销售业务不存在范围匹配,存在不匹配的交易行为,即当前电子票据为确凿可疑票据,当时代表企业a的采购业务与企业b的销售业务存在业务匹配,具备存在业务合作的基础,即当前电子票据为正常票据;

32、当电子票据为企业a的汇票且出票人为企业b,或电子票据为企业a的销售发票且购买方为企业b时,计算企业a的销售业务画像与企业b的采购业务画像的相似度,其具体的算法公式为:

33、;

34、其中,代表销售业务画像相似度,当时,代表企业a的销售业务与企业b的采购业务不存在范围匹配,存在不匹配的交易行为,即当前电子票据为确凿可疑票据,当时代表企业a的销售业务与企业b的采购业务存在业务匹配,具备存在业务合作的基础,即当前电子票据为正常票据;

35、s224、针对确凿异常电子票据,对相关企业档案进行红色标记,同时对确凿异常电子票据进行红色标记。

36、作为优选的实施方式,所述s3包括以下步骤:

37、s31、根据当前企业电子票据类型,对电子票据数据进行分析,其步骤为:

38、当电子票据中企业信息存在非平台内部入驻企业时,提取非平台入驻企业名称,同时检索平台内部储存所有票据数据,结合非平台入驻企业名称生成关联企业清单;

39、s32、结合关联企业清单,对当前电子票据进行可疑度判定。

40、作为优选的实施方式,所述s31包括以下子步骤:

41、s311、遍历平台内部企业档案,获得平台内部储存的所有企业票据数据集合,从票据数据集合中筛选出包含非平台内部入驻企业名称的票据:

42、;

43、其中,表示中的一个具体的电子票据,为包含非平台内部入驻企业的电子票据子集,从提取与有业务往来的平台内部入驻企业,其步骤为:

44、;

45、其中,代表为平台内部入驻企业名称集合,为本文档来自技高网...

【技术保护点】

1.一种产业多维度数据融合方法,其特征在于,该方法包括以下步骤:

2.根据权利要求1所述的一种产业多维度数据融合方法,其特征在于,所述S2包括以下子步骤:

3.根据权利要求2所述的一种产业多维度数据融合方法,其特征在于,所述S22包括以下子步骤:

4.根据权利要求2所述的一种产业多维度数据融合方法,其特征在于,所述S3包括以下步骤:

5.根据权利要求4所述的一种产业多维度数据融合方法,其特征在于,所述S31包括以下子步骤:

6.根据权利要求5所述的一种产业多维度数据融合方法,其特征在于,所述S32包括以下步骤:

7.根据权利要求1所述的一种产业多维度数据融合方法,其特征在于,所述S4包括以下子步骤:

8.一种产业多维度数据融合系统,其特征在于,该系统采用如权利要求1-7任意一项所述的产业多维度数据融合方法,包括企业数据采集模块、业务范围生成模块、可疑度判定模块、人工核查模块;

【技术特征摘要】

1.一种产业多维度数据融合方法,其特征在于,该方法包括以下步骤:

2.根据权利要求1所述的一种产业多维度数据融合方法,其特征在于,所述s2包括以下子步骤:

3.根据权利要求2所述的一种产业多维度数据融合方法,其特征在于,所述s22包括以下子步骤:

4.根据权利要求2所述的一种产业多维度数据融合方法,其特征在于,所述s3包括以下步骤:

5.根据权利要求4所述的一种产业多维度数据融合方法,...

【专利技术属性】
技术研发人员:李方祥王荣发李文杰郭建超
申请(专利权)人:深度山东数字科技集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1