System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及发票检测,具体涉及一种基于多元数据分析的异常检测方法、系统及电子设备。
技术介绍
1、随着财务管理对于企业的重要性越来越高,财务管理中的发票异常检测对于企业而言便尤为重要。因此,如何有效针对发票进行异常检测是现阶段亟待解决的问题。
2、目前,对发票进行异常检测通常采用的方式为:基于传统的发票自动化审查系统对众多的发票数据进行审核,排查其中可能存在的发票异常隐患,但是此方式下,发票自动化审查系统在审查时通常侧重于发票的基本合规性进行异常审查,缺乏对发票的异常类型的深度挖掘和智能化识别能力,对发票的异常检测的准确性较差,导致最终对发票的异常预警准确性较低。
技术实现思路
1、为了提升对发票异常预警的准确性,本申请提供一种基于多元数据分析的异常检测方法、系统及电子设备。
2、在本申请的第一方面提供了一种基于多元数据分析的异常检测方法,具体包括:
3、获取目标企业中待检测的至少一个目标发票数据;
4、对每个所述目标发票数据进行预处理,得到对应的至少一个维度的发票特性信息;
5、将每个所述目标发票数据的发票特征信息输入至预设的异常检测模型中,确定对应的目标发票数据的目标潜在异常类型;
6、基于所述目标潜在异常类型、所述目标企业的发票中容易出现异常的至少一个目标发票特征维度以及对应的至少一个目标发票异常类型,确定是否进行异常预警,所述目标发票异常类型为对应的目标发票特征维度的发票特征信息出现异常时容易出现的发票异
7、若是,则对所述目标潜在异常类型进行校验,得到校验后异常类型,并针对所述校验后异常类型发出异常预警。
8、通过采用上述技术方案,获取到需要进行异常检测的目标发票数据后,对目标发票数据进行预处理,准确地提取出质量较高且模型能识别的发票特征信息,从而使得后续基于发票特征信息,异常检测模型能够更为准确地输出结果。进一步地,将目标发票数据的发票特征信息输入至异常检测模型,高效地对目标发票数据可能存在的发票异常进行检测识别。接着,基于每个目标发票特征维度以及对应的目标发票异常类型,分析异常检测模型识别出异常的目标发票数据中真实发生异常的可能性,进而准确地确定是否进行异常预警,一定程度上避免预警的误触。最后,对异常检测模型识别出的目标潜在异常类型进行校验,从而提高发票异常检测的准确性,进而使得对目标发票数据发出更为准确的预警。
9、可选的,所述基于所述目标潜在异常类型、所述目标企业的发票中容易出现异常的至少一个目标发票特征维度以及对应的至少一个目标发票异常类型,确定是否进行异常预警,具体包括:
10、获取所述目标企业的历史发票中出现过异常的历史发票特征维度,统计每个所述历史发票特征维度的第一出现次数,并按照所述第一出现次数从大到小的顺序,从各所述历史发票特征维度中选取第一个数的历史发票特征维度确定为目标发票特征维度;
11、确定每个所述目标发票特征维度的发票特征信息出现异常时存在的历史发票异常类型,统计每个所述历史发票异常类型的第二出现次数,并按照所述第二出现次数从大到小的顺序,从各所述历史发票异常类型中选取第二个数的历史发票异常类型确定为对应的目标发票特征维度的目标发票异常类型;
12、计算每个所述目标发票特征维度的第一权重和对应的各所述目标发票异常类型的第二权重,所述第一权重为每个目标发票特征维度的第一出现次数与所有目标发票特征维度的第一出现次数之和的比值,所述第二权重为目标发票特征维度对应的单个目标发票异常类型的第二出现次数与对应的所有目标发票异常类型的第二出现次数之和的比值;
13、基于所述目标潜在异常类型、所述第一权重和对应的各所述第二权重,确定是否进行异常预警。
14、通过采用上述技术方案,第一出现次数越大,目标企业的发票中对应的历史发票特征维度的发票特征信息越容易出现异常,进而确定目标发票特征维度;第二出现次数越大,目标发票特征维度发生异常时越容易存在对应的历史发票异常类型,进而确定目标发票异常类型。最后结合第一权重和对应的各个第二权重,分析异常检测模型识别出异常的目标发票数据中真实发生异常的可能性,进而准确地确定是否进行异常预警,一定程度上避免预警的误触。
15、可选的,所述基于所述目标潜在异常类型、所述第一权重和对应的各所述第二权重,确定是否进行异常预警,具体包括:
16、将对应的各目标发票异常类型中存在所述目标潜在异常类型的目标发票特征维度确定为重点发票特征维度,计算每个所述重点发票特征维度的第一权重和对应的目标潜在异常类型的第二权重的第一乘积;
17、对各所述第一乘积进行求和,得到第一乘积之和,并将所述第一乘积之和与预设的乘积之和阈值进行对比,若所述第一乘积之和大于所述乘积之和阈值,则确定进行异常预警;
18、若所述第一乘积之和不大于所述乘积之和阈值,则确定不进行异常预警。
19、通过采用上述技术方案,第一乘积越大,重点发票特征维度的发票特征信息出现异常时越容易存在此目标潜在异常类型,如果第一乘积之和大于乘积之和阈值,说明出现目标潜在异常类型的整体可能性较大且重点发票特征维度的发票特征信息发生异常可能性较大,大概率存在异常风险,那么确定进行正常的异常预警;反之,说明大概率不存在异常风险,那么确定不进行异常预警。
20、可选的,所述对所述目标潜在异常类型进行校验,得到校验后异常类型,具体包括:
21、将对应的各目标发票异常类型中存在所述目标潜在异常类型的目标发票特征维度确定为重点发票特征维度,计算每个所述重点发票特征维度的第一权重和对应的各所述目标发票异常类型的第二权重的第二乘积;
22、从同一所述重点发票特征维度对应的各所述第二乘积中选取最大第二乘积;
23、将各所述最大第二乘积对应的目标发票异常类型确定为重点发票异常类型,并判断各所述重点发票异常类型是否一致;
24、若是,则在所述重点发票异常类型与所述目标潜在异常类型相同时,将所述目标潜在异常类型确定为校验后异常类型;
25、在所述重点发票异常类型与所述目标潜在异常类型不相同时,将所述重点发票异常类型确定为校验后异常类型。
26、通过采用上述技术方案,第二乘积越大,重点发票特征维度的发票特征信息出现异常时越容易存在对应的目标发票异常类型,如果各个重点发票特征维度对应的重点发票异常类型均一致,各个重点发票特征维度出现信息异常时最容易出现的目标发票异常类型均一致,说明针对此重点发票异常类型的出现,各个重点发票特征维度之间存在强关联的关系,进而不仅可以验证重点发票特征维度为需进行异常预警的目标发票数据中大概率出现异常的发票特征维度,为后续发票异常排查提供可靠的排查维度,而且还能准确确定大概率会存在的发票异常类型。
27、可选的,所述方法还包括:
28、将所述校验后异常类型对应的目标发票数据确定为待排查发票本文档来自技高网...
【技术保护点】
1.一种基于多元数据分析的异常检测方法,其特征在于,所述方法包括:
2.根据权利要求1所述的基于多元数据分析的异常检测方法,其特征在于,所述基于所述目标潜在异常类型、所述目标企业的发票中容易出现异常的至少一个目标发票特征维度以及对应的至少一个目标发票异常类型,确定是否进行异常预警,具体包括:
3.根据权利要求2所述的基于多元数据分析的异常检测方法,其特征在于,所述基于所述目标潜在异常类型、所述第一权重和对应的各所述第二权重,确定是否进行异常预警,具体包括:
4.根据权利要求2所述的基于多元数据分析的异常检测方法,其特征在于,所述对所述目标潜在异常类型进行校验,得到校验后异常类型,具体包括:
5.根据权利要求4所述的基于多元数据分析的异常检测方法,其特征在于,所述方法还包括:
6.根据权利要求1所述的基于多元数据分析的异常检测方法,其特征在于,所述方法还包括:
7.根据权利要求6所述的基于多元数据分析的异常检测方法,其特征在于,所述根据所述第三权重和对应的各所述第四权重,核实所述校验后异常类型是否存在,具体包括
8.一种基于多元数据分析的异常检测系统,其特征在于,包括:
9.一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其特征在于,所述计算机程序被处理器加载并执行时,采用了权利要求1-7中任一项所述的方法。
10.一种电子设备,包括存储器、处理器及存储在存储器中并能够在处理器上运行的计算机程序,其特征在于,所述处理器加载并执行计算机程序时,采用了权利要求1-7中任一项所述的方法。
...【技术特征摘要】
1.一种基于多元数据分析的异常检测方法,其特征在于,所述方法包括:
2.根据权利要求1所述的基于多元数据分析的异常检测方法,其特征在于,所述基于所述目标潜在异常类型、所述目标企业的发票中容易出现异常的至少一个目标发票特征维度以及对应的至少一个目标发票异常类型,确定是否进行异常预警,具体包括:
3.根据权利要求2所述的基于多元数据分析的异常检测方法,其特征在于,所述基于所述目标潜在异常类型、所述第一权重和对应的各所述第二权重,确定是否进行异常预警,具体包括:
4.根据权利要求2所述的基于多元数据分析的异常检测方法,其特征在于,所述对所述目标潜在异常类型进行校验,得到校验后异常类型,具体包括:
5.根据权利要求4所述的基于多元数据分析的异常检测方法,其特征在于,...
【专利技术属性】
技术研发人员:徐剑,杨平,邓勇,戴方明,洪飞,孙超,
申请(专利权)人:数族科技南京股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。