一种基于异构图的税务异常检测方法、系统及相关装置制造方法及图纸

技术编号:33042698 阅读:19 留言:0更新日期:2022-04-15 09:24
本申请提供一种基于异构图的税务异常检测方法,包括:获取各公司的税务数据;将所述税务数据输入预设图数据库,并创建所述税务数据对应的不同类型的节点;利用元路径实例级聚合每个节点的多个元路径信息,利用元路径内级聚合不同元路径实例的信息,利用元路径间级从不同元路径实例中学习所述节点的隐含信息;将所述元路径实例级、元路径内级和元路径间级输入至所述异构图,利用交叉熵损失函数计算损失,得到检测模型;利用所述检测模型进行税务异常检测。本申请利用异构图丰富的税务风险信息,可以使偷漏税检测准确率进一步提升。本申请还提供一种基于异构图的税务异常检测系统、计算机可读存储介质和电子设备,具有上述有益效果。果。果。

【技术实现步骤摘要】
一种基于异构图的税务异常检测方法、系统及相关装置


[0001]本申请涉及数据检测领域,特别涉及一种基于异构图的税务异常检测方法、系统及相关装置。

技术介绍

[0002]目前的偷税漏税检测方法可分为三类:传统的税务稽查方法、基于机器学习的方法和基于网络的方法。传统的税务稽查方法分为检举选案、手工选案和计算机选案。传统的基于计算机的案例选择主要是利用专家经验来定义规则,然后建立基于规则的系统来筛选异常财务指标。但是,这些规则需要手动定义,并且存在滞后性。此外,随着逃税行为的改变,手工定义得规则往往会失效。

技术实现思路

[0003]本申请的目的是提供一种基于异构图的税务异常检测方法、系统及相关装置,能够提高税务异常件检测的精度和效率。
[0004]为解决上述技术问题,本申请提供一种基于异构图的税务异常检测方法,具体技术方案如下:
[0005]获取各公司的税务数据;
[0006]将所述税务数据输入预设图数据库,并创建所述税务数据对应的不同类型的节点;
[0007]利用元路径实例级聚合每个节点的多个元路径信息,利用元路径内级聚合不同元路径实例的信息,利用元路径间级从不同元路径实例中学习所述节点的隐含信息;其中,每个节点学习一个低维的嵌入表示,所述嵌入表示包含了所述异构图的结构信息和所述税务数据的语义信息;
[0008]将所述元路径实例级、元路径内级和元路径间级输入至所述异构图,利用交叉熵损失函数计算损失,得到检测模型;
[0009]利用所述检测模型进行税务异常检测。
[0010]可选的,获取税务数据之后,还包括:
[0011]对所述税务数据进行数据清理;所述数据清理包括数据脱敏、数据填充和异常数据删除中的至少一种。
[0012]可选的,利用元路径实例级聚合每个节点的多个元路径信息包括:
[0013]将元路径实例上的所有节点进行拼接,与特定类型的矩阵相乘以学习元路径实例的嵌入表示。
[0014]可选的,还包括:
[0015]利用Adam优化器反向传播更新所述检测模型的层次模型参数。
[0016]可选的,利用所述检测模型进行税务检测包括:
[0017]利用所述检测模型进行偷漏税检测和隐匿交易检测。
[0018]可选的,利用所述检测模型进行偷漏税检测和隐匿交易检测包括:
[0019]利用所述检测模型输出每个公司学习到的节点嵌入,将所述节点嵌入输入至支持向量机中,以便对所有公司进行二分类并进行偷漏税检测;
[0020]将公司之间的嵌入进行哈达玛积,得到公司对的嵌入标识,再将所述嵌入对输入到所述支持向量机中进行隐匿交易检测。
[0021]本申请还提供一种基于异构图的税务异常检测系统,包括:
[0022]数据获取模块,用于获取各公司的税务数据;
[0023]节点创建模块,用于将所述税务数据输入预设图数据库,并创建所述税务数据对应的不同类型的节点;
[0024]元路径聚合模块,用于利用元路径实例级聚合每个节点的多个元路径信息,利用元路径内级聚合不同元路径实例的信息,利用元路径间级从不同元路径实例中学习所述节点的隐含信息;其中,每个节点学习一个低维的嵌入表示,所述嵌入表示包含了所述异构图的结构信息和所述税务数据的语义信息;
[0025]模型构建模块,用于将所述元路径实例级、元路径内级和元路径间级输入至所述异构图,利用交叉熵损失函数计算损失,得到检测模型;
[0026]税务检测模块,用于利用所述检测模型进行税务异常检测。
[0027]可选的,税务检测模块包括:
[0028]偷漏税检测单元,用于利用所述检测模型输出每个公司学习到的节点嵌入,将所述节点嵌入输入至支持向量机中,以便对所有公司进行二分类并进行偷漏税检测;
[0029]隐匿交易检测单元,用于将公司之间的嵌入进行哈达玛积,得到公司对的嵌入标识,再将所述嵌入对输入到所述支持向量机中进行隐匿交易检测。
[0030]本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的方法的步骤。
[0031]本申请还提供一种电子设备,包括存储器和处理器,所述存储器中存有计算机程序,所述处理器调用所述存储器中的计算机程序时实现如上所述的方法的步骤。
[0032]本申请提供一种基于异构图的税务异常检测方法,包括:获取各公司的税务数据;将所述税务数据输入预设图数据库,并创建所述税务数据对应的不同类型的节点;利用元路径实例级聚合每个节点的多个元路径信息,利用元路径内级聚合不同元路径实例的信息,利用元路径间级从不同元路径实例中学习所述节点的隐含信息;其中,每个节点学习一个低维的嵌入表示,所述嵌入表示包含了所述异构图的结构信息和所述税务数据的语义信息;将所述元路径实例级、元路径内级和元路径间级输入至所述异构图,利用交叉熵损失函数计算损失,得到检测模型;利用所述检测模型进行税务异常检测。
[0033]本申请将税务场景建模为异质信息网络,充分考虑了公司、人和货物三种实体以及实体之间的丰富交互信息。利用异构图丰富的税务风险信息,可以使偷漏税检测准确率进一步提升。同时异构图上可以进行半监督学习,通过少量标签数据来学习异构图中复杂的结构语义信息,自适应于税务场景。同时,本申请生成的检测模型不仅仅可以进行偷漏税检测,还可以进行隐匿交易检测以及异常团伙检测等多种下游任务。
[0034]本申请还提供一种基于异构图的税务异常检测系统、计算机可读存储介质和电子设备,具有上述有益效果,此处不再赘述。
附图说明
[0035]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0036]图1为本申请实施例所提供的基于异构图的税务异常检测方法的流程图;
[0037]图2为本申请实施例提供的税务异构图的网络模式示意图;
[0038]图3为本申请实施例所提供的基于异构图的税务异常检测系统结构示意图。
具体实施方式
[0039]为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0040]请参考图1,图1为本申请实施例所提供的基于异构图的税务异常检测方法的流程图,该方法包括:
[0041]S101:获取各公司的税务数据;
[0042]本步骤旨在获取公司的税务数据,需要注意的是,该税务数据指税务申请过程所需要的相关数据,例如纳税人识别号nsrsbh、本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于异构图的税务异常检测方法,其特征在于,包括:获取各公司的税务数据;将所述税务数据输入预设图数据库,并创建所述税务数据对应的不同类型的节点;利用元路径实例级聚合每个节点的多个元路径信息,利用元路径内级聚合不同元路径实例的信息,利用元路径间级从不同元路径实例中学习所述节点的隐含信息;其中,每个节点学习一个低维的嵌入表示,所述嵌入表示包含了所述异构图的结构信息和所述税务数据的语义信息;将所述元路径实例级、元路径内级和元路径间级输入至所述异构图,利用交叉熵损失函数计算损失,得到检测模型;利用所述检测模型进行税务异常检测。2.根据权利要求1所述的税务异常检测方法,其特征在于,获取税务数据之后,还包括:对所述税务数据进行数据清理;所述数据清理包括数据脱敏、数据填充和异常数据删除中的至少一种。3.根据权利要求1所述的税务异常检测方法,其特征在于,利用元路径实例级聚合每个节点的多个元路径信息包括:将元路径实例上的所有节点进行拼接,与特定类型的矩阵相乘以学习元路径实例的嵌入表示。4.根据权利要求1所述的税务异常检测方法,其特征在于,还包括:利用Adam优化器反向传播更新所述检测模型的层次模型参数。5.根据权利要求1所述的税务异常检测方法,其特征在于,利用所述检测模型进行税务检测包括:利用所述检测模型进行偷漏税检测和隐匿交易检测。6.根据权利要求5所述的税务异常检测方法,其特征在于,利用所述检测模型进行偷漏税检测和隐匿交易检测包括:利用所述检测模型输出每个公司学习到的节点嵌入,将所述节点嵌入输入至支持向量机中,以便对所有公司进行二分类并进行偷漏税检测;将公司之间的嵌入进行哈达玛积,得到公司对的嵌入标识,再将所述嵌...

【专利技术属性】
技术研发人员:郑庆华徐一明王嘉祥师斌刘勇董博陈鹏飞朱华童黄志苹
申请(专利权)人:税友软件集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1