一种基于图理论的纳税人利益关联团体识别方法技术

技术编号:13986856 阅读:85 留言:0更新日期:2016-11-13 04:14
本发明专利技术公开了一种基于图理论的纳税人利益关联团体识别方法,首先,构建出有向加权的纳税人利益关联网络;然后,在纳税人利益关联网络中进行团体识别,识别出纳税人利益关联网络中,所有由联系紧密的纳税人及其关联自然人组成的纳税人利益关联团体。从而解决从非结构化的纳税人信息中识别利益关联团体的问题,为后续的纳税评估和重点监控奠定基础。

【技术实现步骤摘要】

本专利技术涉及计算机科学与技术中的并行图计算领域,具体涉及一种基于图理论的纳税人利益关联团体识别方法
技术介绍
纳税人利益关联团体是指通过投资、控股、交易等关系紧密联系在一起的纳税人集合,在集合内部利益关联紧密程度远高于集合间。在纳税人利益关联团体内部普遍存在着关联交易、抵消交易等偷逃漏税行为,对国家税收征管带来了严峻的挑战,如何对纳税人利益关联团体进行识别并重点监控,成为当前纳税评估和风险监控一个亟待解决的问题。实际税务分析中纳税人利益关联团体主要来源于纳税人集团信息,然而仅仅以纳税人的集团属性作为纳税人利益关联团体划分的唯一标准具有局限性,没有充分考虑纳税人间基于投资、控股、交易的间接关联性,不利于纳税人之间潜在、隐蔽、多样利益关联关系的挖掘。目前尚未有纳税人利益关联团体的识别方法的相关研究,但纳税人利益关联团体与其他领域中的社团概念类似,均为由联系紧密的节点组成。因此其他领域中的社团识别方法,对于解决纳税人利益关联团体识别问题具有参考价值。以下两个专利提供了其他领域社团发现的不同技术方案:1.基于复杂网络模型并行化标签传播算法的药物社团发现方法(201210111171.2);2.一种用于电力网络故障诊断的社团自组织检测方法(201310299446.4)。文献1提供一种基于复杂网络模型并行化标签传播算法的药物社团发现方法。文献2提出一种用于电力网络中社团检测的方法,根据节点的局部适应度选择节点所属的社团,然后不断迭代得到使得全局适应度最优的社团划分情况。以上文献所述方法,运用在纳税人利益关联团体识别过程中,存在以下问题:文献1使用的标签传播算法在社团发现过程中会出现节点的所属社团反复震荡的问题;文献2使用的局部适应度函数和全局适应度函数不考虑社团内节点的个数,会导致个别社团的节点数目不断增长直到迭代次数达到上限,使得得到的社团规模过大而失去研究意义。针对上述文献中存在的不足,本专利技术提出了一种纳税人利益关联团体识别方法,解决税务大数据领域中纳税人利益关联团体的识别问题,其依赖的
技术介绍
主要包括纳税人利益关联网络(简称TPIN)模型和Apache Spark分布式计算框架。专利《基于纳税人利益关联网络模型的偷漏税关联企业识别方法》[申请号:201310293435.5]公开了一种纳税人利益关联网络模型,有效利用了纳税人之间控股关系、实际控制人关系以及企业之间的交易关系。其中的纳税人利益关联网络TPIN以图的方式来组织纳税人及其关联关系,可形式化表示为TPIN=(V,E,W),其中V={vp|p=1,…,Np本文档来自技高网
...

【技术保护点】
一种基于图理论的纳税人利益关联团体识别方法,其特征在于,具体步骤如下:(1)构建有向加权的纳税人利益关联网络构建有向加权的纳税人利益关联网络,即将非结构化的纳税人信息转化为结构化的纳税人利益关联网络的点和边,利用纳税人利益关联网络的边来结构化表示纳税人的交易、投资和控制关系,利用边的权值来表示关联关系的紧密程度;利用纳税人利益关联网络的点来结构化表示纳税人及其关联自然人,利用点的属性来保存团体编号和历史消息集合;(2)在纳税人利益关联网络中进行团体识别所述团体识别操作,具体包括以下步骤:Step1.沿网络中的每条边传播源点和终点的团体编号;首先,沿网络中的每条边向边的源点,发送包含边终点的团体编号及边的权值的消息,格式形如:(cid,weight),其中cid表示边终点的团体编号,weight表示边的权值;然后,沿网络中的每条边向边的终点,发送包含边源点的团体编号及边的权值的消息;Step2.对顶点接收到的消息进行聚集,获得网络中的每个顶点的当前消息集合;Step3.综合当前消息集合与历史消息集合选出每个顶点的所属利益关联团体编号;Step4.若迭代次数达到预定的最大值或没有任何顶点的团体编号发生改变,则识别过程结束;否则,返回执行Step1;迭代结束得到的纳税人利益关联网络中,将顶点属性中的团体编号相同的所有顶点,划分到同一个纳税人利益关联团体中,即可得到所有的纳税人利益关联团体。...

【技术特征摘要】
1.一种基于图理论的纳税人利益关联团体识别方法,其特征在于,具体步骤如下:(1)构建有向加权的纳税人利益关联网络构建有向加权的纳税人利益关联网络,即将非结构化的纳税人信息转化为结构化的纳税人利益关联网络的点和边,利用纳税人利益关联网络的边来结构化表示纳税人的交易、投资和控制关系,利用边的权值来表示关联关系的紧密程度;利用纳税人利益关联网络的点来结构化表示纳税人及其关联自然人,利用点的属性来保存团体编号和历史消息集合;(2)在纳税人利益关联网络中进行团体识别所述团体识别操作,具体包括以下步骤:Step1.沿网络中的每条边传播源点和终点的团体编号;首先,沿网络中的每条边向边的源点,发送包含边终点的团体编号及边的权值的消息,格式形如:(cid,weight),其中cid表示边终点的团体编号,weight表示边的权值;然后,沿网络中的每条边向边的终点,发送包含边源点的团体编号及边的权值的消息;Step2.对顶点接收到的消息进行聚集,获得网络中的每个顶点的当前消息集合;Step3.综合当前消息集合与历史消息集合选出每个顶点的所属利益关联团体编号;Step4.若迭代次数达到预定的最大值或没有任何顶点的团体编号发生改变,则识别过程结束;否则,返回执行Step1;迭代结束得到的纳税人利益关联网络中,将顶点属性中的团体编号相同的所有顶点,划分到同一个纳税...

【专利技术属性】
技术研发人员:董博阮建飞郑庆华贾俊杰蔚文达
申请(专利权)人:西安交通大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1