一种基于相似度算法挖掘隐藏风险商户的方法和装置制造方法及图纸

技术编号:21954551 阅读:22 留言:0更新日期:2019-08-24 18:33
本公开涉及一种基于相似度算法挖掘隐藏风险商户的方法,包括确定黑种子,所述黑种子包括已知的风险商户或高置信度潜在风险商户或其组合;确定与所述黑种子有共同用户的未知商户;确定所述未知商户与所述黑种子的相似度;以及至少基于所述未知商户与所述黑种子的相似度来确定所述未知商户属于潜在风险商户的最终得分。本公开还涉及相应的装置、设备和计算机可读介质。

A Method and Device for Mining Hidden Risk Merchants Based on Similarity Algorithms

【技术实现步骤摘要】
一种基于相似度算法挖掘隐藏风险商户的方法和装置
本公开涉及风险控制,尤其涉及隐藏风险商户的挖掘。
技术介绍
风险商户(诸如赌博幕后庄家)在巨大的收入利益驱使下,为了规避被发现并稽核,会在一定成本下模仿真实交易场景。近期发现,风险商户会通过各种非法渠道控制并运营各种平台的大量收款码。例如,在赌博场景中,当用户多次向赌博幕后庄家充值(例如,购买筹码)时,庄家APP会把交易随机分配到不同的收款码,从而伪造出该用户去各种不同的商户消费付款的数据假象,以试图躲避常规的风控识别策略。因此,本领域中需要改进的风控识别技术来挖掘出隐藏在真实交易场景假象背后的风险商户。
技术实现思路
本公开的一方面涉及一种基于相似度算法挖掘隐藏风险商户的方法,包括:确定黑种子,所述黑种子包括已知的风险商户或高置信度潜在风险商户或其组合;确定与所述黑种子有共同用户的未知商户;确定所述未知商户与所述黑种子的相似度;以及至少基于所述未知商户与所述黑种子的相似度来确定所述未知商户属于潜在风险商户的最终得分。根据一示例性实施例,确定与所述黑种子有共同用户的未知商户包括:确定在一时间段里与所述黑种子发生过交易的用户;以及关联出与所述黑种子发生过交易的用户在所述时间段里交易过的其他商户作为所述未知商户。根据一示例性实施例,所述相似度包括买家相似度,其中确定所述未知商户与所述黑种子的所述相似度包括:确定所述未知商户与所述黑种子的共同买家;以及基于所述共同买家的数量确定所述未知商户与所述黑种子的买家相似度。根据另一示例性实施例,所述相似度包括金额相似度,其中确定所述未知商户与所述黑种子的所述相似度包括:确定所述未知商户的金额类别和所述黑种子的金额类别;以及确定所述未知商户的金额类别与所述黑种子的金额类别的相似度。根据又一示例性实施例,所述相似度包括文本相似度,其中确定所述未知商户与所述黑种子的所述相似度包括:拆解所述未知商户的文本和所述黑种子的文本;以及基于所述拆解,确定所述未知商户的文本和所述黑种子的文本的文本相似度,其中文本包括商品名、转账附言、注释文本或其任何组合。根据再一示例性实施例,所述相似度包括综合相似度,其中确定所述未知商户与所述黑种子的所述相似度包括:基于买家相似度、金额相似度和文本相似度的组合来确定所述综合相似度。根据进一步的示例性实施例,所述综合相似度基于所述买家相似度,并由所述金额相似度和所述文本相似度进一步调节。根据又一进一步的示例性实施例,所述综合相似度基于所述买家相似度、所述金额相似度和所述文本相似度的加权结合。根据一示例性实施例,至少基于所述未知商户与所述黑种子的相似度来确定所述未知商户属于潜在风险商户的最终得分包括:基于所述未知商户与所述黑种子的相似度和所述黑种子的置信度来确定所述最终得分。根据一示例性实施例,该方法进一步包括:输出所述未知商户属于潜在风险商户的所述最终得分。根据一示例性实施例,该方法进一步包括:将所述未知商户属于潜在风险商户的所述最终得分与阈值作比较;以及基于所述比较来确定是否要稽核所述未知商户。根据一示例性实施例,所述高置信度潜在风险商户基于策略或模型或其组合来确定,并且所述高置信度潜在风险商户的置信度基于所述策略的松紧程度或所述模型的打分或其组合。根据另一示例性实施例,所述黑种子包括多个黑种子,并且所述基于所述未知商户与所述黑种子的相似度和所述黑种子的置信度来确定所述最终得分包括:基于所述未知商户与所述多个黑种子中的每一个黑种子的相似度和该黑种子的置信度来确定所述最终得分。根据又一示例性实施例,该方法进一步包括:如果确定要稽核所述未知商户,则将所述未知商户添加到所述黑种子中。本公开的其他方面还包括相应的装置、设备和计算机可读介质。附图说明图1示出了一种用户向风险商户付款参与风险交易的示例性场景。图2示出了一种用户向风险商户付款参与风险交易的示例性场景。图3示出了根据一示例性方面的挖掘隐藏风险商户的方法。图4示出了黑种子与二度关联商户之间的关系。图5示出了示例性的各种二度关联商户的情形。图6示出了根据一示例性而非限定性实施例的金额相似度的示例。图7示出了根据一示例性实施例的文本相似度的示例。图8示出了确定未知商户是潜在风险商户的最终得分的示例情形。图9示出了根据本公开一示例性实施例的稽核示例。图10示出了根据本公开的示例性方面的基于相似度算法挖掘隐藏风险商户的方法的流程图。图11示出了根据本公开一示例性方面的基于相似度算法挖掘隐藏风险商户的装置的框图。具体实施方式为了发现并稽核风险商户,一种途径是根据用户投诉来识别风险商户。通过累积一定量的用户真实投诉,的确能够准确识别出风险商户。然而,由于大部分参与风险交易(例如,赌博下注)的用户是自愿参与的,因此主动投诉风险商家(例如,庄家)的比例很低。因此,能够确定的黑样本占比很小,覆盖率低,并不足以识别出大部分的风险商户。为了发现并稽核风险商户,通常可以根据买家的交易异常来作出判断。然而,风险商户为了规避此类稽核,会模拟真实商户交易。例如,幕后庄家会通过各种非法渠道控制并运营各种平台的大量收款码。从交易上来看,交易特征与普通网店、实体店等正常营运的商户的交易特征非常相似,难以区分。例如,在一示例性的通过APP来进行网络赌博的场景中,幕后庄家可能会采用轮码手法,即通过各种非法渠道来控制并运营各种平台的大量收款码,当用户多次向该庄家充值(例如,购买筹码)时,庄家APP会把交易随机分配到不同的收款码,从而伪造出该用户去各种不同的商户消费付款的数据假象,以试图躲避常规的风控识别策略。抽象地来看,风险商户的各个用户会通过不同的收款码向不同的商户(账户)转移,而最终一个商户会接收到来自不同商户(例如,赌博账户)的用户的付款。如所可知,风险商户并不被限定于庄家APP,而是也可涵盖实体风险商户机构等。图1示出一种用户向风险商户付款参与风险交易的示例性场景100。在本例中,以赌博场景为例。如所可见,风险商户(例如,赌博幕后庄家)101控制了多个分店A、B、C、……、N及其各自相关联的收款码102A、102B、102C、……、102N。这些分店可能被伪装成各种正常业务的商户,诸如早餐店、小吃店、书店、服装店、咖啡馆等等……用户103a、103b、103c、……、103m想要例如购买筹码和/或直接付款参与赌博。用户103a和103b可能在分店A参与赌博,并通过分店A的收款码102A进行支付(例如,购买筹码和/或直接付款参与赌博等);用户103c等可能在分店B参与赌博,并通过分店B的收款码102B进行支付(例如,购买筹码和/或直接付款参与赌博等);……;用户103m等可能在分店N参与赌博,并通过分店N的收款码102N进行支付(例如,购买筹码和/或直接付款参与赌博等)。在此过程中,该风险商户101的一个或多个收款码102(例如,收款码102A和102B)可能被发现并稽核,例如由于用户举报和/或由于资金交易异常而被平台风控发现并稽核,从而这一个或多个收款码102可能被废除并且相关联的一个或多个分店(例如,A和B)可被强制关闭。此时,该风险商户101可能引导顾客去其他分店(例如,C、……、N)。此时,平台风控通过跟踪被关闭的分店A和B的用户(例如,用户103a、103b、103c本文档来自技高网...

【技术保护点】
1.一种基于相似度算法挖掘隐藏风险商户的方法,其特征在于,包括:确定黑种子,所述黑种子包括已知的风险商户或高置信度潜在风险商户或其组合;确定与所述黑种子有共同用户的未知商户;确定所述未知商户与所述黑种子的相似度;以及至少基于所述未知商户与所述黑种子的相似度来确定所述未知商户属于潜在风险商户的最终得分。

【技术特征摘要】
1.一种基于相似度算法挖掘隐藏风险商户的方法,其特征在于,包括:确定黑种子,所述黑种子包括已知的风险商户或高置信度潜在风险商户或其组合;确定与所述黑种子有共同用户的未知商户;确定所述未知商户与所述黑种子的相似度;以及至少基于所述未知商户与所述黑种子的相似度来确定所述未知商户属于潜在风险商户的最终得分。2.如权利要求1所述的方法,其特征在于,确定与所述黑种子有共同用户的未知商户包括:确定在一时间段里与所述黑种子发生过交易的用户;以及关联出与所述黑种子发生过交易的用户在所述时间段里交易过的其他商户作为所述未知商户。3.如权利要求1所述的方法,其特征在于,所述相似度包括买家相似度,其中确定所述未知商户与所述黑种子的所述相似度包括:确定所述未知商户与所述黑种子的共同买家;以及基于所述共同买家的数量确定所述未知商户与所述黑种子的买家相似度。4.如权利要求1所述的方法,其特征在于,所述相似度包括金额相似度,其中确定所述未知商户与所述黑种子的所述相似度包括:确定所述未知商户的金额类别和所述黑种子的金额类别;以及确定所述未知商户的金额类别与所述黑种子的金额类别的相似度。5.如权利要求1所述的方法,其特征在于,所述相似度包括文本相似度,其中确定所述未知商户与所述黑种子的所述相似度包括:拆解所述未知商户的文本和所述黑种子的文本;以及基于所述拆解,确定所述未知商户的文本和所述黑种子的文本的文本相似度,其中文本包括商品名、转账附言、注释文本或其任何组合。6.如权利要求1所述的方法,其特征在于,所述相似度包括综合相似度,其中确定所述未知商户与所述黑种子的所述相似度包括:基于买家相似度、金额相似度和文本相似度的组合来确定所述综合相似度。7.如权利要求6所述的方法,其特征在于,所述综合相似度基于所述买家相似度,并由所述金额相似度和所述文本相似度进一步调节。8.如权利要求6所述的方法,其特征在于,所述综合相似度基于所述买家相似度、所述金额相似度和所述文本相似度的加权结合。9.如权利要求1所述的方法,其特征在于,至少基于所述未知商户与所述黑种子的相似度来确定所述未知商户属于潜在风险商户的最终得分包括:基于所述未知商户与所述黑种子的相似度和所述黑种子的置信度来确定所述最终得分。10.如权利要求1所述的方法,其特征在于,进一步包括:输出所述未知商户属于潜在风险商户的所述最终得分。11.如权利要求1所述的方法,其特征在于,进一步包括:将所述未知商户属于潜在风险商户的所述最终得分与阈值作比较;以及基于所述比较来确定是否要稽核所述未知商户。12.如权利要求9所述的方法,其特征在于,所述高置信度潜在风险商户基于策略或模型或其组合来确定,并且所述高置信度潜在风险商户的置信度基于所述策略的松紧程度或所述模型的打分或其组合。13.如权利要求9所述的方法,其特征在于,所述黑种子包括多个黑种子,并且所述基于所述未知商户与所述黑种子的相似度和所述黑种子的置信度来确定所述最终得分包括:基于所述未知商户与所述多个黑种子中的每一个黑种子的相似度和该黑种子的置信度来确定所述最终得分。14.如权利要求11所述的方法,其特征在于,进一步包括:如果确定要稽核所述未知商户,则将所述未知商户添加到所述黑种子中。15.一种基于相似度算法挖掘隐藏风险商户的装置,其特征在于,包括:用于确定黑种子的模块,所述黑种子包括已知的风险商户或高置信度潜在风险商户或其组合;用于确定与所述黑种子有共同用户的未知商户的模块;用于确定所述未知商户与所述黑种子的相似度的模块;以及用于至少基于所述未知商户与所述黑种子的相似度来确定所述未知商户属于潜在风险商户的最终得分的模块。16.如权利要求15所述的装置,其特征在于,用于确定与所述黑种子有共同用户的未知商户的模块包括:用于确定在一时间段里与所述黑种子发生过交易的用户的模块;以及用于关联出与所述黑...

【专利技术属性】
技术研发人员:刘晓韵王立
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1