【技术实现步骤摘要】
一种基于相似度算法挖掘隐藏风险商户的方法和装置
本公开涉及风险控制,尤其涉及隐藏风险商户的挖掘。
技术介绍
风险商户(诸如赌博幕后庄家)在巨大的收入利益驱使下,为了规避被发现并稽核,会在一定成本下模仿真实交易场景。近期发现,风险商户会通过各种非法渠道控制并运营各种平台的大量收款码。例如,在赌博场景中,当用户多次向赌博幕后庄家充值(例如,购买筹码)时,庄家APP会把交易随机分配到不同的收款码,从而伪造出该用户去各种不同的商户消费付款的数据假象,以试图躲避常规的风控识别策略。因此,本领域中需要改进的风控识别技术来挖掘出隐藏在真实交易场景假象背后的风险商户。
技术实现思路
本公开的一方面涉及一种基于相似度算法挖掘隐藏风险商户的方法,包括:确定黑种子,所述黑种子包括已知的风险商户或高置信度潜在风险商户或其组合;确定与所述黑种子有共同用户的未知商户;确定所述未知商户与所述黑种子的相似度;以及至少基于所述未知商户与所述黑种子的相似度来确定所述未知商户属于潜在风险商户的最终得分。根据一示例性实施例,确定与所述黑种子有共同用户的未知商户包括:确定在一时间段里与所述黑种子发生过交易的用户;以及关联出与所述黑种子发生过交易的用户在所述时间段里交易过的其他商户作为所述未知商户。根据一示例性实施例,所述相似度包括买家相似度,其中确定所述未知商户与所述黑种子的所述相似度包括:确定所述未知商户与所述黑种子的共同买家;以及基于所述共同买家的数量确定所述未知商户与所述黑种子的买家相似度。根据另一示例性实施例,所述相似度包括金额相似度,其中确定所述未知商户与所述黑种子的所述相似度包括:确定所述 ...
【技术保护点】
1.一种基于相似度算法挖掘隐藏风险商户的方法,其特征在于,包括:确定黑种子,所述黑种子包括已知的风险商户或高置信度潜在风险商户或其组合;确定与所述黑种子有共同用户的未知商户;确定所述未知商户与所述黑种子的相似度;以及至少基于所述未知商户与所述黑种子的相似度来确定所述未知商户属于潜在风险商户的最终得分。
【技术特征摘要】
1.一种基于相似度算法挖掘隐藏风险商户的方法,其特征在于,包括:确定黑种子,所述黑种子包括已知的风险商户或高置信度潜在风险商户或其组合;确定与所述黑种子有共同用户的未知商户;确定所述未知商户与所述黑种子的相似度;以及至少基于所述未知商户与所述黑种子的相似度来确定所述未知商户属于潜在风险商户的最终得分。2.如权利要求1所述的方法,其特征在于,确定与所述黑种子有共同用户的未知商户包括:确定在一时间段里与所述黑种子发生过交易的用户;以及关联出与所述黑种子发生过交易的用户在所述时间段里交易过的其他商户作为所述未知商户。3.如权利要求1所述的方法,其特征在于,所述相似度包括买家相似度,其中确定所述未知商户与所述黑种子的所述相似度包括:确定所述未知商户与所述黑种子的共同买家;以及基于所述共同买家的数量确定所述未知商户与所述黑种子的买家相似度。4.如权利要求1所述的方法,其特征在于,所述相似度包括金额相似度,其中确定所述未知商户与所述黑种子的所述相似度包括:确定所述未知商户的金额类别和所述黑种子的金额类别;以及确定所述未知商户的金额类别与所述黑种子的金额类别的相似度。5.如权利要求1所述的方法,其特征在于,所述相似度包括文本相似度,其中确定所述未知商户与所述黑种子的所述相似度包括:拆解所述未知商户的文本和所述黑种子的文本;以及基于所述拆解,确定所述未知商户的文本和所述黑种子的文本的文本相似度,其中文本包括商品名、转账附言、注释文本或其任何组合。6.如权利要求1所述的方法,其特征在于,所述相似度包括综合相似度,其中确定所述未知商户与所述黑种子的所述相似度包括:基于买家相似度、金额相似度和文本相似度的组合来确定所述综合相似度。7.如权利要求6所述的方法,其特征在于,所述综合相似度基于所述买家相似度,并由所述金额相似度和所述文本相似度进一步调节。8.如权利要求6所述的方法,其特征在于,所述综合相似度基于所述买家相似度、所述金额相似度和所述文本相似度的加权结合。9.如权利要求1所述的方法,其特征在于,至少基于所述未知商户与所述黑种子的相似度来确定所述未知商户属于潜在风险商户的最终得分包括:基于所述未知商户与所述黑种子的相似度和所述黑种子的置信度来确定所述最终得分。10.如权利要求1所述的方法,其特征在于,进一步包括:输出所述未知商户属于潜在风险商户的所述最终得分。11.如权利要求1所述的方法,其特征在于,进一步包括:将所述未知商户属于潜在风险商户的所述最终得分与阈值作比较;以及基于所述比较来确定是否要稽核所述未知商户。12.如权利要求9所述的方法,其特征在于,所述高置信度潜在风险商户基于策略或模型或其组合来确定,并且所述高置信度潜在风险商户的置信度基于所述策略的松紧程度或所述模型的打分或其组合。13.如权利要求9所述的方法,其特征在于,所述黑种子包括多个黑种子,并且所述基于所述未知商户与所述黑种子的相似度和所述黑种子的置信度来确定所述最终得分包括:基于所述未知商户与所述多个黑种子中的每一个黑种子的相似度和该黑种子的置信度来确定所述最终得分。14.如权利要求11所述的方法,其特征在于,进一步包括:如果确定要稽核所述未知商户,则将所述未知商户添加到所述黑种子中。15.一种基于相似度算法挖掘隐藏风险商户的装置,其特征在于,包括:用于确定黑种子的模块,所述黑种子包括已知的风险商户或高置信度潜在风险商户或其组合;用于确定与所述黑种子有共同用户的未知商户的模块;用于确定所述未知商户与所述黑种子的相似度的模块;以及用于至少基于所述未知商户与所述黑种子的相似度来确定所述未知商户属于潜在风险商户的最终得分的模块。16.如权利要求15所述的装置,其特征在于,用于确定与所述黑种子有共同用户的未知商户的模块包括:用于确定在一时间段里与所述黑种子发生过交易的用户的模块;以及用于关联出与所述黑...
【专利技术属性】
技术研发人员:刘晓韵,王立,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。