用户风险数据挖掘方法和装置制造方法及图纸

技术编号:13894422 阅读:78 留言:0更新日期:2016-10-24 20:54
本发明专利技术公开了一种用户风险数据挖掘方法和装置,涉及数据处理领域。其中的用户风险数据挖掘方法包括:获取待测用户的行为信息,行为信息包括行为事件和行为事件的时间属性;根据待测用户的行为信息中各个行为事件的时间属性确定待测用户的行为事件之间的时序关联关系;根据待测用户的行为事件之间的时序关联关系和预先确定的风险样本用户的行为事件之间的时序关联关系确定待测用户的风险度。本发明专利技术根据待测用户的行为事件之间的时序关联关系和预先确定的风险样本用户的行为事件之间的时序关联关系确定待测用户的风险度,在参考了用户的行为事件的基础上,还考虑了行为事件之间的时序关系,使风险数据挖掘的结果更加准确。

【技术实现步骤摘要】

本专利技术涉及数据处理领域,特别涉及一种用户风险数据挖掘方法和装置
技术介绍
风险数据挖掘对于加强用户风险管理、提高营业收益、保护用户权益和改善用户满意度是十分必要的。由于用户固有的行为习惯、行为目的等具有一定的规律性,体现为某种固定的模式,这种模式对于识别风险用户具有重要参考意义。目前,使用决策树分析法进行用户风险数据的挖掘,即只根据用户的不同行为事件对用户进行分类,并根据分类结果对用户的风险概率进行预测。这种方法无法准确地衡量用户的风险度。
技术实现思路
本专利技术实施例所要解决的一个技术问题是:提供一种准确的用户风险数据挖掘方法。根据本专利技术实施例的一个方面,提供一种用户风险数据挖掘方法,包括:获取待测用户的行为信息,行为信息包括行为事件和行为事件的时间属性;根据待测用户的行为信息中各个行为事件的时间属性确定待测用户的行为事件之间的时序关联关系;根据待测用户的行为事件之间的时序关联关系和预先确定的风险样本用户的行为事件之间的时序关联关系确定待测用户的风险度。根据本专利技术实施例的第二个方面,提供一种用户风险数据挖掘装置,包括:待测行为信息获取模块,用于获取待测用户的行为信息,行为信息包括行为事件和行为事件的时间属性;待测时序关联关系生成模
块,用于根据待测用户的行为信息中各个行为事件的时间属性确定待测用户的行为事件之间的时序关联关系;风险度确定模块,用于根据待测用户的行为事件之间的时序关联关系和预先确定的风险样本用户的行为事件之间的时序关联关系确定待测用户的风险度。根据本专利技术实施例的第三个方面,提供一种用户风险数据挖掘装置,其特征在于,包括:存储器;以及,耦接至存储器的处理器,处理器被配置为基于存储在存储器中的指令,执行前述任意一种用户风险数据挖掘方法。本专利技术根据待测用户的行为事件之间的时序关联关系和预先确定的风险样本用户的行为事件之间的时序关联关系确定待测用户的风险度,在参考了用户的行为事件的基础上,还考虑了行为事件之间的时序关系,从而使风险数据挖掘的结果更加准确。通过以下参照附图对本专利技术的示例性实施例的详细描述,本专利技术的其它特征及其优点将会变得清楚。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术用户风险数据挖掘方法一个实施例的流程图。图2为本专利技术用户风险数据挖掘方法的另一个实施例的流程图。图3为本专利技术用户风险数据挖掘方法的又一个实施例的流程图。图4为本专利技术用户风险数据挖掘装置的一个实施例的结构图。图5为本专利技术用户风险数据挖掘装置的另一个实施例的结构图。图6为本专利技术用户风险数据挖掘装置的又一个实施例的结构图。图7为本专利技术用户风险数据挖掘装置的再一个实施例的结构图。图8为本专利技术用户风险数据挖掘装置的再一个实施例的结构图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本专利技术及其应用或使用的任何限制。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。专利技术人发现,用户的一系列行为事件以及行为事件的发生时间可以体现用户的特性。以电商购物的场景为例,具有以下一系列行为的用户很可能是风险用户。例如,用户在登录后先查看余额、积分,然后购买大量的无需收货地址的虚拟商品,如电话充值卡、游戏充值卡等等,以用尽余额和积分。普通用户在购买时往往先进行大致的浏览,而上述用户首先查看账户已有的财产情况,因此极有可能是盗号者,属于风险用户。又例如,用户在登录后首先集中浏览主商品和相应的赠品、凑单活动,然后查看主商品和相应的赠品所属的商品品类,对所属品类差异大的、可能分不同的仓库存储的商品进行下单;然后用户会选择货到付款和有货先发;最后,在到货的第一时间对主商品进行拒收或退货。此类用户很可能为恶意凑单用户,利用不同品类的商品异地存储的特点,尽可能加大到货的时间差,从而减少付款成本,套取赠品。此类用户也属于风险用户。上述各个行为事件需要基于行为时间的发生时间才能够体现用户的风险特征。由此,本专利技术提出了一种基于时序关联关系的用户风险数据挖掘方法,可以根据已知的风险用户的行为事件之间的时序关联关系确定待测用户的风险度。图1为本专利技术用户风险数据挖掘方法一个实施例的流程图。如图1所示,该实施例的方法包括:步骤S102,获取待测用户的行为信息,行为信息包括行为事件和
行为事件的时间属性。用户的行为信息是指与用户在当前业务场景下的各个行为有关的信息,包括行为事件和行为事件的时间属性,根据需要,还可以包括用户标识、业务标识等等。行为事件是指用户行为的具体内容。例如,对于电商网站的用户,浏览商品、查看余额、收藏商品等均可以作为行为事件。行为事件的细致程度可以根据需求确定,例如可以将购买商品作为一个行为事件,也可以将购买生活用品、购买充值卡、购买服饰分别作为独立的行为事件。时间属性是指可以代表行为事件的发生时间的信息。例如,用户在15:00查看余额,则可以将15:00直接作为“查看余额”这一行为事件的时间属性,也可以将上述发生时间在多个行为信息中的时间统计特性或变化特性作为行为事件的时间属性。步骤S104,根据待测用户的行为信息中各个行为事件的时间属性确定待测用户的行为事件之间的时序关联关系。时序关联关系是一种基于时间顺序的行为事件之间的关联关系。以(行为事件,时间属性)的格式表示行为信息中的一个行为,设用户1有如下行为信息:{(A,1),(B,2),(C,3),(D,4),(B,5)本文档来自技高网
...

【技术保护点】
一种用户风险数据挖掘方法,其特征在于,包括:获取待测用户的行为信息,所述行为信息包括行为事件和行为事件的时间属性;根据待测用户的行为信息中各个行为事件的时间属性确定待测用户的行为事件之间的时序关联关系;根据待测用户的行为事件之间的时序关联关系和预先确定的风险样本用户的行为事件之间的时序关联关系确定待测用户的风险度。

【技术特征摘要】
1.一种用户风险数据挖掘方法,其特征在于,包括:获取待测用户的行为信息,所述行为信息包括行为事件和行为事件的时间属性;根据待测用户的行为信息中各个行为事件的时间属性确定待测用户的行为事件之间的时序关联关系;根据待测用户的行为事件之间的时序关联关系和预先确定的风险样本用户的行为事件之间的时序关联关系确定待测用户的风险度。2.根据权利要求1所述的方法,其特征在于,所述根据待测用户的行为事件之间的时序关联关系和预先确定的风险样本用户的行为事件之间的时序关联关系确定待测用户的风险度包括:确定待测用户的行为事件之间的时序关联关系和预先确定的风险样本用户的行为事件之间的时序关联关系之间的相似度;根据所述相似度确定待度量用户的风险度。3.根据权利要求1所述的方法,其特征在于,采用以下方法预先确定风险样本用户的行为事件之间的时序关联关系:获取风险样本用户的行为信息,所述行为信息包括行为事件和行为事件的时间属性;根据风险样本用户的行为信息中各个行为事件及其时间属性,确定风险样本用户的行为事件之间的时序关联关系。4.根据权利要求1-3中任一项所述的方法,其特征在于,所述行为事件之间的时序关联关系包括按照行为事件发生时间排列的各个行为事件,或者,所述行为事件之间的时序关联关系包括按照行为事件发生时间排列的各个行为事件,以及所述各个行为事件的发生时间间隔。5.根据权利要求3所述的方法,其特征在于,还包括:确定风险样本用户的行为事件之间的时序关联关系中行为事件之间的关联程度;依据所述关联程度选择风险样本用户的行为事件之间的高风险的时序关联关系;根据待测用户的行为事件之间的时序关联关系和预先确定的风险样本用户的行为事件之间的高风险的时序关联关系确定待测用户的风险度。6.根据权利要求5所述的方法,其特征在于,所述确定风险样本用户的行为事件之间的时序关联关系中行为事件之间的关联程度包括:根据风险样本用户的行为事件之间的时序关联关系在所述行为信息中出现的频繁程度,确定风险样本用户的行为事件之间的时序关联关系中行为事件之间的关联程度。7.根据权利要求5所述的方法,其特征在于,所述确定风险样本用户的行为事件之间的时序关联关系中行为事件之间的关联程度包括:根据风险样本用户的行为事件之间的时序关联关系在所述行为信息中的支持度和/或置信度,确定风险样本用户的行为事件之间的时序关联关系中行为事件之间的关联程度;其中,所述支持度根据第一数值在第二数值中的占比确定,所述置信度根据第一数值在第三数值中的占比确定;其中,所述第一数值为待确定的行为事件之间的时序关联关系在行为信息中出现的总次数;所述第二数值为所述行为信息中所有行为事件之间的时序关联关系的总数;所述第三数值为具有待确定的时序关联关系中在先发生的行为事件的时序关联关系的总数。8.根据权利要求3所述的方法,其特征在于,还包括:获取非风险样本用户的行为信息,所述行为信息包括行为事件和行为事件的时间属性;根据非风险样本用户的行为信息中各个行为事件的时间属性,确定非风险样本用户的行为事件之间的第一时序关联关系;计算风险样本用户的风险值高于预设值的第二时序关联关系与非
\t风险样本用户的风险值低于预设值的第一时序关联关系的相似度;去除风险样本用户的行为事件之间的时序关联关系中,所述相似度大于预设值的第二时序关联关系;以及根据待测用户的行为事件之间的时序关联关系和未被去除的风险样本用户的行为事件之间的时序关联关系,确定待测用户的风险度。9.根据权利要求8所述的方法,其特征在于,采用以下方法确定第一时序关联关系和/或第二时序关联关系的风险值:根据第一时序关联关系中行为事件之间的关联程度确定第一时序关联关系的风险值;或者,根据第二时序关联关系中行为事件之间的关联程度确定第二时序关联关系的风险值。10.根据权利要求3所述的方法,其特征在于,所述获取风险样本用户的行为信息包括:将按照行为事件的发生时间排序的风险样本用户的行为信息分割成若干子区间;根据每个子区间中行为信息的行为事件发生时间确定该子区间的时间特征;将每个子区间的时间特征作为该子区间中各个行为时间的时间属性。11.根据权利要求3所述的方法,其特征在于,所述获取风险样本用户的行为信息包括:获取若干风险样本用户的行为信息;比较不同的行为信息之间的相似度;对相似度高于预设值的不同的行为信息进行合并。12.一种用户风险数据挖掘装置,其特征在于,包括:待测行为信息获取模块,用于获取待测用户的行为信息,所述行为信息包括行为事件和行为事件的时间属性;待测时序关联关系生成模块,用于根据待测用户的行为信息中各
\t个行为事件的时间属性确定待测用户的行为事件之间的时序关联关系;风险度确定模块,用于根据待测用户的行为事件之间的时序关联关系和预先确定的风险样本用户的行为事件之间的时序关联关系确定待测用户的...

【专利技术属性】
技术研发人员:刘朋飞李爱华葛胜利
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1