【技术实现步骤摘要】
本专利技术涉及数据处理领域,特别涉及一种用户风险数据挖掘方法和装置。
技术介绍
风险数据挖掘对于加强用户风险管理、提高营业收益、保护用户权益和改善用户满意度是十分必要的。由于用户固有的行为习惯、行为目的等具有一定的规律性,体现为某种固定的模式,这种模式对于识别风险用户具有重要参考意义。目前,使用决策树分析法进行用户风险数据的挖掘,即只根据用户的不同行为事件对用户进行分类,并根据分类结果对用户的风险概率进行预测。这种方法无法准确地衡量用户的风险度。
技术实现思路
本专利技术实施例所要解决的一个技术问题是:提供一种准确的用户风险数据挖掘方法。根据本专利技术实施例的一个方面,提供一种用户风险数据挖掘方法,包括:获取待测用户的行为信息,行为信息包括行为事件和行为事件的时间属性;根据待测用户的行为信息中各个行为事件的时间属性确定待测用户的行为事件之间的时序关联关系;根据待测用户的行为事件之间的时序关联关系和预先确定的风险样本用户的行为事件之间的时序关联关系确定待测用户的风险度。根据本专利技术实施例的第二个方面,提供一种用户风险数据挖掘装置,包括:待测行为信息获取模块,用于获取待测用户的行为信息,行为信息包括行为事件和行为事件的时间属性;待测时序关联关系生成模
块,用于根据待测用户的行为信息中各个行为事件的时间属性确定待测用户的行为事件之间的时序关联关系;风险度确定模块,用于根据待测用户的行为事件之间的时序关联关系和预先确定的风险样本用户的行为事件之间的时序关联关系确定待测用户的风险度。根据本专利技术实施例的第三个方面,提供一种用户风险数据挖掘装置,其特 ...
【技术保护点】
一种用户风险数据挖掘方法,其特征在于,包括:获取待测用户的行为信息,所述行为信息包括行为事件和行为事件的时间属性;根据待测用户的行为信息中各个行为事件的时间属性确定待测用户的行为事件之间的时序关联关系;根据待测用户的行为事件之间的时序关联关系和预先确定的风险样本用户的行为事件之间的时序关联关系确定待测用户的风险度。
【技术特征摘要】
1.一种用户风险数据挖掘方法,其特征在于,包括:获取待测用户的行为信息,所述行为信息包括行为事件和行为事件的时间属性;根据待测用户的行为信息中各个行为事件的时间属性确定待测用户的行为事件之间的时序关联关系;根据待测用户的行为事件之间的时序关联关系和预先确定的风险样本用户的行为事件之间的时序关联关系确定待测用户的风险度。2.根据权利要求1所述的方法,其特征在于,所述根据待测用户的行为事件之间的时序关联关系和预先确定的风险样本用户的行为事件之间的时序关联关系确定待测用户的风险度包括:确定待测用户的行为事件之间的时序关联关系和预先确定的风险样本用户的行为事件之间的时序关联关系之间的相似度;根据所述相似度确定待度量用户的风险度。3.根据权利要求1所述的方法,其特征在于,采用以下方法预先确定风险样本用户的行为事件之间的时序关联关系:获取风险样本用户的行为信息,所述行为信息包括行为事件和行为事件的时间属性;根据风险样本用户的行为信息中各个行为事件及其时间属性,确定风险样本用户的行为事件之间的时序关联关系。4.根据权利要求1-3中任一项所述的方法,其特征在于,所述行为事件之间的时序关联关系包括按照行为事件发生时间排列的各个行为事件,或者,所述行为事件之间的时序关联关系包括按照行为事件发生时间排列的各个行为事件,以及所述各个行为事件的发生时间间隔。5.根据权利要求3所述的方法,其特征在于,还包括:确定风险样本用户的行为事件之间的时序关联关系中行为事件之间的关联程度;依据所述关联程度选择风险样本用户的行为事件之间的高风险的时序关联关系;根据待测用户的行为事件之间的时序关联关系和预先确定的风险样本用户的行为事件之间的高风险的时序关联关系确定待测用户的风险度。6.根据权利要求5所述的方法,其特征在于,所述确定风险样本用户的行为事件之间的时序关联关系中行为事件之间的关联程度包括:根据风险样本用户的行为事件之间的时序关联关系在所述行为信息中出现的频繁程度,确定风险样本用户的行为事件之间的时序关联关系中行为事件之间的关联程度。7.根据权利要求5所述的方法,其特征在于,所述确定风险样本用户的行为事件之间的时序关联关系中行为事件之间的关联程度包括:根据风险样本用户的行为事件之间的时序关联关系在所述行为信息中的支持度和/或置信度,确定风险样本用户的行为事件之间的时序关联关系中行为事件之间的关联程度;其中,所述支持度根据第一数值在第二数值中的占比确定,所述置信度根据第一数值在第三数值中的占比确定;其中,所述第一数值为待确定的行为事件之间的时序关联关系在行为信息中出现的总次数;所述第二数值为所述行为信息中所有行为事件之间的时序关联关系的总数;所述第三数值为具有待确定的时序关联关系中在先发生的行为事件的时序关联关系的总数。8.根据权利要求3所述的方法,其特征在于,还包括:获取非风险样本用户的行为信息,所述行为信息包括行为事件和行为事件的时间属性;根据非风险样本用户的行为信息中各个行为事件的时间属性,确定非风险样本用户的行为事件之间的第一时序关联关系;计算风险样本用户的风险值高于预设值的第二时序关联关系与非
\t风险样本用户的风险值低于预设值的第一时序关联关系的相似度;去除风险样本用户的行为事件之间的时序关联关系中,所述相似度大于预设值的第二时序关联关系;以及根据待测用户的行为事件之间的时序关联关系和未被去除的风险样本用户的行为事件之间的时序关联关系,确定待测用户的风险度。9.根据权利要求8所述的方法,其特征在于,采用以下方法确定第一时序关联关系和/或第二时序关联关系的风险值:根据第一时序关联关系中行为事件之间的关联程度确定第一时序关联关系的风险值;或者,根据第二时序关联关系中行为事件之间的关联程度确定第二时序关联关系的风险值。10.根据权利要求3所述的方法,其特征在于,所述获取风险样本用户的行为信息包括:将按照行为事件的发生时间排序的风险样本用户的行为信息分割成若干子区间;根据每个子区间中行为信息的行为事件发生时间确定该子区间的时间特征;将每个子区间的时间特征作为该子区间中各个行为时间的时间属性。11.根据权利要求3所述的方法,其特征在于,所述获取风险样本用户的行为信息包括:获取若干风险样本用户的行为信息;比较不同的行为信息之间的相似度;对相似度高于预设值的不同的行为信息进行合并。12.一种用户风险数据挖掘装置,其特征在于,包括:待测行为信息获取模块,用于获取待测用户的行为信息,所述行为信息包括行为事件和行为事件的时间属性;待测时序关联关系生成模块,用于根据待测用户的行为信息中各
\t个行为事件的时间属性确定待测用户的行为事件之间的时序关联关系;风险度确定模块,用于根据待测用户的行为事件之间的时序关联关系和预先确定的风险样本用户的行为事件之间的时序关联关系确定待测用户的...
【专利技术属性】
技术研发人员:刘朋飞,李爱华,葛胜利,
申请(专利权)人:北京京东尚科信息技术有限公司,北京京东世纪贸易有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。