【技术实现步骤摘要】
风险识别模型构建和风险识别方法、装置及设备
本说明书涉及数据挖掘
,尤其涉及一种风险识别模型构建和风险识别方法、装置及设备。
技术介绍
在大数据时代,数据挖掘和机器学习技术逐渐被应用于各种领域以解决实际问题。例如根据大量的真实用户数据或事件数据建立模型,从而实现对新用户或新事件的各种未知情况的预测。以金融行业的风控场景为例,通过对已定性风险事件的参与用户进行分析,可以挖掘各种用户特征与风险事件的潜在关系,形成用户特征与风险的关系模型,即预测“什么样的用户或用户行为更容易导致风险事件”,从而提前采取各种措施,以避免或减少风险事件的发生。
技术实现思路
针对上述技术问题,本说明书实施例提供一种风险识别模型构建和风险识别方法、装置及设备,技术方案如下:根据本说明书实施例的第一方面,提供一种风险识别模型构建方法,包括:从给定用户的数据中,提取特定事件发生前预设时长内的用户状态记录,所述用户状态记录包括:用户的操作行为和/或系统事件,所述特定事件为已确定风险类型的事件;按照发生时间对所提取到的用户状态记录进行排序,根据排序结果生成针对所述特定事件的用户状态序列;将所生成的用户状态序列转换为序列特征;以所得到的序列特征作为特征值、所述事件风险类型作为标签值,构成风险识别样本数据,并利用至少一条样本数据构建风险识别模型。根据本说明书实施例的第二方面,提供一种风险识别方法,包括:从目标用户的数据中,提取该目标用户在给定时长内的用户状态记录,所述用户状态记录包括:用户的操作行为和/或系统事件;按照发生时间对所述用户状态记录进行排序,根据排序结果生成用户状态序列;将所生成的 ...
【技术保护点】
一种风险识别模型构建方法,包括:从给定用户的数据中,提取特定事件发生前预设时长内的用户状态记录,所述用户状态记录包括:用户的操作行为和/或系统事件,所述特定事件为已确定风险类型的事件;按照发生时间对所提取到的用户状态记录进行排序,根据排序结果生成针对所述特定事件的用户状态序列;将所生成的用户状态序列转换为序列特征;以所得到的序列特征作为特征值、所述事件风险类型作为标签值,构成风险识别样本数据,并利用至少一条样本数据构建风险识别模型。
【技术特征摘要】
1.一种风险识别模型构建方法,包括:从给定用户的数据中,提取特定事件发生前预设时长内的用户状态记录,所述用户状态记录包括:用户的操作行为和/或系统事件,所述特定事件为已确定风险类型的事件;按照发生时间对所提取到的用户状态记录进行排序,根据排序结果生成针对所述特定事件的用户状态序列;将所生成的用户状态序列转换为序列特征;以所得到的序列特征作为特征值、所述事件风险类型作为标签值,构成风险识别样本数据,并利用至少一条样本数据构建风险识别模型。2.根据权利要求1所述的方法,所述根据排序结果生成针对所述特定事件的用户状态序列,包括:在所述排序结果中,根据第i次用户状态与第i+1次用户状态的间隔时长,将第i次用户状态转化为携带所述间隔时长信息的用户状态。3.根据权利要求1所述的方法,所述根据排序结果生成针对所述特定事件的用户状态序列,包括:在所述排序结果中,根据预先对第i次用户状态的评估结果,将第i次用户状态转化为携带所述评估结果信息的用户状态。4.根据权利要求1所述的方法,所述根据排序结果生成针对所述特定事件的用户状态序列,包括:根据预设的过滤规则,对所述排序结果中的用户状态进行过滤。5.根据权利要求1所述的方法,所述将所生成的用户状态序列转换为序列特征,包括:将所生成的用户状态序列编码为序列向量。6.根据权利要求5所述的方法,所述将所生成的用户状态序列编码为序列向量,包括:根据第一编码规则,将所述用户状态序列中的每一个状态分别编码为状态向量;利用神经网络将状态向量所构成的序列编码为序列向量。7.根据权利要求5所述的方法,在将所生成的用户状态序列转换为序列特征之前,还包括:从多条用户状态序列中挖掘频繁序列项集;对于所述频繁序列项集中的每一频繁序列项,根据所述频繁序列项对应的黑白样本分布情况,确定所述频繁序列项对应的特征值;所述将所生成的用户状态序列转换为序列特征,包括:基于所述频繁序列项集,确定生成的用户状态序列中包含的频繁序列项;根据所述用户状态序列中包含的频繁序列项和预先确定的各频繁序列项对应的特征值,确定与所述用户状态序列对应的序列特征。8.一种风险识别方法,包括:从目标用户的数据中,提取该目标用户在给定时长内的用户状态记录,所述用户状态记录包括:用户的操作行为和/或系统事件;按照发生时间对所述用户状态记录进行排序,根据排序结果生成用户状态序列;将所生成的用户状态序列转换为序列特征;将所述序列特征作为预先构建的风险识别模型的输入,输出风险识别结果。9.根据权利要求8所述的方法,所述根据排序结果生成用户状态序列,包括:在所述排序结果中,根据第i次用户状态与第i+1次用户状态的间隔时长,将第i次用户状态转化为携带所述间隔时长信息的用户状态。10.根据权利要求8所述的方法,所述根据排序结果生成用户状态序列,包括:在所述排序结果中,根据预先对第i次用户状态的评估结果,将第i次用户状态转化为携带所述评估结果信息的用户状态。11.根据权利要求8所述的方法,所述根据排序结果生成用户状态序列,包括:根据预设的过滤规则,对所述排序结果中的用户状态进行过滤。12.一种风险识别模型构建装置,包括:提取...
【专利技术属性】
技术研发人员:程羽,陆青,傅欣艺,陈弢,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。