风险识别模型构建和风险识别方法、装置及设备制造方法及图纸

技术编号:17655942 阅读:40 留言:0更新日期:2018-04-08 08:57
公开了一种风险识别模型构建和风险识别方法、装置及设备。所述风险识别方法包括:获取目标用户在给定时长内的用户状态记录,所述用户状态记录包括:用户的操作行为和/或系统事件;按照发生时间对所述用户状态记录进行排序,根据排序结果生成用户状态序列;将所生成的用户状态序列转换为序列特征;将所述序列特征作为预先构建的风险识别模型的输入,输出风险识别结果。

【技术实现步骤摘要】
风险识别模型构建和风险识别方法、装置及设备
本说明书涉及数据挖掘
,尤其涉及一种风险识别模型构建和风险识别方法、装置及设备。
技术介绍
在大数据时代,数据挖掘和机器学习技术逐渐被应用于各种领域以解决实际问题。例如根据大量的真实用户数据或事件数据建立模型,从而实现对新用户或新事件的各种未知情况的预测。以金融行业的风控场景为例,通过对已定性风险事件的参与用户进行分析,可以挖掘各种用户特征与风险事件的潜在关系,形成用户特征与风险的关系模型,即预测“什么样的用户或用户行为更容易导致风险事件”,从而提前采取各种措施,以避免或减少风险事件的发生。
技术实现思路
针对上述技术问题,本说明书实施例提供一种风险识别模型构建和风险识别方法、装置及设备,技术方案如下:根据本说明书实施例的第一方面,提供一种风险识别模型构建方法,包括:从给定用户的数据中,提取特定事件发生前预设时长内的用户状态记录,所述用户状态记录包括:用户的操作行为和/或系统事件,所述特定事件为已确定风险类型的事件;按照发生时间对所提取到的用户状态记录进行排序,根据排序结果生成针对所述特定事件的用户状态序列;将所生成的用户状态序列转换为序列特征;以所得到的序列特征作为特征值、所述事件风险类型作为标签值,构成风险识别样本数据,并利用至少一条样本数据构建风险识别模型。根据本说明书实施例的第二方面,提供一种风险识别方法,包括:从目标用户的数据中,提取该目标用户在给定时长内的用户状态记录,所述用户状态记录包括:用户的操作行为和/或系统事件;按照发生时间对所述用户状态记录进行排序,根据排序结果生成用户状态序列;将所生成的用户状态序列转换为序列特征;将所述序列特征作为预先构建的风险识别模型的输入,输出风险识别结果。根据本说明书实施例的第三方面,提供一种风险识别模型构建装置,包括:提取单元,从给定用户的数据中,提取特定事件发生前预设时长内的用户状态记录,所述用户状态记录包括:用户的操作行为和/或系统事件,所述特定事件为已确定风险类型的事件;序列生成单元,按照发生时间对所提取到的用户状态记录进行排序,根据排序结果生成针对所述特定事件的用户状态序列;特征转换单元,将所生成的用户状态序列转换为序列特征;模型构建单元,以所得到的序列特征作为特征值、所述事件风险类型作为标签值,构成风险识别样本数据,并利用至少一条样本数据构建风险识别模型。根据本说明书实施例的第四方面,提供一种风险识别装置,包括:获取单元,从目标用户的数据中,提取该目标用户在给定时长内的用户状态记录,所述用户状态记录包括:用户的操作行为和/或系统事件;序列生成单元,按照发生时间对所述用户状态记录进行排序,根据排序结果生成用户状态序列;特征转换单元,将所生成的用户状态序列转换为序列特征;输出单元,将所述序列特征作为预先构建的风险识别模型的输入,输出风险识别结果。根据本说明书实施例的第五方面,提供一种计算机设备,包括:处理器;用于存储处理器可执行指令的存储器;所述处理器被配置为:从给定用户的数据中,提取特定事件发生前预设时长内的用户状态记录,所述用户状态记录包括:用户的操作行为和/或系统事件,所述特定事件为已确定风险类型的事件;按照发生时间对所提取到的用户状态记录进行排序,根据排序结果生成针对所述特定事件的用户状态序列;将所生成的用户状态序列转换为序列特征;以所得到的序列特征作为特征值、所述事件风险类型作为标签值,构成风险识别样本数据,并利用至少一条样本数据构建风险识别模型。根据本说明书实施例的第六方面,提供一种计算机设备,包括:处理器;用于存储处理器可执行指令的存储器;所述处理器被配置为:从目标用户的数据中,提取该目标用户在给定时长内的用户状态记录,所述用户状态记录包括:用户的操作行为和/或系统事件;按照发生时间对所述用户状态记录进行排序,根据排序结果生成用户状态序列;将所生成的用户状态序列转换为序列特征;将所述序列特征作为预先构建的风险识别模型的输入,输出风险识别结果。本说明书实施例所提供的技术方案所产生的效果包括:通过挖掘用户状态序列和风险事件之间的潜在关系,来构建风险识别模型,在风险识别阶段,则可基于所述风险识别模型和提取到的待识别用户的用户状态序列,来预测待识别用户所作的特定事件或该用户本身的风险,提高了风控体系对于风险的识别能力。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本说明书实施例。此外,本说明书实施例中的任一实施例并不需要达到上述的全部效果。附图说明为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。图1是本说明书实施例的风险模型构建方法的流程示意图;图2是本说明书实施例的风险识别方法的流程示意图;图3是本说明书实施例的风险模型构建装置的结构示意图;图4是本说明书实施例的风险识别装置的结构示意图;图5是用于配置本说明书实施例装置的一种设备的结构示意图。具体实施方式为了使本领域技术人员更好地理解本说明书实施例中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行详细地描述,显然,所描述的实施例仅仅是本说明书的一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于保护的范围。为了实现风险识别,可以利用大量的已定性事件作为样本,训练得到“用户特征-风险分值”的对应关系。常用的用户特征一般可以分为静态特征和行为特征两类,在金融领域,与风险相关的静态特征可以包括用户的资产信息、认证信息、社交关系信息等等,而行为特征则可以包括用户在平台上的各种行为,例如点击、浏览、转账、存取操作等等。相对于静态特征而言,行为特征往往更适合进行风险预测。例如,一名普通用户和一名欺诈者,通过静态特征可能并不容易进行有效区别。但是,由于在欺诈行为之前,欺诈者往往会进行一些准备活动,因此在欺诈行为发生前经常会做哪些操作、操作的次数、频率等等,都能够在一定程度上刻画和表达出欺诈者的动机。更进一步讲,用户的行为特征除了包含行为事件本身(即用户做过哪些事)之外,还可以包含与这些事件相关联的时间信息,例如,两名用户在过去1小时内的行为序列分别为:用户1:A→B→C→D用户2:B→C→A→D可以看出,虽然两个序列中都包含了同样的行为事件,但因发生顺序不同而形成两种不同的行为模式,实际应用中,两种不同的行为模式所导致的后续结果也可能是完全不同的。因此,随着当今盗用和反盗用之间攻防的不断升级,对盗用行为特征的刻画能力提出了新要求,在风险预测时,可以将用户行为的时间特征纳入风险预测模型的训练,以进一步提升风控效果。出于以上考虑,本说明书实施例提供一种风险识别方案,该方案包括两个阶段:风险识别模型的构建阶段和运用风险识别模型进行风险识别的阶段。首先介绍风险识别模型的构建阶段,参见图1所示,一种风险识别模型构建方法可以包括以下步骤101~104,其中:步骤101,从给定用户的数据中,提取特定事件发生前预设时长内的用户状态记录。模型的构建是基本文档来自技高网...
风险识别模型构建和风险识别方法、装置及设备

【技术保护点】
一种风险识别模型构建方法,包括:从给定用户的数据中,提取特定事件发生前预设时长内的用户状态记录,所述用户状态记录包括:用户的操作行为和/或系统事件,所述特定事件为已确定风险类型的事件;按照发生时间对所提取到的用户状态记录进行排序,根据排序结果生成针对所述特定事件的用户状态序列;将所生成的用户状态序列转换为序列特征;以所得到的序列特征作为特征值、所述事件风险类型作为标签值,构成风险识别样本数据,并利用至少一条样本数据构建风险识别模型。

【技术特征摘要】
1.一种风险识别模型构建方法,包括:从给定用户的数据中,提取特定事件发生前预设时长内的用户状态记录,所述用户状态记录包括:用户的操作行为和/或系统事件,所述特定事件为已确定风险类型的事件;按照发生时间对所提取到的用户状态记录进行排序,根据排序结果生成针对所述特定事件的用户状态序列;将所生成的用户状态序列转换为序列特征;以所得到的序列特征作为特征值、所述事件风险类型作为标签值,构成风险识别样本数据,并利用至少一条样本数据构建风险识别模型。2.根据权利要求1所述的方法,所述根据排序结果生成针对所述特定事件的用户状态序列,包括:在所述排序结果中,根据第i次用户状态与第i+1次用户状态的间隔时长,将第i次用户状态转化为携带所述间隔时长信息的用户状态。3.根据权利要求1所述的方法,所述根据排序结果生成针对所述特定事件的用户状态序列,包括:在所述排序结果中,根据预先对第i次用户状态的评估结果,将第i次用户状态转化为携带所述评估结果信息的用户状态。4.根据权利要求1所述的方法,所述根据排序结果生成针对所述特定事件的用户状态序列,包括:根据预设的过滤规则,对所述排序结果中的用户状态进行过滤。5.根据权利要求1所述的方法,所述将所生成的用户状态序列转换为序列特征,包括:将所生成的用户状态序列编码为序列向量。6.根据权利要求5所述的方法,所述将所生成的用户状态序列编码为序列向量,包括:根据第一编码规则,将所述用户状态序列中的每一个状态分别编码为状态向量;利用神经网络将状态向量所构成的序列编码为序列向量。7.根据权利要求5所述的方法,在将所生成的用户状态序列转换为序列特征之前,还包括:从多条用户状态序列中挖掘频繁序列项集;对于所述频繁序列项集中的每一频繁序列项,根据所述频繁序列项对应的黑白样本分布情况,确定所述频繁序列项对应的特征值;所述将所生成的用户状态序列转换为序列特征,包括:基于所述频繁序列项集,确定生成的用户状态序列中包含的频繁序列项;根据所述用户状态序列中包含的频繁序列项和预先确定的各频繁序列项对应的特征值,确定与所述用户状态序列对应的序列特征。8.一种风险识别方法,包括:从目标用户的数据中,提取该目标用户在给定时长内的用户状态记录,所述用户状态记录包括:用户的操作行为和/或系统事件;按照发生时间对所述用户状态记录进行排序,根据排序结果生成用户状态序列;将所生成的用户状态序列转换为序列特征;将所述序列特征作为预先构建的风险识别模型的输入,输出风险识别结果。9.根据权利要求8所述的方法,所述根据排序结果生成用户状态序列,包括:在所述排序结果中,根据第i次用户状态与第i+1次用户状态的间隔时长,将第i次用户状态转化为携带所述间隔时长信息的用户状态。10.根据权利要求8所述的方法,所述根据排序结果生成用户状态序列,包括:在所述排序结果中,根据预先对第i次用户状态的评估结果,将第i次用户状态转化为携带所述评估结果信息的用户状态。11.根据权利要求8所述的方法,所述根据排序结果生成用户状态序列,包括:根据预设的过滤规则,对所述排序结果中的用户状态进行过滤。12.一种风险识别模型构建装置,包括:提取...

【专利技术属性】
技术研发人员:程羽陆青傅欣艺陈弢
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1