用户行为信息挖掘的方法及用户行为风险识别的方法技术

技术编号:35873502 阅读:17 留言:0更新日期:2022-12-07 11:09
本说明书实施例提供了一种用户行为信息挖掘的方法和装置,以及一种用户行为风险识别的方法和装置。该用户行为信息挖掘的方法的一具体实施方式包括:获取多个用户的多条无风险的样本行为序列,各样本行为序列的结束行为是预设行为;采用表征模型对各条样本行为序列进行基于自注意力的编码处理,得到各条样本行为序列对应的向量表征;对得到的多条向量表征进行聚类,得到多个类簇;针对各类簇,选取各类簇中的至少一条向量表征存储到无风险模式表征集合中。集合中。集合中。

【技术实现步骤摘要】
用户行为信息挖掘的方法及用户行为风险识别的方法


[0001]本说明书实施例涉及计算机
,尤其涉及一种用户行为信息挖掘的方法和装置,以及用户行为风险识别的方法和装置。

技术介绍

[0002]随着互联网技术的迅速发展,人们的生活和工作越来越依赖于互联网。用户在使用互联网提供的服务的同时,所生成的用户行为信息也在逐渐的增加。通过分析和挖掘用户行为信息中隐藏的信息可以得到一些有用的信息,这些信息在一些领域可能有着重要的意义。举例来说,在风险控制领域,对用户行为信息进行分析和挖掘得到的结果可以用于对风险控制的决策进行指导。计算机技术的发展促进了社会迈向大数据时代,在复杂、海量的数据中挖掘有用的信息是当前亟需解决的问题。

技术实现思路

[0003]本说明书的实施例描述了一种用户行为信息挖掘的方法和装置,以及一种用户行为风险识别的方法和装置。
[0004]根据第一方面,提供了一种用户行为信息挖掘的方法,包括:获取多个用户的多条无风险的样本行为序列,各样本行为序列的结束行为是预设行为;采用表征模型对各条样本行为序列进行基于自注意力的编码处理,得到各条样本行为序列对应的向量表征;对得到的多条向量表征进行聚类,得到多个类簇;针对各类簇,选取各类簇中的至少一条向量表征存储到无风险模式表征集合中。
[0005]根据第二方面,提供了一种用户行为风险识别的方法,包括:获取根据第一方面描述的方法形成的无风险模式表征集合;响应于目标用户的预设行为,获取上述目标用户的至少一个前序行为,上述至少一个前序行为和预设行为形成待评估行为序列;采用表征模型对上述待评估行为序列进行基于自注意力的编码处理,得到上述待评估行为序列对应的待评估向量表征;将上述待评估向量表征与上述无风险模式表征集合进行匹配,根据匹配结果确定上述预设行为是否存在风险。
[0006]根据第三方面,提供了一种用户行为信息挖掘的装置,包括:获取单元,配置为获取多个用户的多条无风险的样本行为序列,各样本行为序列的结束行为是预设行为;编码单元,配置为采用表征模型对各条样本行为序列进行基于自注意力的编码处理,得到各条样本行为序列对应的向量表征;聚类单元,配置为对得到的多条向量表征进行聚类,得到多个类簇;存储单元,配置为针对各类簇,选取各类簇中的至少一条向量表征存储到无风险模式表征集合中。
[0007]根据第四方面,提供了一种用户行为风险识别的装置,包括:集合获取单元,配置为获取根据第一方面描述的方法形成的无风险模式表征集合;序列确定单元,配置为响应于目标用户的预设行为,获取上述目标用户的至少一个前序行为,上述至少一个前序行为和预设行为形成待评估行为序列;表征确定单元,配置为采用表征模型对上述待评估行为
序列进行基于自注意力的编码处理,得到上述待评估行为序列对应的待评估向量表征;识别单元,配置为将上述待评估向量表征与上述无风险模式表征集合进行匹配,根据匹配结果确定上述预设行为是否存在风险。
[0008]根据第五方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当上述计算机程序在计算机中执行时,令计算机执行如第一方面或第二方面中任一实现方式描述的方法。
[0009]根据第六方面,提供了一种计算设备,包括存储器和处理器,其特征在于,上述存储器中存储有可执行代码,上述处理器执行上述可执行代码时,实现如第一方面或第二方面中任一实现方式描述的方法。
[0010]根据本说明书实施例提供的用户行为信息挖掘的方法和装置,首先获取多个用户的多条无风险的样本行为序列,各样本行为序列的结束行为是预设行为。而后,采用表征模型对各条样本行为序列进行基于自注意力的编码处理,得到各条样本行为序列对应的向量表征。然后,对得到的多条向量表征进行聚类,得到多个类簇,针对各个类簇,选取各类簇中的至少一条向量表征存储到无风险模式表征集合中。由此,从多个用户的多条无风险的样本行为序列中挖掘得到无风险模式表征集合,该无风险模式表征集合可以用于用户行为风险识别。
附图说明
[0011]图1示出了本说明书实施例可以应用于其中的应用场景的示意图;
[0012]图2示出了根据一个实施例的用户行为信息挖掘的方法的流程图;
[0013]图3示出了常规滑窗和膨胀滑窗的对比示意图;
[0014]图4示出了根据一个实施例的用户行为风险识别的方法的流程图;
[0015]图5示出了根据一个实施例的用户行为信息挖掘的装置的示意性框图;
[0016]图6示出了根据一个实施例的用户行为风险识别的装置的示意性框图。
具体实施方式
[0017]下面结合附图和实施例,对本说明书提供的技术方案做进一步的详细描述。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本说明书的实施例及实施例中的特征可以相互组合。
[0018]如前所述,在复杂、海量的数据中挖掘有用的信息是当前亟需解决的问题。
[0019]在风险控制领域,可以将数据挖掘结果用于风险控制。举例来说,用户在采用第三方支付平台进行支付的过程中,往往需要对当笔交易事件进行风险分析。通常情况下,一笔交易事件可能包含盗用、欺诈、赌博、非法资金转移等多种风险模式的风险。当线上有大量交易事件等待处理时,需要快速识别交易事件是否存在风险。对于无风险的交易可作快速放行处理,对于不能确定是否有风险的交易可以采用其他方式做进一步的风险判断。
[0020]为此,本说明书的实施例提供了一种用户行为信息挖掘的方法,可以从多个用户的多条无风险的样本行为序列中挖掘得到无风险模式表征集合。图1示出了本说明书实施例可以应用于其中的一个应用场景的示意图。如图1所示,电子设备101可以获取多个用户
的多条无风险的样本行为序列,各样本行为序列中可以包括用户的多个行为的信息,本例中,各样本行为序列的结束行为是交易行为。之后,电子设备101可以采用预先存储的表征模型F对各条样本行为序列进行基于自注意力的编码处理,得到各条样本行为序列对应的向量表征。然后,对得到的多条向量表征进行聚类,得到多个类簇。针对各个类簇,可以选取该类簇中的一个或多个向量表征存储到无风险模式表征集合中。
[0021]电子设备102可以从电子设备101获取无风险模式表征集合。响应于用户A的交易行为,电子设备102可以获取用户A的多个前序行为,多个前序行为和交易行为形成待评估行为序列。采用表征模型F对待评估行为序列进行基于自注意力的编码处理,得到待评估行为序列对应的待评估向量表征。电子设备102可以将待评估向量表征与无风险模式表征集合中的向量表征进行匹配,根据匹配结果确定交易行为是否存在风险。
[0022]继续参见图2,图2示出了根据一个实施例的用户行为信息挖掘的方法的流程图。可以理解,该方法可以通过任何具有计算、处理能力的装置、设备、平台、设备集群来执行。如图2所示,该用户行为信息挖掘的方法,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户行为信息挖掘的方法,包括:获取多个用户的多条无风险的样本行为序列,各样本行为序列的结束行为是预设行为;采用表征模型对各条样本行为序列进行基于自注意力的编码处理,得到各条样本行为序列对应的向量表征;对得到的多条向量表征进行聚类,得到多个类簇;针对各类簇,选取各类簇中的至少一条向量表征存储到无风险模式表征集合中。2.根据权利要求1所述的方法,其中,所述样本行为序列,是在多个预设风险模式下均确定为无风险的行为序列。3.根据权利要求1所述的方法,其中,所述多条无风险的样本行为序列中至少部分序列的序列长度大于表征长序列的预设阈值;以及所述基于自注意力的编码处理包括:基于稀疏自注意力的编码处理。4.根据权利要求3所述的方法,其中,所述基于稀疏自注意力的编码处理包括:在第一范围内随机确定采样长度;根据采样长度,对所述样本行为序列进行随机采样,得到采样序列;对所述采样序列进行自注意力编码。5.根据权利要求3所述的方法,其中,所述基于稀疏自注意力的编码处理包括:针对所述样本行为序列中的任意位置,对以该任意位置为中心的膨胀滑窗范围内的目标行为进行自注意力编码;所述膨胀滑窗通过滑窗半径R和膨胀因子D定义,所述目标行为是,R*D范围中每隔D个位置的R个行为。6.根据权利要求5所述的方法,其中,所述表征模型包括多个自注意力模块,所述多个自注意力模块采用不同的滑窗半径和/或膨胀因子进行自注意力编码。7.根据权利要求3所述的方法,其中,所述基于稀疏自注意力的编码处理包括:采用预设的时空卷积层对所述样本行为序列进行卷积处理,得到中间序列;对所述中间序列和所述样本行为序列中时间排序靠后的序列片段进行自注意力编码。8.根据权利要求1所述的方法,其中,所述表征模型是通过以下方式训练得到的:获取训练样本集,其中,训练样本包括正样本对和负样本对,正样本对中包括两条无风险的行为序列,负样本对中包括一条无风险的行为序列和一条有风险的行为序列;基于所述训练样本集,采用对比学习的方式训练得到表征模型。9.根据权利要求8所述的方法,其中,所述正样本对中包括的两条无风险的行为序列为同一用户在不同时间区间内的行为序列;或者,所述正样本对中包括的两条无风险的行为序列为用户画像的相似度超过预设阈值的两个不同用户的行为序列。10.根据权利要求1所述的方法,其中,所述选取各类簇中的至少一条向量表征存储到无风险模式表征集合中,包括:从各类簇中,选取距离类簇中心最近的若干条向量表征,将其存储到所述无风险模式表征集合中。11.根据权利要求1所述的方法,其中,所述方法还包括:将各类簇中包含的向量表征对应的样本行为序列发送到目标设备;
接收所述目标设备针对各类簇发送的无风险用户行为模式,其中,所述无风险用...

【专利技术属性】
技术研发人员:刘芳卿
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1