用户行为信息挖掘的方法及用户行为风险识别的方法技术

技术编号：35873502 阅读：17 留言：0更新日期：2022-12-07 11:09

本说明书实施例提供了一种用户行为信息挖掘的方法和装置，以及一种用户行为风险识别的方法和装置。该用户行为信息挖掘的方法的一具体实施方式包括：获取多个用户的多条无风险的样本行为序列，各样本行为序列的结束行为是预设行为；采用表征模型对各条样本行为序列进行基于自注意力的编码处理，得到各条样本行为序列对应的向量表征；对得到的多条向量表征进行聚类，得到多个类簇；针对各类簇，选取各类簇中的至少一条向量表征存储到无风险模式表征集合中。集合中。集合中。

全部详细技术资料下载

【技术实现步骤摘要】
用户行为信息挖掘的方法及用户行为风险识别的方法

[0001]本说明书实施例涉及计算机
，尤其涉及一种用户行为信息挖掘的方法和装置，以及用户行为风险识别的方法和装置。

技术介绍

[0002]随着互联网技术的迅速发展，人们的生活和工作越来越依赖于互联网。用户在使用互联网提供的服务的同时，所生成的用户行为信息也在逐渐的增加。通过分析和挖掘用户行为信息中隐藏的信息可以得到一些有用的信息，这些信息在一些领域可能有着重要的意义。举例来说，在风险控制领域，对用户行为信息进行分析和挖掘得到的结果可以用于对风险控制的决策进行指导。计算机技术的发展促进了社会迈向大数据时代，在复杂、海量的数据中挖掘有用的信息是当前亟需解决的问题。

技术实现思路

[0003]本说明书的实施例描述了一种用户行为信息挖掘的方法和装置，以及一种用户行为风险识别的方法和装置。
[0004]根据第一方面，提供了一种用户行为信息挖掘的方法，包括：获取多个用户的多条无风险的样本行为序列，各样本行为序列的结束行为是预设行为；采用表征模型对各条样本行为序列进行基于自注意力的编码处理，得到各条样本行为序列对应的向量表征；对得到的多条向量表征进行聚类，得到多个类簇；针对各类簇，选取各类簇中的至少一条向量表征存储到无风险模式表征集合中。
[0005]根据第二方面，提供了一种用户行为风险识别的方法，包括：获取根据第一方面描述的方法形成的无风险模式表征集合；响应于目标用户的预设行为，获取上述目标用户的至少一个前序行为，上述至少一个前序行为和预设行...

【技术保护点】

【技术特征摘要】
1.一种用户行为信息挖掘的方法，包括：获取多个用户的多条无风险的样本行为序列，各样本行为序列的结束行为是预设行为；采用表征模型对各条样本行为序列进行基于自注意力的编码处理，得到各条样本行为序列对应的向量表征；对得到的多条向量表征进行聚类，得到多个类簇；针对各类簇，选取各类簇中的至少一条向量表征存储到无风险模式表征集合中。2.根据权利要求1所述的方法，其中，所述样本行为序列，是在多个预设风险模式下均确定为无风险的行为序列。3.根据权利要求1所述的方法，其中，所述多条无风险的样本行为序列中至少部分序列的序列长度大于表征长序列的预设阈值；以及所述基于自注意力的编码处理包括：基于稀疏自注意力的编码处理。4.根据权利要求3所述的方法，其中，所述基于稀疏自注意力的编码处理包括：在第一范围内随机确定采样长度；根据采样长度，对所述样本行为序列进行随机采样，得到采样序列；对所述采样序列进行自注意力编码。5.根据权利要求3所述的方法，其中，所述基于稀疏自注意力的编码处理包括：针对所述样本行为序列中的任意位置，对以该任意位置为中心的膨胀滑窗范围内的目标行为进行自注意力编码；所述膨胀滑窗通过滑窗半径R和膨胀因子D定义，所述目标行为是，R＊D范围中每隔D个位置的R个行为。6.根据权利要求5所述的方法，其中，所述表征模型包括多个自注意力模块，所述多个自注意力模块采用不同的滑窗半径和/或膨胀因子进行自注意力编码。7.根据权利要求3所述的方法，其中，所述基于稀疏自注意力的编码处理包括：采用预设的时空卷积层对所述样本行为序列进行卷积处理，得到中间序列；对所述中间序列和所述样本行为序列中时间排序靠后的序列片段进行自注意力编码。8.根据权利要求1所述的方法，其中，所述表征模型是通过以下方式训练得到的：获取训练样本集，其中，训练样本包括正样本对和负样本对，正样本对中包括两条无风险的行为序列，负样本对中包括一条无风险的行为序列和一条有风险的行为序列；基于所述训练样本集，采用对比学习的方式训练得到表征模型。9.根据权利要求8所述的方法，其中，所述正样本对中包括的两条无风险的行为序列为同一用户在不同时间区间内的行为序列；或者，所述正样本对中包括的两条无风险的行为序列为用户画像的相似度超过预设阈值的两个不同用户的行为序列。10.根据权利要求1所述的方法，其中，所述选取各类簇中的至少一条向量表征存储到无风险模式表征集合中，包括：从各类簇中，选取距离类簇中心最近的若干条向量表征，将其存储到所述无风险模式表征集合中。11.根据权利要求1所述的方法，其中，所述方法还包括：将各类簇中包含的向量表征对应的样本行为序列发送到目标设备；
接收所述目标设备针对各类簇发送的无风险用户行为模式，其中，所述无风险用...

【专利技术属性】
技术研发人员：刘芳卿，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人