一种融合群体行为的用户行为预测方法技术

技术编号：29676655 阅读：166 留言：0更新日期：2021-08-13 21:59

本发明专利技术公开了一种融合群体行为的用户行为预测方法。本发明专利技术以社交网络中用户历史行为和用户关系图为基础，首先使用经典社区检测算法发现社交关系图中的群体为下一步操作提供基础；对用户的历史记录进行离散化并且使用用户行为嵌入代表用户嵌入；然后基于注意力机制使每个群体内用户的用户嵌入得到每个群体的表示；最后将每个用户的用户嵌入和用户所在群体的群体嵌入表示进行结合得到新的用户嵌入。紧接着将用户嵌入序列输入GRU循环神经网络中进行用户行为预测。在三个真实数据集上的大量实验结果,验证了本发明专利技术算法在HR和MAP指标上相比仅考虑用户历史行为和考虑用户邻居行为的用户行为预测算法有很大提高。

全部详细技术资料下载

【技术实现步骤摘要】
一种融合群体行为的用户行为预测方法
本专利技术涉及用户行为预测领域，特别是涉及一种融合群体行为的用户行为预测方法。
技术介绍
科学技术的不断下放带来了智能设备的广泛普及，随着电脑与智能手机使用成本的降低，社交网络与生活世界的交互壁垒被打破，活跃用户数量激增。以新浪微博、微信、QQ等为首的应用深入到了每个人的生活，社交网络正逐渐影响着社会公众的生活方式。移动社交网络在全球范围内展现了其强大的魅力和远大的前景，也为相关研究提供了海量的关联用户行为样本。但是，如何合理高效地进行信息筛选成为了用户的难题。社交网络的最大特征之一是以用户为中心，而用户是兼任多种社会角色的行动复杂体，其建立社交关系并非纯粹依赖相似性，还可能依据亲友关系、工作关系、兴趣爱好等，甚至存在着各种随意添加的社交关系。这就使社交关系的建立具有偶然性。一方面，社交平台提供的数据量日趋庞大，用户每天可以接收到的信息纷乱复杂，难以从中合理高效地挑选对自己有用的信息；另一方面，社交关系建立的偶然性使内容供应者难以通过挖掘用户的社会关系预测用户的下一步动作，对用户做出个性化推荐，包括定向投放广告、进行精准的新闻推荐、视频推荐等，达到千人千面的效果，实现效益最大化。用户行为预测算法正是解决上述问题的有力武器。现有的用户行为预测算法多从用户兴趣、用户的历史行为、受社交关系影响的角度出发。但是，现有的大部分用户行为预测算法没有考虑到用户所处群体的群体行为对用户行为的影响。事实上，处于社交环境中的用户经常会受到邻居用户和所在群体的影响，或者说会受到与用户直接...

【技术保护点】
1.一种融合群体行为的用户行为预测方法，其特征在于：包括以下步骤：/nS1.采集用户行为数据和用户关系网络数据并进行预处理，获得处理后的用户行为数据和用户关系图；/nS2.对所述用户关系图进行群体划分，获得最优群体划分结果，将每个用户的整个行为周期离散成若干个时间段，在每个所述时间段内，基于行为嵌入矩阵计算用户嵌入；/nS3.基于所述用户嵌入、所述最优群体划分结果和注意力机制，获得群体行为表示，将所述群体行为表示融入所述用户嵌入中，获得新的用户嵌入，基于GRU循环神经网络结构构建用户行为预测模型，基于所述用户行为预测模型和所述新的用户嵌入预测用户行为。/n

【技术特征摘要】
1.一种融合群体行为的用户行为预测方法，其特征在于：包括以下步骤：
S1.采集用户行为数据和用户关系网络数据并进行预处理，获得处理后的用户行为数据和用户关系图；
S2.对所述用户关系图进行群体划分，获得最优群体划分结果，将每个用户的整个行为周期离散成若干个时间段，在每个所述时间段内，基于行为嵌入矩阵计算用户嵌入；
S3.基于所述用户嵌入、所述最优群体划分结果和注意力机制，获得群体行为表示，将所述群体行为表示融入所述用户嵌入中，获得新的用户嵌入，基于GRU循环神经网络结构构建用户行为预测模型，基于所述用户行为预测模型和所述新的用户嵌入预测用户行为。

2.根据权利要求1所述的融合群体行为的用户行为预测方法，其特征在于：所述S1中的预处理方法为：
对所述用户行为数据：针对不同主题的社交网络对用户采取的所有行为进行标签化，获得处理后的用户行为数据；
对所述用户关系网络数据：将度小于3的用户过滤，获得所述用户关系图，所述用户关系图中的每一行代表两个用户之间存在连边。

3.根据权利要求1所述的融合群体行为的用户行为预测方法，其特征在于：所述S2中对所述用户关系图进行群体划分的方法为：基于Fast_Newman算法、Girvan-Newman算法和Louvain算法分别进行划分，获得若干个群体划分结果。

4.根据权利要求3所述的融合群体行为的用户行为预测方法，其特征在于：在若干个所述群体划分结果中，基于模块度和群体数量选择最优群体划分结果，具体为：
在若干个所述群体划分结果中，选择拥有最大模块度的一个或若干个群体划分结果，作为第一群体划分结果；收集模块度与所述最大模块度的差值的绝对值在融合群体行为的用户行为预测方法以内的群体划分结果，作为第二群体划分结果；在所述第一群体划分结果和第二群体划分结果中选择所述群体数量最少的群体划分结果作为所述最优群体划分结果。

5.根据权利要求1所述的融合群体行为的用户行为预测方法，其特征在于：所述S2中，对每个用户的整个行为周期进行离散的方法为：对将所述整个行为周期划分为等长的时间段。

6.根据权利要求1所...

【专利技术属性】
技术研发人员：戴东波，胡莎莎，李卫民，
申请(专利权)人：上海大学，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人