当前位置: 首页 > 专利查询>上海大学专利>正文

一种融合群体行为的用户行为预测方法技术

技术编号:29676655 阅读:166 留言:0更新日期:2021-08-13 21:59
本发明专利技术公开了一种融合群体行为的用户行为预测方法。本发明专利技术以社交网络中用户历史行为和用户关系图为基础,首先使用经典社区检测算法发现社交关系图中的群体为下一步操作提供基础;对用户的历史记录进行离散化并且使用用户行为嵌入代表用户嵌入;然后基于注意力机制使每个群体内用户的用户嵌入得到每个群体的表示;最后将每个用户的用户嵌入和用户所在群体的群体嵌入表示进行结合得到新的用户嵌入。紧接着将用户嵌入序列输入GRU循环神经网络中进行用户行为预测。在三个真实数据集上的大量实验结果,验证了本发明专利技术算法在HR和MAP指标上相比仅考虑用户历史行为和考虑用户邻居行为的用户行为预测算法有很大提高。

【技术实现步骤摘要】
一种融合群体行为的用户行为预测方法
本专利技术涉及用户行为预测领域,特别是涉及一种融合群体行为的用户行为预测方法。
技术介绍
科学技术的不断下放带来了智能设备的广泛普及,随着电脑与智能手机使用成本的降低,社交网络与生活世界的交互壁垒被打破,活跃用户数量激增。以新浪微博、微信、QQ等为首的应用深入到了每个人的生活,社交网络正逐渐影响着社会公众的生活方式。移动社交网络在全球范围内展现了其强大的魅力和远大的前景,也为相关研究提供了海量的关联用户行为样本。但是,如何合理高效地进行信息筛选成为了用户的难题。社交网络的最大特征之一是以用户为中心,而用户是兼任多种社会角色的行动复杂体,其建立社交关系并非纯粹依赖相似性,还可能依据亲友关系、工作关系、兴趣爱好等,甚至存在着各种随意添加的社交关系。这就使社交关系的建立具有偶然性。一方面,社交平台提供的数据量日趋庞大,用户每天可以接收到的信息纷乱复杂,难以从中合理高效地挑选对自己有用的信息;另一方面,社交关系建立的偶然性使内容供应者难以通过挖掘用户的社会关系预测用户的下一步动作,对用户做出个性化推荐,包括定向投放广告、进行精准的新闻推荐、视频推荐等,达到千人千面的效果,实现效益最大化。用户行为预测算法正是解决上述问题的有力武器。现有的用户行为预测算法多从用户兴趣、用户的历史行为、受社交关系影响的角度出发。但是,现有的大部分用户行为预测算法没有考虑到用户所处群体的群体行为对用户行为的影响。事实上,处于社交环境中的用户经常会受到邻居用户和所在群体的影响,或者说会受到与用户直接相连的显性社交关系和不直接相连的隐性社交关系的影响。同时,随着循环神经网络的发展和在用户预测领域的应用,预测用户行为时有关动作之间的依赖性也逐渐被纳入考量范围。
技术实现思路
本专利技术的目的是提供一种融合群体行为的用户行为预测方法,以解决上述现有技术存在的问题。为实现上述目的,本专利技术提供了如下方案:本专利技术提供一种融合群体行为的用户行为预测方法,包括以下步骤:S1.采集用户行为数据和用户关系网络数据并进行预处理,获得处理后的用户行为数据和用户关系图;S2.对所述用户关系图进行群体划分,获得最优群体划分结果,将每个用户的整个行为周期离散成若干个时间段,在每个所述时间段内,基于行为嵌入矩阵计算用户嵌入;S3.基于所述用户嵌入、所述最优群体划分结果和注意力机制,获得群体行为表示,将所述群体行为表示融入所述用户嵌入中,获得新的用户嵌入,基于GRU循环神经网络结构构建用户行为预测模型,基于所述用户行为预测模型和所述新的用户嵌入预测用户行为。进一步地,所述S1中的预处理方法为:对所述用户行为数据:针对不同主题的社交网络对用户采取的所有行为进行标签化,获得处理后的用户行为数据;对所述用户关系网络数据:将度小于3的用户过滤,获得所述用户关系图,所述用户关系图中的每一行代表两个用户之间存在连边。进一步地,所述S2中对所述用户关系图进行群体划分的方法为:基于Fast_Newman算法、Girvan-Newman算法和Louvain算法分别进行划分,获得若干个群体划分结果。进一步地,在若干个所述群体划分结果中,基于模块度和群体数量选择最优群体划分结果,具体为:在若干个所述群体划分结果中,选择拥有最大模块度的一个或若干个群体划分结果,作为第一群体划分结果;收集模块度与所述最大模块度的差值的绝对值在融合群体行为的用户行为预测方法以内的群体划分结果,作为第二群体划分结果;在所述第一群体划分结果和第二群体划分结果中选择所述群体数量最少的群体划分结果作为所述最优群体划分结果。进一步地,所述S2中,对每个用户的整个行为周期进行离散的方法为:对将所述整个行为周期划分为等长的时间段。进一步地,所述S2中的行为嵌入矩阵为:在一个所述时间段内,选取K个行为用向量进行表示得到的矩阵,作为行为嵌入矩阵;如果用户在当前时间段内执行的动作少于K个,则使用前一个时间段的动作来填充所述当前时间段,其中K为预设参数,基于每个时间段内用户的行为数量来确定。进一步地,所述S2中,基于行为嵌入矩阵计算用户嵌入的方法具体为:采用对数双线性模型计算所述行为序列获得所述用户嵌入,具体计算公式Uv,t为:其中,Uv,t为用户v在一个所述时间段t内的行为,是所述对数双线性模型的可训练参数,是用户v在时间段t中的第k个行为,在给定所有用户的整个用户历史的情况下,计算每个所述时间段内的用户嵌入。进一步地,所述S3中获得新的用户嵌入的方法:采用逐元素相加的方法将所述群体行为表示融入所述用户嵌入中,具体公式为:其中GAg,t是用户v所在的群体在时间段t的群体行为表示,Uv,t是时间段t上用户v的用户嵌入,为新的用户嵌入,表示逐元素相加。进一步地,所述S3中,基于用户行为预测模型进行预测的方法为:在每个所述时间段内,基于所述新的用户嵌入,获得新的用户嵌入序列;在一个所述时间段内,将所述新的用户嵌入序列和所述行为序列连接,获得输入序列,对所述输入序列进行处理后输入所述用户行为预测模型进行预测。进一步地,对所述输入序列进行处理的方法为:采用应用层归一化技术对所述输入序列进行处理,归一化均值和方差,层归一化公式LayerNorm(x)为:其中LayerNorm(x)为对输入向量x进行层归一化,μ和σ是x的均值和方差,α和β是学习的参数即比例因子和偏差,ε是为保证数值稳定性,给分母赋的值,数值为1e-5,⊙为哈达码积,即对应位置的元素相乘。本专利技术公开了以下技术效果:1.通过用户动作的向量化表示和LBL模型使用户可以用特定时间段内的自身行为来进行表示,这使得在后续进行用户行为预测时更有益,因为用户表示来自于动作嵌入矩阵;2.使用注意力机制来聚合群体内用户的行为以此表示群体行为。这一过程中考虑到不同用户在群体中的影响力不同,在进行群体行为表示时给不同用户以不同的权重;3.实现了基于GRU循环神经网络的行为预测模型,将社交网络用户活动预测的二分类问题扩展到一个连续领域,提高了用户行为预测的准确率,同时说明用户确会受到所在群体的行为的影响。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本实施例中的一种融合群体行为的用户行为预测方法总体流程图;图2为本实施例中的基于动作嵌入的用户行为表示流程图;图3为本实施例中的预测模型的结构示意图;图4为本实施例中的Digg数据集上模型HR、MAP指标的比较示意图;图5为本实施例中的Gowalla数据集上模型HR、MAP指标的比较示意图;图6为本实施例中的Weibo数据集上模型HR、MAP指标的比较本文档来自技高网
...

【技术保护点】
1.一种融合群体行为的用户行为预测方法,其特征在于:包括以下步骤:/nS1.采集用户行为数据和用户关系网络数据并进行预处理,获得处理后的用户行为数据和用户关系图;/nS2.对所述用户关系图进行群体划分,获得最优群体划分结果,将每个用户的整个行为周期离散成若干个时间段,在每个所述时间段内,基于行为嵌入矩阵计算用户嵌入;/nS3.基于所述用户嵌入、所述最优群体划分结果和注意力机制,获得群体行为表示,将所述群体行为表示融入所述用户嵌入中,获得新的用户嵌入,基于GRU循环神经网络结构构建用户行为预测模型,基于所述用户行为预测模型和所述新的用户嵌入预测用户行为。/n

【技术特征摘要】
1.一种融合群体行为的用户行为预测方法,其特征在于:包括以下步骤:
S1.采集用户行为数据和用户关系网络数据并进行预处理,获得处理后的用户行为数据和用户关系图;
S2.对所述用户关系图进行群体划分,获得最优群体划分结果,将每个用户的整个行为周期离散成若干个时间段,在每个所述时间段内,基于行为嵌入矩阵计算用户嵌入;
S3.基于所述用户嵌入、所述最优群体划分结果和注意力机制,获得群体行为表示,将所述群体行为表示融入所述用户嵌入中,获得新的用户嵌入,基于GRU循环神经网络结构构建用户行为预测模型,基于所述用户行为预测模型和所述新的用户嵌入预测用户行为。


2.根据权利要求1所述的融合群体行为的用户行为预测方法,其特征在于:所述S1中的预处理方法为:
对所述用户行为数据:针对不同主题的社交网络对用户采取的所有行为进行标签化,获得处理后的用户行为数据;
对所述用户关系网络数据:将度小于3的用户过滤,获得所述用户关系图,所述用户关系图中的每一行代表两个用户之间存在连边。


3.根据权利要求1所述的融合群体行为的用户行为预测方法,其特征在于:所述S2中对所述用户关系图进行群体划分的方法为:基于Fast_Newman算法、Girvan-Newman算法和Louvain算法分别进行划分,获得若干个群体划分结果。


4.根据权利要求3所述的融合群体行为的用户行为预测方法,其特征在于:在若干个所述群体划分结果中,基于模块度和群体数量选择最优群体划分结果,具体为:
在若干个所述群体划分结果中,选择拥有最大模块度的一个或若干个群体划分结果,作为第一群体划分结果;收集模块度与所述最大模块度的差值的绝对值在融合群体行为的用户行为预测方法以内的群体划分结果,作为第二群体划分结果;在所述第一群体划分结果和第二群体划分结果中选择所述群体数量最少的群体划分结果作为所述最优群体划分结果。


5.根据权利要求1所述的融合群体行为的用户行为预测方法,其特征在于:所述S2中,对每个用户的整个行为周期进行离散的方法为:对将所述整个行为周期划分为等长的时间段。


6.根据权利要求1所...

【专利技术属性】
技术研发人员:戴东波胡莎莎李卫民
申请(专利权)人:上海大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1