本发明专利技术公开了一种基于用户兴趣度和地理位置的活动推荐方法,首先在Meetup API开放平台获取相应的权限,通过群组接口、活动接口和成员接口抽取相应的群组数据信息、活动数据信息以及成员数据信息;其次,根据抽取的数据集信息,利用向量分解模型初步筛选出用户感兴趣的活动数据集;然后,结合用户的社会化关系,使用皮尔森相关系数,进一步筛选出用户感兴趣的活动数据集;接着,考虑到活动发生的地理位置对用户是否参与一个活动的影响,对活动发生的地理位置划分区域,使用优化方法,确定用户最终感兴趣且参与的活动数据集;最后,成地将活动信息推荐给相关的用户。本发明专利技术方法能够实现从海量的活动数据中高效地向用户推荐合适的活动。
【技术实现步骤摘要】
本专利技术涉及一种将社会活动推荐给用户的方法,属于信息网络
技术介绍
2004年,Facebook在美国诞生,随之社交网站热潮席卷全球,而国内以新浪微 博、腾讯微博、人人网等为代表的SNS网站也如雨后春笋般迅速崛起。目前在网上每天都 有新的社交网站产生和消失,同时也有大量针对各种兴趣爱好为主题的社交网站,随着 Facebook的群组的不断成长,以及互联网的高效性,人们开始意思到建立在兴趣爱好之上 的社交产品还有不小的市场潜力可以挖掘。因此一种能够有效地将在线活动和互动转变为 线下积极的交流、社交及服务网站孕育而生。这种不同于传统的社交网站,基于活动的社交 网站(像Meetup、Plancast、Douban Event等),用户不仅可以组织和参加活动,也可以评 价和分享活动。为了让用户更好地享受这些网站带来的乐趣,活动推荐算法近年来成为了 人们研宄的热点话题。 Meetup社交网站以全新的方式与他人建立联系,近十年来一直都在促进着有共同 兴趣的人们在当地发起见面活动。通过其全球每月25万次见面活动的举办,它使超过700 万成员通过共同的兴趣建立起了联系。在Meetup网站中,每一个用户都可以是活动的参与 者,又可以是组织者,大量的成员蕴含着海量的活动信息。此外同一群组里的用户有可能是 不相识的,基于这种情况,大量的活动信息无法进行分享;而且每天都会有用户进行注册, 对于这些新用户仅仅根据注册时填写的interests,无法将更多有价值的活动信息推荐给 用户,这不仅造成资源的浪费,也使用户失去了一些潜在朋友。 一些研宄扩展了基本的概率隐语义分析(PLSA)模型,基于群组内容信息生成用 户和群组之间的社会关系信息。还有一些研宄在群组推荐时采用张量分解建立用户、群组 和标签的三元关系。这些研宄虽然考虑到了异构的社会化关系和活动的地理位置对用户的 影响,但基于Meetup网站是group-event结构,用户参与一个活动,必须先要加入该群组。 这种特性使得当前的研宄不完全适用Meetup网站。
技术实现思路
为了解决上述问题,本专利技术提供了一种基于用户兴趣度和地理位置的活动推荐方 法,本方法抽取所有的活动信息,基于用户对活动内容的兴趣,及结合活动的地理位置对用 户的影响,从海量的活动数据中高效地向用户推荐合适的活动。本专利技术具体包括下述步 骤: 将用户所属群组进行分类,利用Meetup网站开放平台提供的群组、用户、活动接 口,通过这些接口抽取相应群组里的群组信息数据、成员数据,以及该群组里的活动信息数 据,并将其存储在数据库中,对这些数据进行语料模式匹配预处理操作; 针对这些数据,首先利用矩阵分解模型初步得到用户对于活动的兴趣度,筛选出 用户感兴趣的活动数据集; 其次考虑到用户的社会化关系和用户的活跃度,利用用户间的相似相关性,得到 用户对于活动的兴趣度,进一步筛选出用户感兴趣的活动数据集; 考虑到活动发生的地理位置对用户是否参与一个活动的影响,对活动发生的地理 位置划分区域,考虑用户在该区域内的活跃度,使用优化方法,确定用户最终感兴趣且参与 的活动数据集。 进一步,对活动数据集进行预处理的过程具体为: 步骤I. 1)获取成员数据集信息; 步骤1. 2)初始化所有用户感兴趣的活动向量,设为V ; 步骤1. 3)获取第一条成员数据信息; 步骤1. 4)得到该成员用户的标签信息; 步骤1. 5)初始化该用户的感兴趣的活动向量V ; 步骤1. 6)获取活动数据集信息; 步骤1. 7)初始化所有活动兴趣标志为0 ; 步骤1. 8)获取第一条活动数据信息; 步骤1. 9)将该活动标签与用户的兴趣标签进行匹配,如果匹配,转步骤1. 10),否 贝IJ,转步骤1. 11); 步骤1. 10)计算匹配次数,并更新为该活动的兴趣标志; 步骤1. 11)获取下一条活动数据信息; 步骤1. 12)判断是否到达活动数据集末端,若到达,转步骤1. 13),否则,转步骤 1.9); 步骤1. 13)删除活动兴趣标志为0的活动数据; 步骤1. 14)更新该用户的感兴趣的活动向量V ; 步骤1. 15)获取下一条成员数据信息; 步骤1. 16)判断该用户数据信息是否到达数据集末端,若到达,转步骤1. 17),否 贝IJ,转步骤1.4); 步骤1. 17)更新所有用户感兴趣的活动向量集V。 进一步,利用矩阵分解模型初步得到用户对于活动的兴趣度的过程具体为: 步骤2. 1)获取成员的所有数据集信息; 步骤2. 2)获取成员-活动数据集信息; 步骤2. 3)根据这些数据集得到成员的各个标签的权值比重; 步骤2. 4)将其存入用户向量U中; 步骤2. 5)利用向量分解模型,计算用户对活动的兴趣度。 进一步,根据成员用户的社会化关系,计算用户间的相似度的过程为: 步骤3. 1)获取所有成员数据信息; 步骤3. 2)获取成员i的第一条数据信息; 步骤3. 3)计算该成员参与的群组数; 步骤3. 4)计算出该成员参与的所有活动数; 步骤3. 5)计算出该成员平均每个群组参与的活动数; 步骤3. 6)获取该成员共同参与某一活动的用户集; 步骤3. 7)从用户集中获取用户j的第一条数据信息; 步骤3. 8)计算该用户参与的群组数; 步骤3. 9)计算出该用户参与的所有活动数; 步骤3. 10)计算出该用户平均每个群组参与的活动数; 步骤3. 11)获取用户i和用户j共同参与的群组集; 步骤3. 12)分别计算用户i和用户j在相同群组中的活跃度; 步骤3. 13)利用皮尔森相关系数,计算用户i和用户j之间的相似性; 步骤3. 14)从用户集中获取用户j的下一条数据信息; 步骤3. 15)判断该用户数据信息是否到达用户数据集末端,若是,转步骤3. 16), 否则,转步骤3.8); 步骤3. 16)得到两用户之间前k个最大的相似度,存入表中; 步骤3. 17)获取成员i的下一条数据信息; 步骤3. 18)判断是否到达用户数据集末端,若是,转步骤3. 19),否则,转步骤 3.3); 步骤3. 19)更新Top表。 进一步,利用相似相关性,计算用户对活动的兴趣度的过程为: 步骤4. 1)获取用户的感兴趣的活动向量集V ; 步骤4. 2)利用相似相关性,计算用户对活动的兴趣度; 步骤4. 3)更新用户感兴趣的活动向量集V。 进一步,基于地理位置的活动数据集优化的过程为: 步骤5. 1)获取活动向量集V ; 步骤5. 2)根据活动的地理位置将其划分区域; 步骤5. 3)获取所有成员数据集信息; 步骤5. 4)计算用户在某一区域的活跃度; 步骤5. 5)计算活动属于某一区域的概率; 步骤5. 6)计算用户对活动的兴趣度; 步骤5. 7)更新用户感兴趣的活动向量集V ; 步骤5. 8)完成用户感兴趣的活动推荐。 本专利技术考虑了当用户和活动在同一群组,对于该活动的推荐,用户的兴趣度比对 不在同一群组的活动的兴趣度要大,因此需要将用户所在的群组进行分类;又根据用户 的interests,及活动的description挖掘出用户感兴趣的活动的概率分布;结合用户的 interests和参与的活动,计算用户之间的相似相关性,从而进行个性化的推荐;最后,对本文档来自技高网...
【技术保护点】
一种基于用户兴趣度和地理位置的活动推荐方法,其特征在于,包括如下步骤:将用户所属群组进行分类,抽取群组里的群组信息数据、成员数据,以及该群组里的活动信息数据,并将其存储在数据库中,对这些数据进行语料模式匹配预处理操作;针对上述数据,利用矩阵分解模型初步得到用户对于活动的兴趣度,筛选出用户感兴趣的活动数据集;根据用户的社会化关系和用户的活跃度,利用用户间的相似相关性,得到用户对于活动的兴趣度,进一步筛选出用户感兴趣的活动数据集;对活动发生的地理位置进行区域划分,根据用户在该区域内的活跃度,使用优化方法,确定用户最终感兴趣且参与的活动数据集。
【技术特征摘要】
【专利技术属性】
技术研发人员:张卫丰,高秋云,
申请(专利权)人:南京邮电大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。