一种混合博文与用户关系的社交媒体好友推荐方法技术

技术编号：18783883 阅读：56 留言：0更新日期：2018-08-29 06:59

本发明专利技术公开一种混合博文与用户关系的社交媒体好友推荐方法，通过LDA主题模型在用户微博文本数据中挖掘用户偏好，计算用户博文相似度，同时考虑到微博社交关系的重要性，计算用户之间社交关系的相似度，最终得到用户之间的综合相似度，考虑到微博用户大部分普通用户博文少可挖掘的信息较少，但其社交关系简单可靠，少部分用户主页博文多，可挖掘的文本信息充足，但其社交关系复杂，粉丝数原大于关注数，该类用户社交关系包含较多无用的噪声数据，发明专利技术采用线性加权的方法衡量两种不同的属性信息对推荐结果的影响，并通过实验学习权重参数，最终得到用户推荐列表，提升了推荐结果的质量。

全部详细技术资料下载

【技术实现步骤摘要】
一种混合博文与用户关系的社交媒体好友推荐方法
本专利技术涉及计算机推荐算法
，具体涉及一种混合博文与用户关系的社交媒体好友推荐方法。
技术介绍
个性化信息推荐现阶段已经广泛应用于各个领域。目前，主流方法包括协同过滤推荐以及基于内容推荐两项。基于内容推荐，即通过内容本身的属性，然后计算内容的相似性，找到与某物品属性相似的物品。协同过滤，所谓协同过滤，即不依赖于物品本身的物品属性，而是通过其他相关特征，例如人参与的行为数据，来达到推荐物品的目的。以微博，facebook，twitter等为代表的新型的社会网络，能够把众多的用户集合在一起，使其既实现了信息的传播，同时也满足了用户的社交需求。在社交媒体的使用中，用户会发布或者转发文本数据(博文)，博文可以用来表示用户的兴趣偏好，但是由于博文为短文本特征，存在数据稀疏的问题，如何在海量用户博文中对用户兴趣进行表示，并计算用户博文之间的相似度，是研究人员的一个重要课题。此外，用户还会会形成各种关系，比如，用户之间的关注与粉丝关系、因共同转发或评论某条博文信息或因共同购买某件商品而形成的共有偏好性关系等。充分获取和剖析使用社交媒体过程中产生的复杂关系网可以切实、高效地挖掘用户的兴趣，进而可以有效地进行相关推荐。但是，社交媒体越是被用户认可，则会产生越多的用户量，进而用户间的关系会变得错综复杂。这使得一些事件更加变得不可预测、难以控制，从而给研究人员分析用户间关系以及准确挖掘用户兴趣带来了巨大的困难。如何在错综复杂的用户关系中准确的发现用户兴趣，并对其进行信息推荐，已经成为研究人员一项新的挑战。
技术实现思路
本专利技...

【技术保护点】
1.一种混合博文与用户关系的社交媒体好友推荐方法，其特征是，具体包括如下步骤：步骤1、获取社交媒体中用户发布的博文，并采用人工标注的方法对博文所属领域进行分类标记；步骤2、对所获取的博文进行预处理；步骤3、对预处理后的博文采用潜在狄利克雷分配主题模型进行主题生成，构建用户主题矩阵，得到用户生成主题的概率分布；步骤4、对用户生成主题的概率分布采用KL散度计算用户之间的博文相似度；步骤5、获取社交媒体中用户的社交关系，并构建一个用户与用户社交关系的相似度矩阵；步骤6、对用户与用户社交关系的相似度矩阵采用余弦相似度计算用户之间的社交关系相似度；步骤7、对于步骤4所得到的用户之间的博文相似度和步骤6所得到的用户之间的社交关系相似度采用线性加权融合策略进行融合，最终得到目标用户与其他用户之间的综合相似度，最终在该综合相似度排行中取前K项作为最终的推荐列表推荐给目标客户，其中K为设定值。

【技术特征摘要】
1.一种混合博文与用户关系的社交媒体好友推荐方法，其特征是，具体包括如下步骤：步骤1、获取社交媒体中用户发布的博文，并采用人工标注的方法对博文所属领域进行分类标记；步骤2、对所获取的博文进行预处理；步骤3、对预处理后的博文采用潜在狄利克雷分配主题模型进行主题生成，构建用户主题矩阵，得到用户生成主题的概率分布；步骤4、对用户生成主题的概率分布采用KL散度计算用户之间的博文相似度；步骤5、获取社交媒体中用户的社交关系，并构建一个用户与用户社交关系的相似度矩阵；步骤6、对用户与用户社交关系的相似度矩阵采用余弦相似度计算用户之间的社交关系相似度；步骤7、对于步骤4所得到的用户之间的博文相似度和步骤6所得到的用户之间的社交关系相似度采用线性加权融合策略进行融合，最终得到目标用户与其他用户之间的综合相似度，最终在该综合相似度排行中取前K项作为最终的推荐列表推荐给目标客户，其中K为设定值。2.根据权利要求1所述的一种混合博文与用户关系的社交媒体好友推荐方法，其特征是，步骤2中，对博文进行预处理的过程为：首先删除博文中的噪声数据，然后对去噪后的博文进行分词，最后滤除分词结果中的停用词。3.根据权利要求1或2所述的一种混合博文与用户关系的社交媒体好友推荐方法，其特征是，步骤3中，潜在狄利...

【专利技术属性】
技术研发人员：李志欣，游锋生，张灿龙，
申请(专利权)人：广西师范大学，
类型：发明
国别省市：广西,45

全部详细技术资料下载我是这个专利的主人