【技术实现步骤摘要】
一种社交云媒体协同过滤推荐方法
本专利技术涉及网络信息推送
,特别涉及一种应用于社交网络的社交云媒体协同过滤推荐方法。
技术介绍
推荐系统的目的在于在用户和信息中建立连接,一方面帮助用户找出对自己有意义的信息,另一方面帮助信息展现在对他感兴趣的用户前,从而实现用户和信息供应商的双赢。通过对社交网络中用户数据的分析,可以得到用户的主题兴趣和用户之间的信任关系。而对应的媒体服务提供商,则可以通过对此分析有针对性的向用户进行推荐图书、音视频、商品等。这对于信息提供商来说提高了推送信息的准确度,而对用户来说也能够获取更准确的信息,帮助用户提高获取信息的效率。协同过滤推荐算法的基本假设是:为用户推荐感兴趣的内容可通过找到与该用户偏好相似的其他用户,将他们感兴趣的内容推荐给该用户。针对信息超载问题,虽然传统个性化推荐技术已经较为成熟,但随着推荐环境的复杂化、系统中海量信息数据的不断增长和用户需求的不断提高,传统个性化推荐技术在社会化媒体平台的应用中忽略了用户的社交关系,不仅难以保证推荐的准确度,还存在管理难、分析难等问题。
技术实现思路
本专利技术的目的在于提供一种社交云媒体协同过滤推荐方法,该方法可以准确地向用户推荐他们感兴趣的网络信息内容。为实现上述目的,本专利技术采用的技术方案是:一种社交云媒体协同过滤推荐方法,包括以下步骤:步骤1:获取多个微博用户以及与该些微博用户存在社交关系的关联用户所发微博;步骤2:根据步骤1获取的微博用户所发微博,构建用于反映不同用户对不同项目评分大小的对应关系的用户项目评分矩阵;步骤3:根据步骤1获取的关联用户所发微博,计算与微博用 ...
【技术保护点】
一种社交云媒体协同过滤推荐方法,其特征在于,包括以下步骤:步骤1:获取多个微博用户以及与该些微博用户存在社交关系的关联用户所发微博;步骤2:根据步骤1获取的微博用户所发微博,构建用于反映不同用户对不同项目评分大小的对应关系的用户项目评分矩阵;步骤3:根据步骤1获取的关联用户所发微博,计算与微博用户存在社交关系的关联用户对项目的影响评分;步骤4:计算微博用户的特征向量;步骤5:根据步骤4得到的微博用户的特征向量,计算微博用户的特征相似度;步骤6:根据步骤5得到的微博用户的特征相似度,计算与微博用户相似的相似用户对项目的影响评分;步骤7:根据步骤3得到的关联用户对项目的影响评分以及步骤6得到的相似用户对项目的影响评分,更新用户项目评分矩阵;步骤8:挖掘网络资源,对步骤7更新后的用户项目评分矩阵进行扩展;步骤9:对步骤8得到的用户项目评分矩阵分别进行基于用户和基于项目的聚类;步骤10:使用步骤9聚类得到的类簇作为近邻搜索域,采用协同过滤推荐预测评分。
【技术特征摘要】
1.一种社交云媒体协同过滤推荐方法,其特征在于,包括以下步骤:步骤1:获取多个微博用户以及与该些微博用户存在社交关系的关联用户所发微博,所述关联用户是指存在关注与被关注关系的用户;步骤2:根据步骤1获取的微博用户所发微博,构建用于反映不同用户对不同项目评分大小的对应关系的用户项目评分矩阵;步骤3:根据步骤1获取的关联用户所发微博,计算与微博用户存在社交关系的关联用户对项目的影响评分;步骤4:计算微博用户的特征向量;步骤5:根据步骤4得到的微博用户的特征向量,计算微博用户的特征相似度;步骤6:根据步骤5得到的微博用户的特征相似度,计算与微博用户相似的相似用户对项目的影响评分;步骤7:根据步骤3得到的关联用户对项目的影响评分以及步骤6得到的相似用户对项目的影响评分,更新用户项目评分矩阵;步骤8:挖掘网络资源,对步骤7更新后的用户项目评分矩阵进行扩展;步骤9:对步骤8得到的用户项目评分矩阵分别进行基于用户和基于项目的聚类;步骤10:使用步骤9聚类得到的类簇作为近邻搜索域,采用协同过滤推荐预测评分。2.根据权利要求1所述的一种社交云媒体协同过滤推荐方法,其特征在于,在步骤2中,用户项目评分矩阵的构建方法为:从获取的微博中提取所有用户所感兴趣的内容,以此构建项目集;分别根据用户所发微博中是否涉及项目集中的项目,以及对项目的评价情况,得到不同用户对不同项目的评分,进而得到用户项目评分矩阵。3.根据权利要求1所述的一种社交云媒体协同过滤推荐方法,其特征在于,在步骤3中,按如下方法计算关联用户对项目的影响评分:记用户i对项目k评分为Rik,社交网络中存在着关注与被关注的关系,则用户i的关联用户对项目k的影响评分FIik按如下公式计算:其中,Rjk为关联用户j对项目k的评分,n为用户i的关联用户中对项目k有评分的用户总数。4.根据权利要求1所述的一种社交云媒体协同过滤推荐方法,其特征在于,在步骤4中,微博用户的特征向量的计算方法为:首先,对获取的微博进行预处理,包括中文分词和停用词处理;中文分词的方法为:采用中文分词系统,结合自定义的用户词典对微博信息进行分词,停用词处理的方法为:采用HashMap快速索引查表法对无用信息进行过滤,从而降低微博信息的噪音;然后,采用TF-IDF算法对预处理的结果进行处理,具体公式如下:词频TF=一个词在一用户微博中出现的次数/所述用户微博中总词数逆文档频率IDF=log(微博用户总数/微博中提到所述词的用户总数)将得到的TF和IDF相乘得到TF-IDF,进而得到微博用户的特征向量(W1,W2,W3….),其中Wi即词i的TF-IDF。5.根据权利要求1所述的一种社交云媒体协同过滤推荐方法,其特征在于,在步骤5中,微博用户的特征相似度的计算方法为:将步骤4中得到的各个用户的特征向量,按照相同的特征词排序后,代入余弦相似度公式计算用户Ua与用户Ub的相似度Sim(Ua,Ub):其中,Wak表示用户a对特征词k的TF-IDF,n表示特征向量的长度。6.根据权利要求1所述的一种社交云媒体协同过滤推荐方法,其特征在于,在步骤6中,按如下方法计算与微博用户相似的相似用户对项目的影响评分:记用户i对项目k的评分为Rik,记用户i与用户j的特征相似度为Sij,则用户i的相似用户对项目k的影响评分SIik按如下公式计算:其中,Rpk为相似用户p对项目k的评分,N为相似用户总数。7.根据权利要求1所述的一种社交云媒体协同过滤推荐方法,其特征在于,在步骤7中,按如下方法更新用户项目评分矩阵:根据步骤3得到的关联用户对项目的影响评分,以及步骤6得到的相似用户对项目的影响评分,按如下公式更新用户项目...
【专利技术属性】
技术研发人员:郑相涵,陈国龙,汪孔炤,
申请(专利权)人:福州大学,
类型:发明
国别省市:福建;35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。