【技术实现步骤摘要】
一种项目推荐方法和装置
本专利技术涉及网络
,特别是涉及一种项目推荐方法,以及,一种项目推荐装置。
技术介绍
随着云计算、物联网、社交网络等新兴服务的迅猛发展,大数据时代已经来临,各个领域的数据信息量都爆炸式地增长,导致所谓的“信息泛滥”、“信息迷航”等问题。大量错综复杂的数据信息使得用户在查找感兴趣的信息时感到迷茫和困惑。而同时这对于企业来说既是一种机遇又是一种挑战,如何获取、掌握有用信息是企业保持竞争优势的基石。个性化推荐是解决信息过载问题的最有效的工具之一,其中,协作过滤算法被认为是推荐系统中最为有效和普遍使用的推荐技术,包括基于用户(User-based)推荐和基于项目(Item-based)推荐,较多使用的是User-based协作过滤算法。传统的User-based协作过滤算法对目标用户进行推荐之前,首先通过用户-项目(User-Item)评分数据集计算目标用户与其他用户之间的相似度,并选择最近的多个邻居作为最近邻居,通过最近邻居预测目标用户对目标项目的预测评分。在整个推荐的过程中,相似度的计算精度是影响推荐质量的主要因素。以上
技术介绍
中存在的问题是:在实际的推荐系统中,用户可能仅仅对某几个甚至一个项目打分,目标用户的最近邻居中大部分用户没有对目标项目进行评分,虽然相似度很高,但这样的相似度计算结果存在较大的偶然因素,无法得到准确的预测结果。
技术实现思路
本专利技术提供了一种项目推荐方法和装置,以缓解用户评分数据稀疏所带来的问题,并有效提高预测的准确率。本专利技术提供了一种项目推荐方法,包括:提取记录的多个评分对象及其对多个项目的评分;针对 ...
【技术保护点】
一种项目推荐方法,其特征在于,包括:提取记录的多个评分对象及其对多个项目的评分;针对每个项目,依据多个评分对象对所述项目的评分,统计所有评分对象对所述项目的评分均值,并确定各个项目所属的至少一个项目类型;依据所述评分对象对各个项目的评分均值,以及各个项目所属的项目类型,分别统计各个评分对象对各个项目类型的评分均值;计算目标对象与其他评分对象针对各个项目类型的评分均值的第一相似度,根据所述第一相似度确定所述目标对象具有相似类型喜好的第一相关对象;通过计算所述目标对象与所述第一相关对象对各个项目的评分均值的第二相似度,根据所述第二相似度从所述第一相关对象中确定所述目标对象具有相似项目喜好的第二相关对象;在所述第二相关对象所评分的所有项目中,提取所述目标对象未评分的项目作为候选推荐项目,通过所述目标对象的第二相关对象,计算所述目标对象对所述候选推荐项目的预测评分;提取所述预测评分符合预设范围的至少一个候选推荐项目推荐给所述目标对象。
【技术特征摘要】
1.一种项目推荐方法,其特征在于,包括:提取记录的多个评分对象及其对多个项目的评分;针对每个项目,依据多个评分对象对所述项目的评分,统计所有评分对象对所述项目的评分均值,并确定各个项目所属的至少一个项目类型;依据所述评分对象对各个项目的评分均值,以及各个项目所属的项目类型,分别统计各个评分对象对各个项目类型的评分均值;计算目标对象与其他评分对象针对各个项目类型的评分均值的第一相似度,根据所述第一相似度确定所述目标对象具有相似类型喜好的第一相关对象;通过计算所述目标对象与所述第一相关对象对各个项目的评分均值的第二相似度,根据所述第二相似度从所述第一相关对象和/或扩展邻居中确定所述目标对象具有相似项目喜好的第二相关对象;在所述第二相关对象所评分的所有项目中,提取所述目标对象未评分的项目作为候选推荐项目,通过所述目标对象的第二相关对象,计算所述目标对象对所述候选推荐项目的预测评分;提取所述预测评分符合预设范围的至少一个候选推荐项目推荐给所述目标对象。2.根据权利要求1所述的方法,其特征在于,所述针对每个项目,依据多个评分对象对项目的评分,统计所有评分对象对项目的评分均值的步骤包括:在多个评分对象对所述项目的评分中,提取所有的项目,并去除其中重复的项目;针对各个项目,查找各个用户对所述项目的评分,并计算各个用户对所述项目的评分的平均值。3.根据权利要求1所述的方法,其特征在于,所述依据评分对象对各个项目的评分均值,以及各个项目所属的项目类型,分别统计各个评分对象对各个项目类型的评分均值的步骤包括:针对各个项目类型,查找属于所述项目类型的各个项目,并提取评分对象对查找的各个项目的评分;计算提取的评分的平均值,作为所述项目类型的评分均值。4.根据权利要求1所述的方法,其特征在于,所述计算目标对象与其他评分对象针对各个项目类型的评分均值的第一相似度,根据所述第一相似度确定目标对象具有相似类型喜好的第一相关对象的步骤包括:针对各个评分对象b,通过以下公式(1)计算所述评分对象b与所述目标对象a的第一相似度Pearson(a,b):其中,Ra,i表示评分对象a对项目i的评分,Rb,i表示评分对象b对项目i的评分,Ia表示所述评分对象a评分的项目组成的集合,Ia,b表示所述评分对象a和评分对象b共同评分的项目组成的集合,表示所述评分对象a对所有已评分的项目的平均评分,表示所述评分对象b对所有已评分的项目的平均评分;提取第一相似度大于第一预设阀值的评分对象,或是第一相似度从大到小排序靠前的至少一个评分对象作为所述第一相关对象。5.根据权利要求1所述的方法,其特征在于,所述通过计算目标对象与第一相关对象对各个项目的评分均值的第二相似度,根据第二相似度从第一相关对象和/或扩展邻居中确定目标对象具有相似项目喜好的第二相关对象的步骤包括:针对各第一相关对象u2,依据所述第一相关对象u2与所述目标对象u1分别对各个项目的评分,通过以下公式(2)计算各第一相关对象u2与所述目标对象u1之间的第二相似度FinalSimi(u1,u2):其中,riu2表示u2对项目i的评分,表示存在u2对项目i的评分,表示不存在u2对项目i的评分,Sim(u1,u2)为Weight(u1,u2)与Pearson(u1,u2)之积,Weight(u1,u2)为con和r中的最小值与r的比值,con为u1和u2共同评分数量,r为预设阈值,Pearson(u1,u2)为u1和u2的第一相似度,uother表示的u1除去u2之外的第一相关对象;提取相似度大于第二预设阀值的第一相关对象,或是第二相似度从大到小排序靠前的至少一个第一相关对象作为所述第二相关对象。6.根据权利要求1所述的方法,其特征在于,所述目标对象的第二相关对象还包括所述目标对象的第一相关对象对应的第一相关对象,所述通过目标对象的第二相关对象,计算目标对象对候选推荐项目的预测评分的步骤包括:针对...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。