本发明专利技术涉及多算法荐书技术领域,具体涉及一种基于中图法的多算法荐书和读者画像方法,通过利用六边形的可视化表示法根据用户的阅读行为动态展示其阅读偏好和范围,这种直观的进度反馈是提升用户参与度和满意度的关键,结合用户行为分析,实时更新个性化书籍推荐,算法综合考虑内容推荐和协同过滤推荐的优势,提供准确且多样化的阅读建议,通过构建一个允许用户反馈的系统,使得推荐算法能够根据用户的实际反馈进行自我优化,提高推荐的准确性和用户满意度,同时通过推荐用户未探索的分类,有效预防了信息茧房现象,促进知识的广泛探索和学习,开发友好的用户界面,使用户能够轻松地查看自己的阅读画像,增强了用户的参与感和满意度。
【技术实现步骤摘要】
本专利技术涉及多算法荐书,尤其涉及一种基于中图法的多算法荐书和读者画像方法。
技术介绍
1、随着数字化进程的加速,图书推荐系统的发展、个性化服务的需求增加,信息茧房问题的挑战以及信息技术在图书馆服务应用的扩展,以往的简单的关键词匹配、流行度的推荐方式已经无法满足用户的需求。
2、现有的荐书方法存在以下不足:
3、一、推荐资源的泛化:现有荐书方法大多基于泛化的用户模型,这些模型大多依据历史借阅数据或用户的兴趣标签,导致推荐的资源缺乏足够的个性化;
4、二、信息茧房现象:现有推荐系统加强了用户的现有兴趣,而缺乏促进用户探索新的知识领域的机制。这导致用户可能固定在特定的兴趣茧房内,难以接触到广泛的知识领域。
5、三、可视化缺失:现有的推荐系统多数关注于算法的开发,缺少直观、互动性强的可视化界面,用户很难直观看到自己读书的知识分布。
6、四、跨领域推荐不足:许多推荐系统在为用户提供跨领域的推荐时表现不足,不能有效激发读者探索未知领域知识的兴趣,限制了知识发现和知识的广度。
技术实现思路
1、有鉴于此,本专利技术的目的在于提出一种基于中图法的多算法荐书和读者画像方法,以解决现有的荐书方法推荐的资源缺乏足够的个性化,以及跨领域推荐不足,存在信息茧房的问题。
2、基于上述目的,本专利技术提供了一种基于中图法的多算法荐书和读者画像方法,包括以下步骤:
3、s1、数据源:建立荐书内容数据库并对其进行定期更新与维护;</p>4、s2、数据处理:对数据进行清洗以及数据转换,并利用etl工具对书籍内容特征和用户行为数据进行规范化提取;
5、分析与模型构建层,包括相似度计算和防茧房推荐策略:
6、s3、相似度计算:采用内容推荐算法和协同过滤推荐算法的结合,计算书籍与书籍之间的相似度,以及书籍与用户之间的相似度,为后续的推荐提供依据;
7、s4、防茧房推荐策略:推荐列表不仅包括用户可能感兴趣的书籍,也包括为防止信息茧房而精心挑选的探索性书籍;
8、应用层,包括读者画像的初始化构建和阅读行为的追踪及个性化推荐:
9、s5、读者画像的初始化构建及个性化推荐:根据中国图书馆分类法,将22个主要分类名称映射到一个由22个六边形组成的动态画像中,且每个六边形代表一个图书分类;
10、s6、阅读行为的追踪及个性化推荐:系统跟踪用户的借阅记录,每当用户完成一本书的阅读,所对应的六边形区域颜色加深,以反应用户的阅读范围和偏好;
11、s7、动态更新与迭代:随着用户阅读更多书籍,系统实时更新用户画像,反映用户阅读偏好的最新变化,同时,推荐算法根据用户的最新反馈不断进行调整和优化,确保推荐的相关性和多样性。
12、优选的,在s1中还包括以下子步骤:
13、s1.1、获取推荐书籍:收集图书馆管理系统的分类借阅榜单、在线阅读平台、豆瓣畅销书榜单和当当畅销榜中的任意一个或多个;
14、s1.2、收集书籍元数据:收集每本书的基本信息,包括标题、作者、出版年份以及isbn;
15、s1.3、分类信息标注:根据中国图书馆分类法,为每本书标注一个或多个分类代码;
16、s1.4、定期更新:定期更新书籍数据,更新旧书籍信息,以反映知识和学术界的最新发展。
17、优选的,在s2中还包括以下子步骤:
18、s2.1、数据清洗:移除借阅时间或归还时间为空的记录,移除评分为非数字的记录;
19、s2.2、数据转换:评分转换,将评分转化为0-5的数值型数据;
20、s2.3、提取书籍特征:书籍特征包括被借阅次数、平均评分、评论情感分析得分;
21、s2.4、提取用户特征:用户特征包括借阅频率、平均阅读时长、平均评分。
22、优选的,在s3中,相似度计算包括以下子步骤:
23、s3.1、内容推荐算法以书籍内容、作者、主题、关键词为基础推荐,将文本内容转换为tf-idf权重的向量,然后使用余弦相似性等度量来找到内容上相似的书籍;
24、s3.2、书籍与书籍之间的相似度计算公式如下:
25、
26、其中,v表示书籍,vi、vj是书籍i和j的的特征向量,使用tf-idf算法生成;
27、s3.3、用户行为分析:使用统计分析的方法,分析用户的历史行为,并识别其阅读偏好,其平均评分计算公式如下:
28、
29、其中,是用户阅读的平均评分,i(u)是用户u评分过的书籍集合,|i(u)|是该集合的大小,rui为用户u对书籍i的评分;
30、s3.4、协同过滤推荐算法基于用户间或书籍间的评分相似性推荐书籍,使用皮尔逊相关系数的方法进行计算;
31、s3.5、用户与书籍之间的相似度计算公式如下:
32、
33、优选的,在s3中,还包括以下步骤:
34、s3.6、通过加权混合推荐的方法,计算最终推荐分数sui生成最终的推荐列表,最终推荐分数的计算公式如下:
35、sui=α·content_scoreui+(1-α)·col lab_scoreui;
36、其中,α为决定内容推荐与协同过滤推荐的相对重要性的权重,content_scoreui是基于内容推荐分数,col lab_scoreui是基于协同过滤的推荐分数;
37、s3.7、数据处理:确保所有数据集合和向量在计算前都已经被正确处理和标准化;
38、s3.8、迭代优化:通过迭代过程调整参数α,找到最优的推荐结果;
39、s3.9、反馈机制:实现一个反馈系统,允许用户评鉴推荐的书籍,这些反馈数据用于进一步优化推荐模型。
40、优选的,在s4中,还包括以下子步骤:
41、s4.1、图的构建:包括用户节点、书籍节点、用户-书籍边以及书籍-书籍边;
42、s4.2、图的加权和方向:包括边的权重和边的方向;
43、边的权重:权重可以基于用户的评价,评分高即权重大,权重也可以反映用户与书籍的交互频率,即借阅次数;
44、边的方向:通常从用户指向书籍,表示用户的兴趣或偏好;
45、s4.3、通过pagerank算法,能够利用用户和书籍之间的复杂关系,提供既全面又深入的推荐,鼓励探索用户未曾涉足的分类,以防止信息茧房现象;
46、s4.4、pagerank算法的公式如下:
47、
48、初始化每个节点的pagerank值为通过迭代计算更新每个节点pagerank值,直到收敛即变化非常小或达到预设的迭代次数;
49、其中,pr(p)是节点p的pagerank值,d是阻尼因子,通常设为0.85,它是一个概率值,用来表示用户继续浏览的概率;n是图中节点的总数,m本文档来自技高网
...
【技术保护点】
1.一种基于中图法的多算法荐书和读者画像方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于中图法的多算法荐书和读者画像方法,其特征在于,在S1中还包括以下子步骤:
3.根据权利要求1所述的一种基于中图法的多算法荐书和读者画像方法,其特征在于,在S2中还包括以下子步骤:
4.根据权利要求1所述的一种基于中图法的多算法荐书和读者画像方法,其特征在于,在S3中,相似度计算包括以下子步骤:
5.根据权利要求4所述的一种基于中图法的多算法荐书和读者画像方法,其特征在于,在S3中,还包括以下步骤:
6.根据权利要求1所述的一种基于中图法的多算法荐书和读者画像方法,其特征在于,在S4中,还包括以下子步骤:
7.根据权利要求1所述的一种基于中图法的多算法荐书和读者画像方法,其特征在于,在S5中,22个分类的状态值为ai,颜色的状态值为γi,γi的初始值为0,对应六边形的颜色为无色透明。
8.根据权利要求7所述的一种基于中图法的多算法荐书和读者画像方法,其特征在于,在S6中,每当用户完成一本书的阅读,γi的值加1,当γi=1或2时,颜色状态值变为γ1,对应六边形颜色变为浅蓝色;当γi≥3时,颜色的状态值变为γ2,对应六边形的颜色变为深蓝色且不再变化;
9.根据权利要求8所述的一种基于中图法的多算法荐书和读者画像方法,其特征在于,在S6中还包括以下步骤:
10.根据权利要求1所述的一种基于中图法的多算法荐书和读者画像方法,其特征在于,在S7中,根据更新后的画像重新调整推荐算法,以更好地匹配用户的最新兴趣和偏好,形成一个闭环反馈系统,不断优化推荐准确性和个性化体验。
...
【技术特征摘要】
1.一种基于中图法的多算法荐书和读者画像方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于中图法的多算法荐书和读者画像方法,其特征在于,在s1中还包括以下子步骤:
3.根据权利要求1所述的一种基于中图法的多算法荐书和读者画像方法,其特征在于,在s2中还包括以下子步骤:
4.根据权利要求1所述的一种基于中图法的多算法荐书和读者画像方法,其特征在于,在s3中,相似度计算包括以下子步骤:
5.根据权利要求4所述的一种基于中图法的多算法荐书和读者画像方法,其特征在于,在s3中,还包括以下步骤:
6.根据权利要求1所述的一种基于中图法的多算法荐书和读者画像方法,其特征在于,在s4中,还包括以下子步骤:
7.根据权利要求1所述的一种基于中图法的多算法荐书和读者画...
【专利技术属性】
技术研发人员:谢坦,李斐,郝亚平,薛峰,王惠宇,苏勇刚,蒋金涛,
申请(专利权)人:常州工业职业技术学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。