一种基于强化学习的个性化图书推荐方法及系统技术方案

技术编号：28373969 阅读：18 留言：0更新日期：2021-05-08 00:01

本公开提供了一种基于强化学习的个性化图书推荐方法及系统，所述方案将分层强化学习模型引入数字图书馆的图书推荐任务中，在该任务中，首先对基本推荐模型进行了预训练，然后设计了一个序列修改模块，以过滤掉可能导致该书推荐错误的噪声；同时，为了减少稀疏性问题的影响，通过基于聚类的策略进一步增强了分层强化学习模型，在预训练网络和分层增强网络之间添加了聚类，以便分层增强网络可以更好地分析数据。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于强化学习的个性化图书推荐方法及系统
本公开属于智能数字图书馆
，尤其涉及一种基于强化学习的个性化图书推荐方法及系统。
技术介绍
本部分的陈述仅仅是提供了与本公开相关的
技术介绍
信息，不必然构成在先技术。数字图书馆作为帮助用户获得专业知识和提高其专业水平的最重要方法之一，在许多大学中都受到了广泛的关注。许多大学已经建立了自己的数字图书馆，其数字资源少则上万，多则上百万。虽然数字图书馆比传统图书馆更易于使用和管理。但从如此庞大的馆藏中找到所需的资源(例如书籍，报告和期刊)对用户来说是一个巨大的挑战。为了应对这一挑战，我们使用了推荐系统解决这个挑战，该系统可以利用用户的历史记录来帮助他们快速发现有趣且高质量的信息。数字图书馆中的图书推荐任务是在时间t+1处向一组用户提供图书，这些用户的历史图书借阅记录在时间t之前给出。用户在数字图书馆中的借阅记录为我们提供了一种学习其个人兴趣的有效方法。例如，如果用户借了很多与数学有关的书，我们可以推断出他正在学习数学，因此，我们可以向他推荐与数学有关的书籍。专利技术人发现，当前有关此任务的研究的工作集中在开发推荐算法，这些算法可以以个性化的方式推荐书籍。但他们忽略了校园图书推荐中的重要因素，即噪声数据可能会误导推荐算法。例如，学习计算机科学和技术的用户可能从图书馆借了很少的心理学书籍用于公共选修课或其他用户。向他/她推荐书籍时，我们应主要侧重于推荐与计算机科学相关的书籍，而忽略这些心理书籍的影响。而且，上述所有方法都忽略了用户借阅记录是非常稀疏的，即用...

【技术保护点】
1.一种基于强化学习的个性化图书推荐方法，其特征在于，包括：/n获取用户历史图书借阅数据，构建用户借书序列；/n构建基于聚类的分层强化学习网络模型，将所述用户借书序列输入预训练的网络模型中，输出推荐图书的预测结果；/n其中，所述基于聚类的分层强化学习网络模型的训练过程包括：利用所述用户借书序列对基础推荐模型进行训练，利用聚类模型对获得的图书特征进行聚类；基于聚类后的图书特征，利用序列修改模型修改用户借书序列；将修改后的用户借书序列输入到基本推荐模型中，并获得预测结果；迭代上述步骤，直至满足迭代终止条件。/n

【技术特征摘要】
1.一种基于强化学习的个性化图书推荐方法，其特征在于，包括：
获取用户历史图书借阅数据，构建用户借书序列；
构建基于聚类的分层强化学习网络模型，将所述用户借书序列输入预训练的网络模型中，输出推荐图书的预测结果；
其中，所述基于聚类的分层强化学习网络模型的训练过程包括：利用所述用户借书序列对基础推荐模型进行训练，利用聚类模型对获得的图书特征进行聚类；基于聚类后的图书特征，利用序列修改模型修改用户借书序列；将修改后的用户借书序列输入到基本推荐模型中，并获得预测结果；迭代上述步骤，直至满足迭代终止条件。

2.如权利要求1所述的一种基于强化学习的个性化图书推荐方法，其特征在于，所述基于聚类的分层强化学习网络模型包括基础推荐模型、序列修改模型和聚类模型。

3.如权利要求1所述的一种基于强化学习的个性化图书推荐方法，其特征在于，所述基础推荐模型通过基于注意力的神经网络对用户和图书的偏好进行建模，在表示用户的借书序列时通过引入注意力机制，对用户借书序列中的每个元素添加一个关注因子，来表明用户对每本书的兴趣。

4.如权利要求1所述的一种基于强化学习的个性化图书推荐方法，其特征在于，所述序列修改模型基于分层强化学习网络实现，通过分层强化学习网络过滤掉用户借书序列中存在误导推荐的噪声。

5.如权利要求4所述的一种基于强化学习的个性化图书推荐方法，其特征在于，所述序列修改模型利用所述分层强化学习网络，将修改用户借书记录的过程描述为层次马尔可夫决策过程，分为两个步骤：高级任务和低级任务；其中，高级任务确定是否需要修改整个序列；如果需要修改，则转入低级任务，低级任务确定是否应删除序列中的各个元素。

6.如权利要求5所述的一...

【专利技术属性】
技术研发人员：王新华，王雨辰，郭磊，姜浩然，徐长棣，刘方爱，
申请(专利权)人：山东师范大学，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人