基于卷积神经网络的分布式实时推荐系统技术方案

技术编号：23512858 阅读：26 留言：0更新日期：2020-03-18 00:08

本发明专利技术公开了一种基于卷积神经网络的分布式实时推荐系统，包括：用户交互模块，负责实现系统和用户的交互以及业务数据的展示；数据存储模块：负责平台业务逻辑数据的存储和支撑实时推荐系统部分对于在线数据的获取需求；离线推荐模块：使用神经协同过滤推荐算法对用户行为数据进行训练，生成离线推荐结果；在线推荐模块：从数据存储模块获取用户行为数据并使用实时推荐算法得到在线推荐结果。本发明专利技术采用计算框架Spark加速用户特征模型的训练过程，各模块之间的数据流通过Spark RDD的转换来实现，离线推荐模块使用神经协同过滤算法提高离线推荐结果的准确性，结合在线推荐算法能有效提高推荐结果的准确性和实时性。

Distributed real-time recommendation system based on convolutional neural network

全部详细技术资料下载

【技术实现步骤摘要】
基于卷积神经网络的分布式实时推荐系统
本专利技术涉及机器学习、协同过滤算法和Spark分布式计算框架，具体涉及一种基于卷积神经网络的分布式实时推荐系统。
技术介绍
随着互联网技术的飞速发展，用户在面对互联网上海量信息时，难以迅速有效地找到自己想要的内容，这就形成了网络信息过载。面对海量的数据，传统的搜索引擎以难以满足用户的需求，在这样的背景下，推荐系统技术应运而生。推荐系统与传统搜索引擎最大不同之处在于，搜索引擎是用户去寻找信息，推荐系统的作用是让用户感兴趣的信息呈现在用户的面前。协同过滤推荐(CollaborativeFilteringrecommendation)是在信息过滤和信息系统中正迅速成为一项很受欢迎的技术。与传统的基于内容过滤直接分析内容进行推荐不同，协同过滤分析用户兴趣，在用户群中找到指定用户的相似(兴趣)用户，综合这些相似用户对某一信息的评价，形成系统对该指定用户对此信息的喜好程度预测。与传统文本过滤相比，协同过滤有下列优点：能够过滤难以进行机器自动基于内容分析的信息，如艺术品、音乐；能够基于一些复杂的，难以表达的概念(信息质量、品位)进行过滤；推荐的新颖性。缺点包括：用户对商品的评价非常稀疏，这样基于用户的评价所得到的用户间的相似性可能不准确(即稀疏性问题)；随着用户和商品的增多，系统的性能会越来越低；如果从来没有用户对某一商品加以评价，则这个商品就不可能被推荐(即最初评价问题)。用户评分矩阵的数据稀疏会影响到生成的相似度矩阵的精确度，进而影响利用相似度矩阵进行在线推荐的推荐模块所...

【技术保护点】
1.一种基于卷积神经网络的分布式实时推荐系统，其特征在于：使用Spark平台构建基于神经协同过滤算法的分布式实时推荐系统框架，包括用户交互模块、数据存储模块、离线推荐模块和在线推荐模块，各模块之间的数据流通过Spark RDD的转换实现；/n所述用户交互模块包括用户可视化模块和综合业务服务模块；所述用户可视化模块用于实现系统和用户的交互以及业务数据的展示，采用AngularJS2实现，部署在Apache服务上；所述综合业务服务模块用于实现JavaEE层面整体的业务逻辑，通过Spring进行构建，对接业务需求，部署在Tomcat上；/n所述数据存储模块包括主数据库模块、缓存数据库模块和日志采集模块；所述主数据库模块用于负责平台业务逻辑数据的存储；所述缓存数据库模块用于支撑实时推荐系统部分对于数据的高速获取需求；所述日志采集模块用于获取用户的在线行为数据，并发送给在线推荐模块进行训练；/n所述离线推荐模块包括神经矩阵填充模块和离线推荐服务模块；所述神经矩阵填充模块用于对历史用户评分矩阵进行填充；所述离线推荐服务模块采用协同过滤算法，根据用户评分矩阵生成离线推荐表；/n所述在线推荐模块包括消...

【技术特征摘要】
1.一种基于卷积神经网络的分布式实时推荐系统，其特征在于：使用Spark平台构建基于神经协同过滤算法的分布式实时推荐系统框架，包括用户交互模块、数据存储模块、离线推荐模块和在线推荐模块，各模块之间的数据流通过SparkRDD的转换实现；
所述用户交互模块包括用户可视化模块和综合业务服务模块；所述用户可视化模块用于实现系统和用户的交互以及业务数据的展示，采用AngularJS2实现，部署在Apache服务上；所述综合业务服务模块用于实现JavaEE层面整体的业务逻辑，通过Spring进行构建，对接业务需求，部署在Tomcat上；
所述数据存储模块包括主数据库模块、缓存数据库模块和日志采集模块；所述主数据库模块用于负责平台业务逻辑数据的存储；所述缓存数据库模块用于支撑实时推荐系统部分对于数据的高速获取需求；所述日志采集模块用于获取用户的在线行为数据，并发送给在线推荐模块进行训练；
所述离线推荐模块包括神经矩阵填充模块和离线推荐服务模块；所述神经矩阵填充模块用于对历史用户评分矩阵进行填充；所述离线推荐服务模块采用协同过滤算法，根据用户评分矩阵生成离线推荐表；
所述在线推荐模块包括消息缓冲模块和实时推荐更新模块；所述消息缓冲模块用于负责接收处理收到的用户日志信息，获取用户评分数据流；所述实时推荐更新模块用于实时获取消息缓冲模块过滤出来的用户评分数据流，并提交给实时推荐算法，完成对用户新的推荐结果计算，计算完成之后，将新的推荐结果和主数据库中的推荐结果进行合并。

2.根据权利要求1所述的基于卷积神经网络的分布式实时推荐系统，其特征在于：所述神经矩阵填充模块利用卷积神经网络CNN对图像进行特征提取，生成用户的有效隐式特征表达向量作为用户的视觉模型，并以此为依据，对原始数据评分矩阵中的评分缺失项进行预测填充。

3.根据权利要求1所述的基于卷积神经网络的分布式实时推荐系统...

【专利技术属性】
技术研发人员：顾岩，曹晓梅，
申请(专利权)人：南京邮电大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人