基于深度神经网络的冷启动跨域混合推荐的方法及系统技术方案

技术编号:28211544 阅读:30 留言:0更新日期:2021-04-24 14:48
本发明专利技术公开了一种基于深度神经网络的冷启动跨域混合推荐的方法及系统,属于网络应用技术领域。本发明专利技术方法,包括:将交叉用户数据作为训练数据;针对文本向量生成集合;构建自编码器对集合中的文本向量进行训练,输出用户评分特征集合;并对集合中的用户评分特征串联,作为DNN网络的输入,用户目标域的预测评分数据作为输出,构建跨域推荐模型;获取预设量的用户足迹数据,使用预设量的用户足迹数据作为推荐数据,将推荐数据输入跨域推荐模型运算,输出对用户的推荐物品。本发明专利技术通过学习源领域到目标领域的相关性非线性映射,为目标领域提供推荐依据。供推荐依据。供推荐依据。

【技术实现步骤摘要】
基于深度神经网络的冷启动跨域混合推荐的方法及系统


[0001]本专利技术涉及网络应用
,并且更具体地,涉及一种基于深度神经网络的冷启动跨域混合推荐的方法及系统。

技术介绍

[0002]随着互联网的飞速发展,数据也呈指数增长,面对海量的数据,用户很难从众多选择中挑出自己感兴趣的。为了改善用户的体验,推荐系统被广泛应用于不同的场景,如在线购物、音乐推荐、电影推荐等。
[0003]推荐算法是推荐系统的核心部分,目前主要有三种方法,分别是协同过滤(Collaborative filtering(CF)

based),基于内容的推荐(content

based)和混合推荐方法。其中CF

based的推荐方法使用用户和物品的交互数据,如用户评分。content

based的方法则是依据物品或内容的元数据,发现物品和内容的相关性,然后基于用户以往的喜好记录推荐给用户相似的物品。目前CF

based的方法被广泛应用,由于它可以捕捉用户对物品最直观的评价,并且可以很容易的扩展到多个场景中,而content

based方法需要在不同领域花费一定精力去构建合适的特征集合,应用于推荐中。然而CF

based的方法目前有两个问题:
[0004]1)数据稀疏,即用户评分矩阵里包含大量空值;
[0005]2)冷启动,对于新用户缺乏足够的历史评价数据。为了解决这两个问题,混合推荐的方法被提出,其基本思想是结合用户交互级别的相似度和物品内容级别的相似度,因此学者提出在用户评分数据的基础上,增加了许多的额外信息来做辅助推荐,如物品的基本属性,用户的社交网络以及用户对物品的评论数据等。
[0006]然而在现实世界中,用户在使用新产品时,一般不愿意泄露过多的个人信息,如社交信息,而且在新产品刚刚使用时,用户的评论数据量也较少。在没有收集到足够的用户足迹数据时,有学者提出跨领域推荐(cross

domain)的思路,得到了广泛的关注,它的基本思想是给定两个相关的领域,如电影和书籍,用户在源领域有足够的历史足迹数据,而在目标领域用户历史数据较少,那么对于目标领域,这些用户可称为冷启动用户,因为两个领域的知识是相关的,可以依据用户在源领域的反馈,为目标领域提供有意义的推荐。

技术实现思路

[0007]针对上述问题,本专利技术提出了一种基于深度神经网络的冷启动跨域混合推荐的方法,包括:
[0008]获取源领域和目标域的数据,并针对源领域和目标域的数据进行筛选,获取源领域和目标域的数据的交叉用户数据,将交叉用户数据作为训练数据;
[0009]获取训练数据中交叉用户的基本信息及评论数据,对基本信息及评论数据进行文本向量的转换,生成文本向量,并针对文本向量生成集合;
[0010]构建自编码器对集合中的文本向量进行训练,输出用户评分特征集合;
[0011]并对集合中的用户评分特征串联,作为DNN网络的输入,用户目标域的预测评分数据作为输出,构建跨域推荐模型;
[0012]获取预设量的用户足迹数据,使用预设量的用户足迹数据作为推荐数据,将推荐数据输入跨域推荐模型运算,输出对用户的推荐物品。
[0013]可选的,交叉用户数据以预设的比例进行分配,一部分作为训练数据,一部分作为测试数据;
[0014]测试数据用于测试跨域推荐模型的准确度。
[0015]可选的,方法还包括:构建初始模型,并针对初始模型分层,包括:
[0016]输入层,所述输入层获取源领域和目标域的数据,并针对源领域和目标域的数据进行筛选,获取源领域和目标域的数据的交叉用户数据,将交叉用户数据作为训练数据;
[0017]向量表示层,所述向量表示层获取训练数据中交叉用户的基本信息及评论数据,对基本信息及评论数据进行文本向量的转换,生成文本向量,并针对文本向量生成集合;
[0018]网络层,所述网络层构建自编码器对集合中的文本向量进行训练,输出用户评分特征集合;
[0019]输出层,所述输出层对集合中的用户评分特征串联,作为DNN网络的输入,用户目标域的预测评分数据作为输出,构建跨域推荐模型。
[0020]可选的,将推荐数据输入跨域推荐模型运算,包括:
[0021]将跨领域推荐模型切换为CF

based和content

based混合推荐的方式,并对CF

based和content

based进行加权组合;加权组合完成后根据推荐数据针对用户进行物品推荐。
[0022]可选的,针对用户进行物品推荐,包括:根据推荐数据中的用户信息进行推荐,根据推荐数据中的物品信息进行推荐及根据跨域推荐模型进行推荐。
[0023]本专利技术还提出了一种基于深度神经网络的冷启动跨域混合推荐的系统,包括:
[0024]输入层,获取源领域和目标域的数据,并针对源领域和目标域的数据进行筛选,获取源领域和目标域的数据的交叉用户数据,将交叉用户数据作为训练数据;
[0025]文本向量层,获取训练数据中交叉用户的基本信息及评论数据,对基本信息及评论数据进行文本向量的转换,生成文本向量,并针对文本向量生成集合;
[0026]网络层,构建自编码器对集合中的文本向量进行训练,输出用户评分特征集合;
[0027]输出层,对集合中的用户评分特征串联,作为DNN网络的输入,用户目标域的预测评分数据作为输出,构建跨域推荐模型;
[0028]推荐层,获取预设量的用户足迹数据,使用预设量的用户足迹数据作为推荐数据,将推荐数据输入跨域推荐模型运算,输出对用户的推荐物品。
[0029]可选的,交叉用户数据以预设的比例进行分配,一部分作为训练数据,一部分作为测试数据;
[0030]测试数据用于测试跨域推荐模型的准确度。
[0031]可选的,将推荐数据输入跨域推荐模型运算,包括:
[0032]将跨领域推荐模型切换为CF

based和content

based混合推荐的方式,并对CF

based和content

based进行加权组合;加权组合完成后根据推荐数据针对用户进行物品推荐。
[0033]可选的,针对用户进行物品推荐,包括:根据推荐数据中的用户信息进行推荐,根据推荐数据中的物品信息进行推荐及根据跨域推荐模型进行推荐。
[0034]本专利技术通过学习源领域到目标领域的相关性非线性映射,为目标领域提供推荐依据,本专利技术提出多种模型混合推荐的策略,在用户历史数据较少的时候,主要依据跨领域推荐,后期积累一定量的用户历史数据,可采用协同过滤和基于内容推荐的加权模型,来获得推荐效果的进一步提升。
附图说明
[0035]图1为本专利技术方法的流程本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度神经网络的冷启动跨域混合推荐的方法,所述方法包括:获取源领域和目标域的数据,并针对源领域和目标域的数据进行筛选,获取源领域和目标域的数据的交叉用户数据,将交叉用户数据作为训练数据;获取训练数据中交叉用户的基本信息及评论数据,对基本信息及评论数据进行文本向量的转换,生成文本向量,并针对文本向量生成集合;构建自编码器对集合中的文本向量进行训练,输出用户评分特征集合;并对集合中的用户评分特征串联,作为DNN网络的输入,用户目标域的预测评分数据作为输出,构建跨域推荐模型;获取预设量的用户足迹数据,使用预设量的用户足迹数据作为推荐数据,将推荐数据输入跨域推荐模型运算,输出对用户的推荐物品。2.根据权利要求1所述的方法,所述交叉用户数据以预设的比例进行分配,一部分作为训练数据,一部分作为测试数据;所述测试数据用于测试跨域推荐模型的准确度。3.根据权利要求1所述的方法,所述方法还包括:构建初始模型,并针对初始模型分层,包括:输入层,所述输入层获取源领域和目标域的数据,并针对源领域和目标域的数据进行筛选,获取源领域和目标域的数据的交叉用户数据,将交叉用户数据作为训练数据;向量表示层,所述向量表示层获取训练数据中交叉用户的基本信息及评论数据,对基本信息及评论数据进行文本向量的转换,生成文本向量,并针对文本向量生成集合;网络层,所述网络层构建自编码器对集合中的文本向量进行训练,输出用户评分特征集合;输出层,所述输出层对集合中的用户评分特征串联,作为DNN网络的输入,用户目标域的预测评分数据作为输出,构建跨域推荐模型。4.根据权利要求1所述的方法,所述将推荐数据输入跨域推荐模型运算,包括:将跨领域推荐模型切换为CF

based和content

based混合推荐的方式,并对CF

based和content<...

【专利技术属性】
技术研发人员:王亚平王志刚杨硕刘振宇刘雅婷王芳
申请(专利权)人:航天信息股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1