当前位置: 首页 > 专利查询>云南大学专利>正文

一种基于协同双模型深度表示学习的推荐方法技术

技术编号:25802914 阅读:34 留言:0更新日期:2020-09-29 18:36
本发明专利技术公开了一种基于协同双模型深度表示学习的推荐方法,涉及互联网技术的推荐系统领域,其特征在于,获取用户和物品的文本数据和关联数据,将所述文本数据通过主题模型抽取出文本特征,所述关联数据通过网络表示学习模型进行表示学习用户和物品的网络特征,通过所述文本特征和网络特征结合作为综合特征计算用户和物品之间的相似度,最后采用协同过滤算法针对用户进行物品推荐,并将结果通过知识图谱的方式展示关联实体图。本发明专利技术采用协同双模型过滤推荐充分利用了用户和物品本身以及关联特征,避免了推荐过程中矩阵稀疏和冷启动的问题,提高了推荐的准确性和结果的有效性。

【技术实现步骤摘要】
一种基于协同双模型深度表示学习的推荐方法
本专利技术涉及基于互联网技术的推荐系统领域,特别涉及一种基于协同双模型深度表示学习的推荐方法。
技术介绍
随着信息化技术的发展,推荐系统作为一种帮助用户从海量数据中获取需要信息的技术,已被广泛运用于各种网站应用中,协同过滤方法是推荐系统的首选方案之一,该方法认为用户对物品有特定的偏好,因此通过分析用户的历史行为数据,可以推断该用户的喜好,然后将具有相同或相似喜好的用户归为个用户类别,基于这个分类结果向用户推荐物品。当前大多数的协同过滤都采用用户对物品的评分信息进行推荐,评分信息实际上是根据评分来计算不同用户的相似度,再根据用户之间的相似度推荐物品,然而这种技术通常存在评分数据稀疏性和冷启动的问题,因而求出的用户相似度会存在较大的偏差,此外,仅考虑用户对物品的评分不能反映用户和物品本身特征以及关联特征对于推荐的作用,导致推荐的结果准确性较低。
技术实现思路
针对现有技术中存在的问题,本专利技术提供了一种基于协同双模型深度表示学习的推荐方法,通过采集的用户和物品的评分数据构建评分矩阵,同时根据获取的用户和物品的文本数据进行主题挖掘获取文本特征,并分别计算用户或者物品在不同特征下的概率构建文本特征矩阵,另一边利用了用户和物品之间的关联关系构建关联网络结构并采用网络表示学习算法学习用户与物品的网络特征,实现双模型系统过滤推荐,克服了现有技术中推荐方法和系统存在的缺陷,并提高了推荐的准确性。本专利技术提供了一种基于协同双模型深度表示学习的推荐方法,具体技术方案如下:用户和物品的数据获取,收集大量用户和物品的相关数据信息评分矩阵的构建,将获取的用户和物品的文本数据作为行和列构建评分矩阵,获取用户对物品的评分信息作为评分内容填充到所述评分矩阵中,完成评分矩阵的构建。文本特征矩阵的构建,对数据信息中的文本数据进行主题挖掘,分别获得用户和物品的主题信息,并根据获得的文本特征构建文本特征矩阵。网络结构图的构建与网络表示学习,从得到的用户和物品的数据信息中获取用户和物品的关联关系,并构建各自的关联网络结构图,同时进行网络表示学习用户和物品的文本特征以及网络特征来获得综合特征。协同过滤推荐,根据双网络模型进行协同过滤推荐,上述得到的用户和物品的综合特征进行协同过滤推荐。知识图谱的扩展,将推荐的结果数据通过知识图谱的方式进行相关实体扩展展示。进一步的,获取的用户和物品的数据信息包括文本数据信息和关联数据信息。进一步的,所述评分矩阵的构建中,第一列用来标识用户,第一行用来标识物品,所述评分矩阵的行列交接处填充用户对物品的评分数据信息,无评分数据信息的交接处采用符号“-”替代。进一步的,所述文本矩阵的构建中包括主题个数K的计算、文本主题的挖掘和文本矩阵的构建,所述主题个数K用于决定主题模型所提取的主体结构,所述文本主题的挖掘前要对获取的用户和物品的文本数据进行预处理,从文本数据中提取出关键部分并进行格式转换,将文本数据转换成能够被LDA模型处理的形式。进一步的,所述主题个数K的计算包括两种方法进行计算,分别得到主题余弦相似度值越小的K值和主题距离越大的K值。进一步的,所述文本主题的挖掘中,采用LDA主题模型分别对用户和物品两个方面进行主题挖掘,分别得到各自的文本特征,并对每个文本数据进行主题概率分布的计算,获得每个用户和物品在各个主题上的分布概率。进一步的,所述文本矩阵的构建中,所述文本矩阵的第一列用来标识用户或者物品,第一行用来标识主题特征,所述文本特征矩阵的行列交界处填充计算得到的概率值。进一步的,所述网络结构图的构建,通过获得的用户和物品的关联数据信息分别建立用户之间的用户网络结构图和物品网络结构图,所述网络表示学习,采用图生成对抗网络分别学习用户与物品的网络特征。用户网络结构图,以用户为节点根据用户之间的关系,例如用户之间的关注、用户之间的绑定或者用户之间的互动等关系构建用户网络结构图。物品网络结构图,以物品为节点,根据物品之间共同存在的特征或者标签获得物品之间的关联关系,来构建物品网络结构图。所述图生成对抗网络不依赖节点的特征信息,只需学习节点的结构信息,通过对抗学习的方式提高生成式模型和判别式模型各自的生成或判别能力,所述图生成对抗网络模型为无监督模型,能够避免在数据标注处理过程中产生偏差。进一步的,所述协同过滤推荐包括基于用户的协同过滤推荐和基于物品的协同过滤推荐,分别根据用户之间的相似度或者根据物品之间的相似度推荐物品区别现有技术,本专利技术的技术方案具有以下有益效果:1、基于文本主题模型进行的主题挖掘,并通过网络表示学习进行协同过滤推荐,充分挖掘并利用用户在网络上中操作留下的数据信息以及物品本身的信息,准确的获得用户和物品的特征,并计算出用户和物品之间的相似度,进行协同过滤,极大的利用了用户之间与物品之间的关联性,提高了推荐结果的准确性。2、网络表示学习过程中,采用图生成对抗网络模型GraphGAN学习用户与物品的网络特征,并采用LDA主题模型获取文本数据的文本特征,根据网络特征和文本特征结合得到的综合特征进行协同过滤推荐,采用了双模型的方式进行协同过滤推荐,解决了数据稀疏性的问题。3、所述协同过滤包括基于用户的和基于物品的两种协同过滤推荐,所述基于用户的协同过滤推荐通过用户之间的相似度确定相似用户,通过相似用户偏向的物品推荐给相似的目标用户,所述基于物品的协同过滤推荐通过物品之间的相似度获取相似的物品信息并将相似的物品推荐给偏向于该类的用户。4、所述文本矩阵的构建中,所述主题个数K的计算采用了两种方法进行计算,得到的K值结果不完全相通,能得到主题相似度较小,同时主题距离相对较大的结果,提高了推荐结果的有效性。附图说明图1为本专利技术的协同双模型深度表示学习推荐的流程图;图2为本专利技术的协同过滤推荐电影结果相关的知识图谱展示图;具体实施方式在下面的描述中对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本专利技术的一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。下面结合附图和具体实施例对本专利技术的
技术实现思路
进行详细具体的说明。本专利技术的实施例提供了一种基于协同双模型深度表示学习的推荐方法,可用于任何用户-物品之间的推荐模型中,所述物品不局限于具体货物,包括影视内容,学习资料,电子阅读等数据量大并具有共同特征的数据内容,本实施例提供了基于协同双模型深度表示学习的推荐方法在影视内容推荐系统的应用。如图1所示,具体的实现流程如下:S1:从网络中爬取了5000位用户和41785部影视内容的文本数据和关联数据;其中,影视信息内容包括影视名称、影视ID、演员、导演、标签、影视简介、影视评价等内容,用户信息涵盖用户名称、用户关注的用户、用户标本文档来自技高网
...

【技术保护点】
1.一种基于协同双模型深度表示学习的推荐方法,其特征在于,所述方法包括:/nS1:用户和物品数据的采集,收集用户和物品的相关数据;/nS2:构建用户和物品的评分矩阵,通过获取的用户和物品的文本数据,构建评分矩阵的行和列,收集用户对物品的评分信息作为评分内容完成评分矩阵的构建;/nS3:构建用户和物品的文本特征矩阵,对获取的文本数据进行主题挖掘得到用户和物品的文本特征并构建文本特征矩阵;/nS4:构建网络结构图进行网络表示学习,分别采集用户和物品的关联关系构建各自的关联网络结构图并进行网络表示学习获得用户和物品的综合特征;/nS5:协同过滤推荐,对得到的用户和物品的综合特征分别进行协同过滤推荐;/nS6:知识图谱进行实体扩展展示,将经过协同过滤推荐后得到的结构数据通过知识图谱进行相关实体扩展展示;/n

【技术特征摘要】
1.一种基于协同双模型深度表示学习的推荐方法,其特征在于,所述方法包括:
S1:用户和物品数据的采集,收集用户和物品的相关数据;
S2:构建用户和物品的评分矩阵,通过获取的用户和物品的文本数据,构建评分矩阵的行和列,收集用户对物品的评分信息作为评分内容完成评分矩阵的构建;
S3:构建用户和物品的文本特征矩阵,对获取的文本数据进行主题挖掘得到用户和物品的文本特征并构建文本特征矩阵;
S4:构建网络结构图进行网络表示学习,分别采集用户和物品的关联关系构建各自的关联网络结构图并进行网络表示学习获得用户和物品的综合特征;
S5:协同过滤推荐,对得到的用户和物品的综合特征分别进行协同过滤推荐;
S6:知识图谱进行实体扩展展示,将经过协同过滤推荐后得到的结构数据通过知识图谱进行相关实体扩展展示;


2.根据权利要求1所述的基于协同双模型深度表示学习的推荐方法,其特征在于,步骤S1中从网络中爬取用户和物品的相关数据信息,包括文本数据和关联数据。


3.根据权利要求1所述的基于协同双模型深度表示学习的推荐方法,其特征在于,步骤S2中所述评分矩阵的第一列用来标识用户,第一行用来标识物品,所述评分矩阵的行列交接处填充用户对物品的评分数据,所述评分数据为空时采用符号“-”替代。


4.根据权利要求1所述的基于协同双模型深度表示学习的推荐方法,其特征在于,步骤S3中包括...

【专利技术属性】
技术研发人员:张璇唐子淇赵静转刘会云炜
申请(专利权)人:云南大学
类型:发明
国别省市:云南;53

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1