当前位置: 首页 > 专利查询>中山大学专利>正文

一种基于异构信息的评分推荐方法技术

技术编号:15746594 阅读:55 留言:0更新日期:2017-07-03 02:15
本发明专利技术提供了一种基于异构信息的评分推荐方法,其包括以下步骤:S1、获取物品的用户ID、物品ID、评分信息、评论信息和物品描述信息;S2、将评分信息、评论信息和物品描述信息分别转化成评分向量、评论向量和物品描述向量;S3、将评分向量、评论向量和物品描述向量代入损失函数中,并通过梯度下降的方法进行求解;S4、根据S3中的计算得到最终的变量,通过公式得到用户对于物品的推荐度。通过本发明专利技术提供的一种基于异构信息的评分推荐方法,解决了文字信息的短文本问题,能够更加有效地整合不同空间表达下的不同信息,让评分信息、物品信息、评论信息得到更好的融合,最后做出更加精准的推荐。

A scoring recommendation method based on heterogeneous information

The invention provides a heterogeneous information recommendation method based on the score, which comprises the following steps: S1, get the items user ID, item ID, score information, review information and item description information; S2, will score description information information, information and comment articles respectively into score vector, comments and articles describing vector vector; S3, will score vector, vector and vector into the comment items described in the loss function, and through the method of gradient descent solution; S4, according to the calculation in S3 to get the final variable, users get the goods for the recommendation by the formula. The invention relates to a method of heterogeneous information recommendation based on the score, to solve the problem of short text text information, different information can effectively integrate different spatial expression, let the score information, item information, review information to get better fusion, finally make a more accurate recommendation.

【技术实现步骤摘要】
一种基于异构信息的评分推荐方法
本专利技术涉及数据挖掘领域,涉及一种基于异构信息的评分推荐方法。
技术介绍
随着信息技术的飞速发展,大数据的各种技术应运而生,然而信息过载的问题依然日趋严重。评分推荐系统作为解决信息过载的重要工具,它通过分析用户与物品之间的行为信息,用户与物品各自的描述信息等,把更加精准的物品推荐给用户,使信息价值最大化。在评分推荐系统中,面临的挑战主要是数据的稀疏性。除了评分信息外,评论等文字信息成为了最好的补充。然而在把评分,评论信息融入到评分预测推荐系统的研究中,大部分是利用文字描述,利用主题模型通过分析物品相似性做出协同过滤,对推荐系统做一个额外的信息补充。然而,这样的方法在文字信息大部分是短文本的事实下,会受到一定的影响。而且,文字信息的非精确性也让传统方法受到一定挑战。
技术实现思路
针对现有技术中存在的问题,本专利技术提供了一种基于异构信息的评分推荐方法,解决文字信息的短文本问题,能够更加有效地整合不同空间表达下的不同信息,让评分信息、物品信息、评论信息得到更好的融合,最后做出更加精准的推荐。为实现上述目的,本专利技术采用以下技术方案:一种基于异构信息的评分推荐方法,包括以下步骤:S1、获取物品的用户ID、物品ID、评分信息、评论信息和物品描述信息;S2、将评分信息、评论信息和物品描述信息分别转化成评分向量、评论向量和物品描述向量;S3、将评分向量、评论向量和物品描述向量代入以下损失函数中,并通过梯度下降的方法进行求解;其中,评论向量和物品描述向量为常量,评分向量为变量;其中,u表示用户特征向量,v表示物品特征向量,r表示评分向量,wr表示评分向量所处超平面的单位法向量;c表示评论向量,wc表示评论向量所处超平面的单位法向量;d表示物品描述向量,wd表示物品描述向量所处超平面的单位法向量,rp,rq分别指评分为p和q的评分向量,αr,αc,αd分别代表rp和rq、r、c、d所占损失函数的权重,Rr,Rc,Rd分别表示已经存在的评分关系集合、评论关系集合、物品描述关系集合,e是超参数,C(x)取sigmoid函数;进一步地,损失函数中的函数F为:其中,dis(x)表示向量x的欧几里得距离,λc和λd是权重参数,分别代表在函数F中评论信息和物品描述信息所占的比重;S4、根据S3中的计算得到最终的变量u,v,wr,wc,wd,通过以下公式得到用户u对于物品v的推荐度p:进一步地,还包括以下步骤:S5、得到同一用户u对于多个物品的推荐度,并按降序排序,最终得到同一用户u对于所述多个物品的推荐度排序。进一步地,在S2中,将评论信息转化成评论向量的方法为:S211、使用word2vec工具对评论信息中的每一个单词进行词向量训练;S212、得到每个单词的词向量后对该条评论的所有词向量求平均值,作为最终的评论向量。进一步地,在S2中,将物品描述信息转化成物品描述向量的方法为:S211、使用word2vec工具对物品描述信息中的每一个单词进行词向量训练;S212、得到每个单词的词向量后对该条物品描述的所有词向量求平均值,作为最终的物品描述向量。进一步地,在使用word2vec工具进行词向量训练时,采用skip-gram模型,向量维度大小取20。进一步地,其中,所有词向量的平均值为:其中,Q是所述评论信息的单词合集或者所述物品描述信息的单词集合,w是每一个单词,vec(w)表示w的词向量。进一步地,在S3中,其中,num(x)表示x的个数。进一步地,在S2中,将评分信息转化成评分向量的方法为:将每一个可能出现的不同评分值对应映射成一个随机的虚拟向量。通过本专利技术提供的一种基于异构信息的评分推荐方法,解决了文字信息的短文本问题,而且还能够更加有效地整合不同空间表达下的不同信息,让评分信息、物品信息、评论信息得到更好的融合;此外,在解决了评分推荐系统中数据稀疏的难题的同时,保持了不同用户和物品之间的偏好多样性和独特性,最后做出更加精准的推荐。附图说明图1是本专利技术实施例提供的一种基于异构信息的评分推荐方法的步骤流程图。具体实施方式下面将结合附图和具体的实施例对本专利技术的技术方案进行详细说明。如图1所示,本专利技术提供了一种基于异构信息的评分推荐方法,其具体包括以下步骤:S1、获取物品的用户ID、物品ID、评分信息、评论信息和物品描述信息;S2、将评分信息、评论信息和物品描述信息分别转化成评分向量、评论向量和物品描述向量;S3、将评分向量、评论向量和物品描述向量代入以下损失函数中,并通过梯度下降的方法进行求解;其中,评论向量和物品描述向量为常量,评分向量为变量;其中,u表示用户特征向量,v表示物品特征向量,r表示评分向量,wr表示评分向量所处超平面的单位法向量;c表示评论向量,wc表示评论向量所处超平面的单位法向量;d表示物品描述向量,wd表示物品描述向量所处超平面的单位法向量,rp,rq分别指评分为p和q的评分向量,αr,αc,αd分别代表rp和rq、r、c、d所占损失函数的权重,Rr,Rc,Rd分别表示已经存在的评分关系集合、评论关系集合、物品描述关系集合,是从网站获取并通过S2中相同的方法处理所得的,e是超参数,C(x)取sigmoid函数;损失函数中的第二项是为了使得不同评分之间的差异最大化,第三项是为了保证评分向量r处于单位法向量wr所处的超平面,第四项是为了保证评论向量c处于单位法向量wc所处的超平面,第五项是为了保证物品描述向量d处于单位法向量wd所处的超平面。进一步地,损失函数中的函数F为:其中,dis(x)表示向量x的欧几里得距离,λc和λd是权重参数,分别代表在函数F中评论信息和物品描述信息所占的比重;函数F中第一项代表了用户、物品和评分信息的关系,第二项代表了用户、物品和评论信息的关系,第三项代表了物品和物品描述信息的关系。S4、根据S3中的计算得到最终的变量u,v,wr,wc,wd,通过以下公式得到用户u对于物品v的推荐度p:S5、得到同一用户u对于多个物品的推荐度,并按降序排序,最终得到同一用户u对于所述多个物品的推荐度排序。具体地,在S2中,将评论信息转化成评论向量的方法为:S211、使用word2vec工具对评论信息中的每一个单词进行词向量训练;S212、得到每个单词的词向量后对该条评论的所有词向量求平均值,作为最终的评论向量。进一步地,在S2中,将物品描述信息转化成物品描述向量的方法为:S211、使用word2vec工具对物品描述信息中的每一个单词进行词向量训练;S212、得到每个单词的词向量后对该条物品描述的所有词向量求平均值,作为最终的物品描述向量。其中,在使用word2vec工具进行词向量训练时,采用skip-gram模型,向量维度大小取20。根据以上方法得到的所有词向量的平均值为:其中,Q是所述评论信息的单词合集或者所述物品描述信息的单词集合,w是每一个单词,vec(w)表示w的词向量。进一步地,在S2中,将评分信息转化成评分向量的方法为:将每一个可能出现的不同评分值对应映射成一个随机的虚拟向量。举例而言,假设评分系统设定的可选分数有1、2、3、4、5分,则将这五个分值分别随机映射成虚拟向量,将映射得出的五个虚拟向量代入S3的公式中作为中间变量进行求解。进一步地,在S3本文档来自技高网...
一种基于异构信息的评分推荐方法

【技术保护点】
一种基于异构信息的评分推荐方法,其特征在于,包括以下步骤:S1、获取物品的用户ID、物品ID、评分信息、评论信息和物品描述信息;S2、将评分信息、评论信息和物品描述信息分别转化成评分向量、评论向量和物品描述向量;S3、将评分向量、评论向量和物品描述向量代入以下损失函数中,并通过梯度下降的方法进行求解;其中,评论向量和物品描述向量为常量,评分向量为变量;

【技术特征摘要】
1.一种基于异构信息的评分推荐方法,其特征在于,包括以下步骤:S1、获取物品的用户ID、物品ID、评分信息、评论信息和物品描述信息;S2、将评分信息、评论信息和物品描述信息分别转化成评分向量、评论向量和物品描述向量;S3、将评分向量、评论向量和物品描述向量代入以下损失函数中,并通过梯度下降的方法进行求解;其中,评论向量和物品描述向量为常量,评分向量为变量;其中,u表示用户特征向量,v表示物品特征向量,r表示评分向量,wr表示评分向量所处超平面的单位法向量;c表示评论向量,wc表示评论向量所处超平面的单位法向量;d表示物品描述向量,wd表示物品描述向量所处超平面的单位法向量,rp,rq分别指评分为p和q的评分向量,αr,αc,αd分别代表rp和rq、r、c、d所占损失函数的权重,Rr,Rc,Rd分别表示已经存在的评分关系集合、评论关系集合、物品描述关系集合,e是超参数,C(x)取sigmoid函数;进一步地,损失函数中的函数F为:其中,dis(x)表示向量x的欧几里得距离,λc和λd是权重参数,分别代表在函数F中评论信息和物品描述信息所占的比重;S...

【专利技术属性】
技术研发人员:何俊华卓汉逵
申请(专利权)人:中山大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1