一种融合社会化信息的个性化推荐方法技术

技术编号：13282479 阅读：89 留言：0更新日期：2016-07-09 00:05

一种融合社会化信息的个性化推荐方法，包括以下步骤：S1、构建用户‑用户信任矩阵；S2、构建项目‑项目标签相似度矩阵；S3、构建及训练模型：S4、预测用户对于未知项目的偏好。本发明专利技术主要有如下优点：1) 将信息检索领域中排序学习的方法应用到Top‑K推荐中，有效地解决了推荐系统中的排序问题，同时克服了传统的基于评分预测方法无法有效进行Top‑K推荐的缺点；2) 在基于排序学习的模型中融合了社会化信息即用户社交信息和项目标签信息，提高了推荐结果的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种融合社会化信息的个性化推荐方法
本专利技术涉及个性化推荐、排序学习和社会网络领域，尤其是一种融合社会化信息的个性化推荐方法。
技术介绍
随着互联网技术特别是电子商务的飞速发展，互联网中数据的增长速度远远超过了人类的接收速度，信息过载问题显得越来越严重。帮助我们从海量数据中筛选出有用数据的信息过滤技术显得越来越重要，个性化推荐技术正是一种根据用户偏好从大规模数据中找到用户感兴趣数据的理想方法。目前，个性化推荐的应用主要分为两大类。第一类是评分预测问题，即通过给定一个用户的历史评分行为预测对未知项目的评分，评分值即表示用户对项目的喜好程度。第二类是Top-K推荐问题，Top-K推荐致力于为用户推荐其最可能喜欢的K个项目。由于用户往往最关注排在前面的项目，因此和评分预测问题相比，Top-K更加直观地为用户提供排序的推荐列表，因此更加实用，这也是目前各大电子商务网站致力于解决的问题。个性化推荐技术的核心在于推荐算法，目前推荐算法主要分为两大类，分别是内容过滤和协同过滤。内容过滤推荐方法主要通过分析用户和项目的内容信息，如用户的人口统计信息，项目的描述信息等，从而构建出用户和项目的一系列特征，最终通过匹配用户和项目的相似度来做出推荐。与此不同的是，协同过滤方法不需要任何用户或项目的内容信息，是一种完全与领域无关的方法。协同过滤方法有效地利用了群体智慧，它基于这样的假设，用户会喜欢和自己具有相同兴趣用户喜欢的项目，同时，用户之间的共同行为越多则用户之间的兴趣越相似。目前协同过滤方法主要分为两大类，分别是基于记忆的协同过滤和基于模型的协同过滤。协同过滤方法有效地避免...

【技术保护点】
一种融合社会化信息的个性化推荐方法，其特征在于，包括以下步骤：S1、构建用户‑用户信任矩阵：a1、获取用户间有向信任度：在已知含有社会化信息的数据库中，根据所述数据库中包含的社交网络中用户间的关注关系获取用户间有向信任度，所述用户间有向信任度的获取方法如下：tuk=d-(vk)d+(vu)+d-(vk)]]>其中，tuk表示数据库社交网络中用户u对用户k的用户间有向信任度，d‑(vk)表示用户k被关注的数量，d+(vu)表示用户u关注用户的数量；a2、归一化处理：然后对用户间有向信任度tuk做归一化处理，得到tuk的用户间有向信任度初始化值Tuk，并由所述用户间有向信任度初始化值构建用户‑用户信任矩阵；S2、构建项目‑项目标签相似度矩阵：b1、获得项目的权重向量：采集数据库中的项目标签信息采用tf*idf权重为每个项目中的各个标签标记权重，并以tf*idf权重值构成每个项目的权重向量的元素，项目的标签权重向量的维度即为数据库中标签的数量，项目的标签权重向量代表了项目的标签特征，具体方法如下：其中，N为数据库中项目的个数，wjt表示项目j中的标签t的权重值，tf(j,t)表示项目j被标上...

【技术特征摘要】
1.一种融合社会化信息的个性化推荐方法，其特征在于，包括以下步骤：S1、构建用户-用户信任矩阵：a1、获取用户间有向信任度：在已知含有社会化信息的数据库中，根据所述数据库中包含的社交网络中用户间的关注关系获取用户间有向信任度，所述用户间有向信任度的获取方法如下：其中，tuk表示数据库社交网络中用户u对用户k的用户间有向信任度，d-(vk)表示用户k被关注的数量，d+(vu)表示用户u关注用户的数量；a2、归一化处理：然后对用户间有向信任度tuk做归一化处理，得到tuk的用户间有向信任度初始化值Tuk，并由所述用户间有向信任度初始化值构建用户-用户信任矩阵；S2、构建项目-项目标签相似度矩阵：b1、获得项目的权重向量：采集数据库中的项目标签信息，采用tf*idf权重为每个项目中的各个标签标记权重，并以tf*idf权重值构成每个项目的权重向量的元素，项目的标签权重向量的维度即为数据库中标签的数量，项目的标签权重向量代表了项目的标签特征，具体方法如下：其中，N为数据库中项目的个数，wjt表示项目j中的标签t的权重值，tf(j,t)表示项目j被标上标签t的次数，没有明显标记次数时记为1，df(t)表示标签t被标记的项目个数，没有标记的标签权重自动记为0；b2、计算项目间的标签相似度：通过计算两项目的权重向量的余弦相似度获得项目间的标签相似度，其计算公式如下：其中，sim(j1,j2)为项目j1和项目j2间的标签相似度，为步骤b1中得到的项目j1和项目j2的权重向量；b3、选取K近邻并归一化项目间的标签相似度：根据项目之间的标签相似度选择项目的K近邻，对K近邻的项目间的标签相似度进行归一化，得到归一化之后的K近邻项目间的标签相似度，并将K近邻之外的项目间的标签相似度设为0，得到初始化的项目-项目标签相似度矩阵；S3、构建及训练模型：c1、采集训练数据集：随机抽取已知含有社会化信息的数据库的80％作为训练数据集；c2、构建用户-项目评分矩阵：将训练数据集中包含的每个用户对于每个项目的评分赋予1-5的分值并以这些分值作为矩阵元素构建用户-项目评分矩阵；c3、计算用户对于某个分值的首位概率：通过以下公式计算用户i对于项目j的评分为Rij的首位概率其中，为增函数且对于所有x都满足参数D为用户i评过分的项目数量；所述首位概率为用户i对于项目j的评分Rij被排到第一位的概率值；c4、构建并训练融合社会化信息的列表排序学习推荐模型，包括：d1、构建融合社会化信息的损失函数L(U,V)：其中，Rmax为评分的最高分值；Iij为指示函数，M为用户数量，N为项目数量，若用户i对项目j有评分记录则Iij取值为1，否则Iij取值为0；Ni是用户i的信任用户集合，Np是与项目j标签最相似的项目集合；Ui和Vj分别是用户潜在特征矩阵和项目潜在...

【专利技术属性】
技术研发人员：林鸿飞，练绪宝，
申请(专利权)人：大连理工大学，
类型：发明
国别省市：辽宁;21

全部详细技术资料下载我是这个专利的主人