【技术实现步骤摘要】
本专利技术涉及机器学习
,特别是涉及一种信息推送方法。
技术介绍
互联网快速增长的信息使得用户发现有价值信息愈发困难,从而使得信息推送系统成为当今学术最为活跃的研究领域之一。信息推送系统力图辅助用户发现潜在喜欢的音乐、电影、商品、App等。一些信息推送系统根据用户信息和商品信息进行学习,使得用户更喜欢的商品拥有更高的权重。当有大量用户信息可供使用时,信息推送系统可以提供个性化的推送结果。例如为软件工作者推送软件类书籍,而为艺术工作者提供艺术类书籍等。然而,用户的兴趣和偏好在很多情况下是随时间变化的。当前的信息推送系统在向用户推送信息时,缺乏考虑用户兴趣和偏好的特点,信息推送的准确性较差。
技术实现思路
基于此,有必要针对信息推送的准确性较差的问题,提供一种信息推送方法。一种信息推送方法,包括以下步骤:从数据库中提取待推送内容的特征信息和目标用户的历史操作信息,分别根据所述特征信息和历史操作信息构建内容特征向量和用户特征向量;根据所述用户特征向量计算所述目标用户与其他用户之间的相似度,根据所述相似度从其他用户中选择若干个与目标用户相似的相似用户,获取所述相似用户对各个待推送内容的权重,根据所述权重计算目标用户对各个待推送内容的关联系数;根据所述内容特征向量对各个待推送内容进行热度预测,并根据热度预测结果对所述关联系数进行修正;根据修正后的关联系数对各 ...
【技术保护点】
一种信息推送方法,其特征在于,包括以下步骤:从数据库中提取待推送内容的特征信息和目标用户的历史操作信息,分别根据所述特征信息和历史操作信息构建内容特征向量和用户特征向量;计算所述目标用户与其他用户之间的相似度,根据所述相似度从其他用户中选择若干个与目标用户相似的相似用户,获取所述相似用户对各个待推送内容的权重,根据所述权重计算目标用户对各个待推送内容的关联系数;根据所述内容特征向量对各个待推送内容进行热度预测,并根据热度预测结果对所述关联系数进行修正;根据修正后的关联系数对各个待推送内容进行排序,根据排序结果将对应的待推送内容推送给所述目标用户。
【技术特征摘要】
1.一种信息推送方法,其特征在于,包括以下步骤:
从数据库中提取待推送内容的特征信息和目标用户的历史操作信息,分别
根据所述特征信息和历史操作信息构建内容特征向量和用户特征向量;
计算所述目标用户与其他用户之间的相似度,根据所述相似度从其他用户
中选择若干个与目标用户相似的相似用户,获取所述相似用户对各个待推送内
容的权重,根据所述权重计算目标用户对各个待推送内容的关联系数;
根据所述内容特征向量对各个待推送内容进行热度预测,并根据热度预测
结果对所述关联系数进行修正;
根据修正后的关联系数对各个待推送内容进行排序,根据排序结果将对应
的待推送内容推送给所述目标用户。
2.根据权利要求1所述的信息推送方法,其特征在于,所述待推送内容的
特征信息包括:
待推送内容的类别,待推送内容的历史页面浏览量,待推送内容的页面浏
览量与各个待推送内容的平均页面浏览量的比例,待推送内容不同时段内的页
面浏览量,待推送内容的不同时段内的页面浏览量的变化率,待推送内容的生
成时间,待推送内容的页面浏览量对应的时间信息和待推送内容在网页中的展
示位置。
3.根据权利要求1所述的信息推送方法,其特征在于,根据所述特征信息
构建内容特征向量的步骤包括:
从数据库中提取待推送内容的特征信息;
根据所述特征信息对待推送内容进行建模,得到所述待推送内容的模型;
根据所述模型构建内容特征向量。
4.根据权利要求3所述的信息推送方法,其特征在于,根据所述特征信息
对待推送内容进行建模的步骤还包括:
对各个待推送内容进行聚类操作;
根据聚类操作的结果对待推送内容进行建模。
5.根据权利要求4所述的信息推送方法,其特征在于,对各个待推送内容
进行聚类操作的步骤包括:
确定聚类的中心点;
设置聚类的类别数量;
根据所述中心点分别计算各个待推送内容的距离,根据所述距离和类别数
量对各个待推送内容进行分类;
计算分类后各个类别的中心点,若所述中心点的值在预设的阈值范围内,
结束计算;否则,返回设置聚类的类别数量的步骤。
6.根据权利要求1所述的信息推送方法,其特征在于,根据所述内容特征
向量对各个待推送内容进行热度预测的步骤包括:
构造待推送内容的预测函数;
根据所述预测函数构造损失函数,并对所述损失函数进行正则化操作;
对经正则化的损失函数进行求解,得到热度预测结果。
7.根据权利要求6所述的信息推送方法,其特征在于,所述预测函数为:
h θ ( X ) = g ( θ T ) = 1 1 + e - θ T X ; ]]>其中,
θ 0 + θ 1 x 1 + ... + θ n x n = Σ i = 1 n θ i x i , ]]>式中,g为分类结果,e为自然常数,θi,i=1,2,…,n为所述用户特征向量中
第i个元素的权重,n为所述内容特征向量的维度,hθ(X)为预测函数,T表示转
置,X为用户特征向量,xi为用户特征向量中的第i个元素。
8.根据权利要求7所述的信息推送方法,其特征在于,所述损失函数为:
l ( θ ) = log L ( θ ) = Σ i = 1 n ( y i log h θ ( X ) + ( 1 - y i ) l o g ( 1 - h θ ( X ) ) ) ; ]]>式中,L(θ)为损失函数,l(θ)为优...
【专利技术属性】
技术研发人员:范林博,王军,谭洪舟,
申请(专利权)人:广东顺德中山大学卡内基梅隆大学国际联合研究院,中山大学,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。