System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及信息推荐,具体涉及一种新闻推荐方法及装置。
技术介绍
1、新闻是信息的主要载体之一,用户通过浏览新闻来了解各类信息,用户可能同时对多种类型(社会、娱乐等类型)的新闻都有一定兴趣,并且用户对新闻的兴趣也会发生变化。目前向用户推荐新闻的时候,主要是向用户推荐热点新闻,并没有充分考虑用户兴趣和新闻特征,不能准确捕捉和匹配用户的多种兴趣爱好。
2、为能够准确地向用户推荐新闻,目前亟需一种充分挖掘用户兴趣和充分利用新闻特征来推荐新闻的方式。
技术实现思路
1、有鉴于此,本专利技术实施例提供一种新闻推荐方法及装置,以能够准确地向用户推荐新闻。
2、为实现上述目的,本专利技术实施例提供如下技术方案:
3、本专利技术实施例第一方面公开一种新闻推荐方法,所述方法包括:
4、获取待推荐用户的用户特征、候选新闻的第一新闻特征、历史点击新闻的第二新闻特征,所述历史点击新闻为所述待推荐用户的点击历史中的新闻;
5、对所述用户特征、所述第一新闻特征、所述第二新闻特征进行映射转化处理,得到用户特征id、第一新闻特征id、第二新闻特征id;
6、调用预设的多兴趣召回模型处理所述用户特征id和所述第二新闻特征id,以得到多个兴趣嵌入向量,所述多兴趣召回模型基于正样本数据和负样本数据训练得到,所述多兴趣召回模型至少包含:池化层,嵌入层,胶囊网络,增加了批规范化的激活层,由全连接和数据自适应激活函数构成的多层感知机层;
7
8、利用所述多兴趣召回模型处理所述多个兴趣嵌入向量和所述新闻嵌入向量,以从所述候选新闻中筛选出至少一个目标新闻;
9、向所述待推荐用户推荐所述目标新闻。
10、优选的,对所述用户特征、所述第一新闻特征、所述第二新闻特征进行映射转化处理,得到用户特征id、第一新闻特征id、第二新闻特征id,包括:
11、基于哈希算法和独热编码,将所述用户特征、所述第一新闻特征、所述第二新闻特征分别映射转化为用户特征id、第一新闻特征id、第二新闻特征id。
12、优选的,基于正样本数据和负样本数据训练得到多兴趣召回模型的过程,包括:
13、从样本用户的点击历史中采样得到正样本数据,所述正样本数据基于所述样本用户的点击历史中的任意新闻构成;
14、基于全库随机负采样和批内负采样对样本新闻进行融合采样,以采样得到负样本数据,所述负样本数据基于样本新闻中的任意新闻构成;
15、利用所述正样本数据、负样本数据、所述样本用户的样本用户特征、所述样本用户的样本历史点击新闻,训练多兴趣召回模型直至所述多兴趣召回模型收敛,所述样本历史点击新闻为所述样本用户的点击历史中的新闻。
16、优选的,利用所述多兴趣召回模型处理所述多个兴趣嵌入向量和所述新闻嵌入向量,以从所述候选新闻中筛选出至少一个目标新闻,包括:
17、利用所述多兴趣召回模型对所述多个兴趣嵌入向量和所述新闻嵌入向量进行点积运算,获取得到所述新闻嵌入向量对应的最终兴趣匹配度;
18、按照所述新闻嵌入向量对应的最终兴趣匹配度,对各个所述候选新闻进行排序;
19、基于所述待推荐用户的用户画像和预设的限制条件,从排序后的各个所述候选新闻中选择至少一个目标新闻。
20、优选的,向所述待推荐用户推荐所述目标新闻之后,还包括:
21、收集所述待推荐用户对于所述目标新闻的点击行为;
22、基于所述待推荐用户对于所述目标新闻的点击行为,更新所述多兴趣召回模型。
23、本专利技术实施例第二方面公开一种新闻推荐装置,所述装置包括:
24、获取单元,用于获取待推荐用户的用户特征、候选新闻的第一新闻特征、历史点击新闻的第二新闻特征,所述历史点击新闻为所述待推荐用户的点击历史中的新闻;
25、预处理单元,用于对所述用户特征、所述第一新闻特征、所述第二新闻特征进行映射转化处理,得到用户特征id、第一新闻特征id、第二新闻特征id;
26、第一处理单元,用于调用预设的多兴趣召回模型处理所述用户特征id和所述第二新闻特征id,以得到多个兴趣嵌入向量,所述多兴趣召回模型基于正样本数据和负样本数据训练得到,所述多兴趣召回模型至少包含:池化层,嵌入层,胶囊网络,增加了批规范化的激活层,由全连接和数据自适应激活函数构成的多层感知机层;
27、第二处理单元,用于调用所述多兴趣召回模型处理所述第一新闻特征id,以得到所述候选新闻对应的新闻嵌入向量;
28、第三处理单元,用于利用所述多兴趣召回模型处理所述多个兴趣嵌入向量和所述新闻嵌入向量,以从所述候选新闻中筛选出至少一个目标新闻;
29、推荐单元,用于向所述待推荐用户推荐所述目标新闻。
30、优选的,所述预处理单元具体用于:基于哈希算法和独热编码,将所述用户特征、所述第一新闻特征、所述第二新闻特征分别映射转化为用户特征id、第一新闻特征id、第二新闻特征id。
31、优选的,所述第一处理单元包括:
32、正采样模块,用于从样本用户的点击历史中采样得到正样本数据,所述正样本数据基于所述样本用户的点击历史中的任意新闻构成;
33、负采样模块,用于基于全库随机负采样和批内负采样对样本新闻进行融合采样,以采样得到负样本数据,所述负样本数据基于样本新闻中的任意新闻构成;
34、训练模块,用于利用所述正样本数据、负样本数据、所述样本用户的样本用户特征、所述样本用户的样本历史点击新闻,训练多兴趣召回模型直至所述多兴趣召回模型收敛,所述样本历史点击新闻为所述样本用户的点击历史中的新闻。
35、优选的,所述第三处理单元包括:
36、运算模块,用于利用所述多兴趣召回模型对所述多个兴趣嵌入向量和所述新闻嵌入向量进行点积运算,获取得到所述新闻嵌入向量对应的最终兴趣匹配度;
37、排序模块,用于按照所述新闻嵌入向量对应的最终兴趣匹配度,对各个所述候选新闻进行排序;
38、选择模块,用于基于所述待推荐用户的用户画像和预设的限制条件,从排序后的各个所述候选新闻中选择至少一个目标新闻。
39、优选的,还包括:
40、更新单元,用于收集所述待推荐用户对于所述目标新闻的点击行为;基于所述待推荐用户对于所述目标新闻的点击行为,更新所述多兴趣召回模型。
41、基于上述本专利技术实施例提供的一种新闻推荐方法及装置,该方法为:获取待推荐用户的用户特征、候选新闻的第一新闻特征、历史点击新闻的第二新闻特征;对用户特征、第一新闻特征、第二新闻特征进行映射转化处理,得到用户特征id、第一新闻特征id、第二新闻特征id;调用多兴趣召回模型处理用户特征id和第二新闻特征id,以得到多个兴趣嵌入向本文档来自技高网...
【技术保护点】
1.一种新闻推荐方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,对所述用户特征、所述第一新闻特征、所述第二新闻特征进行映射转化处理,得到用户特征ID、第一新闻特征ID、第二新闻特征ID,包括:
3.根据权利要求1或2所述的方法,其特征在于,基于正样本数据和负样本数据训练得到多兴趣召回模型的过程,包括:
4.根据权利要求1或2所述的方法,其特征在于,利用所述多兴趣召回模型处理所述多个兴趣嵌入向量和所述新闻嵌入向量,以从所述候选新闻中筛选出至少一个目标新闻,包括:
5.根据权利要求1或2所述的方法,其特征在于,向所述待推荐用户推荐所述目标新闻之后,还包括:
6.一种新闻推荐装置,其特征在于,所述装置包括:
7.根据权利要求6所述的装置,其特征在于,所述预处理单元具体用于:基于哈希算法和独热编码,将所述用户特征、所述第一新闻特征、所述第二新闻特征分别映射转化为用户特征ID、第一新闻特征ID、第二新闻特征ID。
8.根据权利要求6或7所述的装置,其特征在于,所述第一处理单元包括
9.根据权利要求6或7所述的装置,其特征在于,所述第三处理单元包括:
10.根据权利要求6或7所述的装置,其特征在于,还包括:
...【技术特征摘要】
1.一种新闻推荐方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,对所述用户特征、所述第一新闻特征、所述第二新闻特征进行映射转化处理,得到用户特征id、第一新闻特征id、第二新闻特征id,包括:
3.根据权利要求1或2所述的方法,其特征在于,基于正样本数据和负样本数据训练得到多兴趣召回模型的过程,包括:
4.根据权利要求1或2所述的方法,其特征在于,利用所述多兴趣召回模型处理所述多个兴趣嵌入向量和所述新闻嵌入向量,以从所述候选新闻中筛选出至少一个目标新闻,包括:
5.根据权利要求1或2所述的方法...
【专利技术属性】
技术研发人员:程静,王建龙,
申请(专利权)人:北京搜狐新媒体信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。