【技术实现步骤摘要】
一种推送信息的方法和装置
[0001]本专利技术涉及信息
,具体涉及一种推送信息的方法和装置,特别涉及一种召回信息的方法和装置。
技术介绍
[0002]目前,互联网已成为大多数人或许资讯的主要渠道,而相应的,互联网上的资讯数量也成指数级爆炸。特别是随着移动设备的普及和发展,在资讯数量越来越丰富的同时,用户的关注点也被过分的分散,难以获取到有效的信息。
[0003]搜索引擎提供了解决上述问题的一种手段,但是,现有技术中,搜索引擎有赖于用户自身输入关键词进行主动检索,特别是在移动互联网终端下,用户体验不佳,同时也不能解决系统自动获取用户兴趣并完成推送。
[0004]目前,尽管通过前置的特征工程等手段,已经以用户兴趣点为中心,初步构建了分类的数据体系。但是,这些信息在服务器内仍然数量庞大,不能够直接推送给用户。通常,在信息推荐场景中,向用户推荐信息会分为召回阶段和排序(推荐)阶段,分别由召回子系统和排序(推荐)子系统完成。
[0005]召回系统主要实现从特征工程子系统处理完成并存储在服务器的候选信息中,筛选部分信息作为召回信息。技术上则主要基于用户画像和候选推荐信息,采用特征匹配的方式,按照相似程度排序的方式筛选召回信息。具体的,有搜索行为粒度的i2i方式和用户层次的u2i方式。但是,i2i方式,由于采用用户的当前搜索行为作为召回依据,往往召回信息的整体质量偏低,噪音多,包含较多用户不感兴趣的内容;u2i方式中,则由于主要采用一个特征向量召回,所以召回信息往往只能命中用户一个兴趣点,多样性差。 ...
【技术保护点】
【技术特征摘要】
1.一种推送信息的方法,其特征在于:包括以下步骤:步骤A1:用户在客户端首页下拉刷新发起请求;步骤A2:所述请求由客户端传递给服务端接口,同时,客户端还向所述服务端接口发送用户和上下文特征;步骤A3:所述服务端接收到客户端发来的请求后,再调用推荐系统接口,并向所述推荐系统发送推荐算法模型需要的特征;步骤A4:所述推荐系统接收到服务端发来的请求后,会向召回系统请求所要给用户推荐的内容;步骤A5:服务端接收到召回系统分别返回的内容集合后,进行排序处理;所述步骤A4进一步包括:用户和文章向量通过对一个打分矩阵做矩阵分解得到的,具体包括:步骤A4
‑
1:采用用户协同过滤算法,根据站内所有用户的点击日志采用内容相似度算法计算得到每个内容的协同内容列表;步骤A4
‑
2:用户热点召回,所述用户热点召回是指依照热度值计算公式,对用户召回最感兴趣的分类的分类中当前最热的内容,计算内容的热度;步骤A4
‑
3:算法模型召回,所述算法模型召回是指通过矩阵分解算法将用户和内容分别进行向量化;步骤A4
‑
4:冷启动曝光,所述冷启动曝光是指采用多级流量池模型对新增入库内容进行处理。2.根据权利要求1所述的方法,其特征在于:步骤A4
‑
1中所述相似度算法的计算公式为:为:其中N(a)表示点击内容a的用户数,N(b)表示点击内容b的用户数,N(a)∩N(b)表示既点击a又点击了b的用户数。3.根据权利要求1所述的方法,其特征在于:所述步骤A4
‑
2中的热度值计算公式为:对于分享、传播率等数值满足第一特征向量的情形,所述热度值=ctr*A+当天整体传播率*B,否则,热度值=ctr*C+当天整体传播率*D;所述传播率是指站外点击数/分享数;所述A、B、C、D为大于1的自然数;所述第一特征向量是指ctr、分享数和传播率的组合。4.根据权利要求1所述的方法,其特征在于:所述步骤A4
‑
3的矩阵分解算法具体包括:步骤A4
‑3‑
1:用户和内容分别进行向量化,给用户召回时则采用用户向量与内容向量算内积求相似度的方式,打分矩阵分解形式如下:
其中,M
(m
×
n)
打分矩阵中每个元素的生成方法是按照用户
‑
内容行为对应表所指定的权值,生成用户对每个内容的一个最终权值,其中,m是代表用户数量的自然数,n是代表...
【专利技术属性】
技术研发人员:吴德超,田佳伟,曾庆学,刘科强,
申请(专利权)人:北京立达智胜科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。