一种推送信息的方法和装置制造方法及图纸

技术编号:32971195 阅读:13 留言:0更新日期:2022-04-09 11:38
本发明专利技术提供了一种召回方法和信息推送装置,召回方法具体包括:采用用户协同过滤算法,根据站内所有用户的点击日志采用内容相似度算法计算得到每个内容的协同内容列表;用户热点召回,所述用户热点召回是指依照热度值计算公式,对用户召回最感兴趣的分类的分类中当前最热的内容,计算内容的热度;算法模型召回,所述算法模型召回是指通过矩阵分解算法将用户和内容分别进行向量化;冷启动曝光,所述冷启动曝光是指采用多级流量池模型对新增入库内容进行处理。信息推送装置包括特征筛选系统、召回系统,和/或,排序系统,所述召回系统从特征筛选系统获取有关信息;所述召回系统包括用户和文章向量处理子系统,所述用户和文章向量子系统通过对一个打分矩阵做矩阵分解对所述输入信息进行处理。输入信息进行处理。输入信息进行处理。

【技术实现步骤摘要】
一种推送信息的方法和装置


[0001]本专利技术涉及信息
,具体涉及一种推送信息的方法和装置,特别涉及一种召回信息的方法和装置。

技术介绍

[0002]目前,互联网已成为大多数人或许资讯的主要渠道,而相应的,互联网上的资讯数量也成指数级爆炸。特别是随着移动设备的普及和发展,在资讯数量越来越丰富的同时,用户的关注点也被过分的分散,难以获取到有效的信息。
[0003]搜索引擎提供了解决上述问题的一种手段,但是,现有技术中,搜索引擎有赖于用户自身输入关键词进行主动检索,特别是在移动互联网终端下,用户体验不佳,同时也不能解决系统自动获取用户兴趣并完成推送。
[0004]目前,尽管通过前置的特征工程等手段,已经以用户兴趣点为中心,初步构建了分类的数据体系。但是,这些信息在服务器内仍然数量庞大,不能够直接推送给用户。通常,在信息推荐场景中,向用户推荐信息会分为召回阶段和排序(推荐)阶段,分别由召回子系统和排序(推荐)子系统完成。
[0005]召回系统主要实现从特征工程子系统处理完成并存储在服务器的候选信息中,筛选部分信息作为召回信息。技术上则主要基于用户画像和候选推荐信息,采用特征匹配的方式,按照相似程度排序的方式筛选召回信息。具体的,有搜索行为粒度的i2i方式和用户层次的u2i方式。但是,i2i方式,由于采用用户的当前搜索行为作为召回依据,往往召回信息的整体质量偏低,噪音多,包含较多用户不感兴趣的内容;u2i方式中,则由于主要采用一个特征向量召回,所以召回信息往往只能命中用户一个兴趣点,多样性差。
[0006]针对现有技术中的上述问题,目前还没有很好的解决方案,需要一种更为精准高效的召回方式。

技术实现思路

[0007]本专利技术公开了一种推送信息的方法和装置,特别涉及一种召回信息的方法和装置。
[0008]本专利技术公开了一种推送信息的装置,其特征在于:所述装置包括特征筛选系统、召回系统,和/或,排序系统,所述召回系统从特征筛选系统获取有关信息;
[0009]所述特征筛选系统对从客户端获取的信息进行处理,处理结果作为召回系统的输入信息;
[0010]所述召回系统包括用户和文章向量处理子系统,所述用户和文章向量子系统通过对一个打分矩阵做矩阵分解对所述输入信息进行处理。
[0011]一种推送信息的方法,其特征在于:包括以下步骤:
[0012]步骤A1:用户在客户端首页下拉刷新发起请求;
[0013]步骤A2:所述请求由客户端传递给服务端接口,同时,客户端还向所述服务端接口
发送用户和上下文特征;
[0014]步骤A3:所述服务端接收到客户端发来的请求后,再调用推荐系统接口,并向所述推荐系统发送推荐算法模型需要的特征;
[0015]步骤A4:所述推荐系统接收到服务端发来的请求后,会向召回系统请求所要给用户推荐的内容;
[0016]步骤A5:服务端接收到召回系统分别返回的内容集合后,进行排序处理。
[0017]步骤A4中所述数据库优选Redis数据库。
[0018]所述步骤A4进一步包括:用户和文章向量通过对一个打分矩阵做矩阵分解得到的,具体包括:
[0019]步骤A4

1:采用用户协同过滤算法,根据站内所有用户的点击日志采用内容相似度算法计算得到每个内容的协同内容列表;
[0020]步骤A4

2:用户热点召回,所述用户热点召回是指依照热度值计算公式,对用户召回最感兴趣的分类的分类中当前最热的内容,计算内容的热度;
[0021]步骤A4

3:算法模型召回,所述算法模型召回是指通过矩阵分解算法将用户和内容分别进行向量化;
[0022]步骤A4

4:冷启动曝光,所述冷启动曝光是指采用多级流量池模型对新增入库内容进行处理;
[0023]优选的,步骤A4

1中所述相似度算法的计算公式为:
[0024][0025]其中N(a)表示点击内容a的用户数,N(b)表示点击内容b的用户数,N(a)∩N(b)表示既点击a又点击了b的用户数。
[0026]所述步骤A4

2中的热度值计算公式为:
[0027]对于分享、传播率等数值满足第一特征向量的情形,所述热度值=ctr*A+当天整体传播率*B,
[0028]否则,热度值=ctr*C+当天整体传播率*D;
[0029]所述传播率是指站外点击数/分享数;
[0030]所述A、B、C、D为大于1的自然数。
[0031]所述第一特征向量是指ctr、分享数和传播率的组合;优选的,所述第一特征向量是指ctr>E%、分享数大于F且传播率大于G。
[0032]所述E为大于等于5的实数,所述F为大于20的自然数,所述G为大于等于1的实数。
[0033]进一步的,优选的,所述热度值计算公式为:
[0034]如果内容满足累计ctr>8%、分享数大于30且传播率大于1,则热度值=ctr*10000+当天整体传播率*600,
[0035]否则,热度值=ctr*1000+当天整体传播率*60;
[0036]所述传播率是指站外点击数/分享数;
[0037]优选的,对于一些时效性较强的内容,比如早安、午安、晚安,或者比赛直播这种内
容,通过指定曝光时间段及时将这部分内容下线。还有一些异常值的处理,比如ctr做如下规范:
[0038]ctr超过20%设置为20%;
[0039]ctr超过100%的异常数据设置为10%;
[0040]ctr低于3%设置为3%。
[0041]所述步骤A4

3的矩阵分解算法具体包括:
[0042]步骤A4
‑3‑
1:用户和内容分别进行向量化,给用户召回时则采用用户向量与内容向量算内积求相似度的方式,打分矩阵分解形式如下:
[0043][0044]其中,M
(m
×
n)
打分矩阵中每个元素的生成方法是按照用户

内容行为对应表所指定的权值,生成用户对每个内容的一个最终权值,其中,m是代表用户数量的自然数,n是代表内容数量的自然数:;
[0045]步骤A4
‑3‑
2:以将用户的评分和矩阵相乘的评分的平方差尽可能小为目标,以平方差损失作为损失函数,采用线性回归算法进行矩阵分解计算。
[0046]优选的,步骤A4
‑3‑
2中所述损失函数是具体计算方法是通过梯度下降法对损失函数分别对p
i
和q
j
求导:
[0047][0048][0049]同时,由于训练时不是单个样本,因此需要迭代更新,p
i
和q
j
的迭代公式为:
[0050][0051][005本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种推送信息的方法,其特征在于:包括以下步骤:步骤A1:用户在客户端首页下拉刷新发起请求;步骤A2:所述请求由客户端传递给服务端接口,同时,客户端还向所述服务端接口发送用户和上下文特征;步骤A3:所述服务端接收到客户端发来的请求后,再调用推荐系统接口,并向所述推荐系统发送推荐算法模型需要的特征;步骤A4:所述推荐系统接收到服务端发来的请求后,会向召回系统请求所要给用户推荐的内容;步骤A5:服务端接收到召回系统分别返回的内容集合后,进行排序处理;所述步骤A4进一步包括:用户和文章向量通过对一个打分矩阵做矩阵分解得到的,具体包括:步骤A4

1:采用用户协同过滤算法,根据站内所有用户的点击日志采用内容相似度算法计算得到每个内容的协同内容列表;步骤A4

2:用户热点召回,所述用户热点召回是指依照热度值计算公式,对用户召回最感兴趣的分类的分类中当前最热的内容,计算内容的热度;步骤A4

3:算法模型召回,所述算法模型召回是指通过矩阵分解算法将用户和内容分别进行向量化;步骤A4

4:冷启动曝光,所述冷启动曝光是指采用多级流量池模型对新增入库内容进行处理。2.根据权利要求1所述的方法,其特征在于:步骤A4

1中所述相似度算法的计算公式为:为:其中N(a)表示点击内容a的用户数,N(b)表示点击内容b的用户数,N(a)∩N(b)表示既点击a又点击了b的用户数。3.根据权利要求1所述的方法,其特征在于:所述步骤A4

2中的热度值计算公式为:对于分享、传播率等数值满足第一特征向量的情形,所述热度值=ctr*A+当天整体传播率*B,否则,热度值=ctr*C+当天整体传播率*D;所述传播率是指站外点击数/分享数;所述A、B、C、D为大于1的自然数;所述第一特征向量是指ctr、分享数和传播率的组合。4.根据权利要求1所述的方法,其特征在于:所述步骤A4

3的矩阵分解算法具体包括:步骤A4
‑3‑
1:用户和内容分别进行向量化,给用户召回时则采用用户向量与内容向量算内积求相似度的方式,打分矩阵分解形式如下:
其中,M
(m
×
n)
打分矩阵中每个元素的生成方法是按照用户

内容行为对应表所指定的权值,生成用户对每个内容的一个最终权值,其中,m是代表用户数量的自然数,n是代表...

【专利技术属性】
技术研发人员:吴德超田佳伟曾庆学刘科强
申请(专利权)人:北京立达智胜科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1