本发明专利技术涉及物料推荐技术领域,公开了一种深度模型推理装置、物料推荐方法及装置。深度模型推理装置包括:部署在K8S集群中的模型管理服务模块、路由服务模块和推荐服务模块;路由服务模块、推荐服务模块和特征服务模块与模型管理服务模块通信连接。物料推荐方法包括:从物品库里进行多路召回,得到多路召回结果;将多路召回结果进行融合,获得混合的召回结果;粗略排序;精准排序;重新排序;输出结果。本申请的技术方案,将推荐请求信息结合用户、物料特征,使用Tensorflow
【技术实现步骤摘要】
一种深度模型推理装置、物料推荐方法及装置
[0001]本专利技术涉及物料推荐
,具体涉及一种深度模型推理装置、物料推荐方法及装置,深度模型推理装置基于Tensorflow
‑
Serving。
技术介绍
[0002]随着深度学习在图像、语言、广告点击率预估等各个领域不断发展,目前的技术发展中,已开始探索深度学习技术在业务层面的实践与应用。目前,现有技术中算法的预见平台主要着眼于为公司内众多不同业务形态的项目方提供多样的新闻、图片、视频、APP等内容的全链路个性化推荐。而在整个推荐过程中,深度模型提供的端到端强大的拟合能力为最终的推荐效果起到了很大的提升作用。
[0003]在目前市场中,还需要继续开发深度模型,以进一步提升算法推荐的各项指标,如收入、点击率、arpu值等。
技术实现思路
[0004]本申请提供一种深度模型推理装置、物料推荐方法及装置,以解决现有技术不满足现有需求的上述技术问题。
[0005]根据本申请的一方面,一种实施例提供了一种深度模型推理装置,包括:部署在K8S集群中的模型管理服务模块、路由服务模块、推荐服务模块和特征服务模块;所述路由服务模块、所述推荐服务模块和所述特征服务模块与所述模型管理服务模块通信连接;所述K8S集群通过http、grpc协议与TF
‑
Serving架构通信连接。
[0006]一种实施例中,所述路由服务模块定时拉取最新的TF
‑
Serving实例信息。
[0007]根据本申请的一方面,一种实施例提供了一种物料推荐方法,包括以下步骤:
[0008]S1.根据用户部分特征,从物品库里进行多路召回,得到多路召回结果;
[0009]S2.将所述多路召回结果进行融合,获得混合的召回结果;
[0010]S3.根据权利要求1或2中的深度模型推理装置,对S2中得到的所述召回结果进行粗略排序;
[0011]S4.根据权利要求1或2中的深度模型推理装置,精准排序;
[0012]S5.基于改进用户体验,重新排序;
[0013]S6.输出结果。
[0014]一种实施例中,步骤S1中,所述多路召回结果包括个性化召回结果、热门召回结果和随机召回结果中的一种或多种。
[0015]一种实施例中,步骤S2中,根据内容库比例和每路召回配置的算法比例进行融合。
[0016]一种实施例中,步骤S3、S4中输出控制源比例。
[0017]一种实施例中,步骤S5中,采用相应的业务策略进行重排。
[0018]一种实施例中,所述业务策略包括去已读、去重、打散、多样性保证和固定类型物品插入的一种或多种。
[0019]根据本申请的一方面,一种实施例提供了一种物料推荐装置,包括:
[0020]召回模块,用于根据用户部分特征,从物品库里进行多路召回,得到多路召回结果;
[0021]融合模块,用于将所述多路召回结果进行融合,获得混合的召回结果;
[0022]粗排模块,用于根据上述的深度模型推理装置,对融合模块中得到的所述召回结果进行粗略排序;
[0023]精排模块,用于根据上述的深度模型推理装置,精准排序;
[0024]重排模块,用于基于改进用户体验,重新排序;
[0025]和
[0026]输出模块,用于输出结果。
[0027]一种实施例中,所述融合模块根据内容库比例和每路召回配置的算法比例进行融合。
[0028]本申请上述实施例的技术方案,是针对某一推荐需求而进行的技术开发。技术方案中,将推荐请求信息结合用户、物料特征,使用Tensorflow
‑
Serving获得推荐物料排序信息,最终将经过算法筛选的物料推送给用户。以进一步提升算法推荐的各项指标,如收入、点击率、arpu值等。
附图说明
[0029]为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0030]图1是一种实施例中深度模型推理装置的推理服务的调用示意图;
[0031]图2是一种实施例中物料推荐方法的流程图;
[0032]图3是一种实施例中深度(排序)模型推理的流程图;
[0033]图4是一种实施例中物料推荐装置的结构示意图。
具体实施方式
[0034]需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
[0035]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
[0036]需要说明的是,本申请中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于
清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0037]应该理解的是,当元件(诸如层、膜、区域、或衬底)描述为在另一元件“上”时,该元件可直接在该另一元件上,或者也可存在中间元件。而且,本申请中,当描述有元件“连接”至另一元件时,该元件可“直接连接”至该另一元件,或者通过第三元件“连接”至该另一元件。
[0038]实施例一
[0039]请参考图1,一种实施例提供了一种深度模型推理装置,包括:部署在K8S集群中的模型管理服务模块、路由服务模块、推荐服务模块和特征服务模块;所述路由服务模块、所述推荐服务模块和所述特征服务模块与所述模型管理服务模块通信连接;所述K8S集群通过http、grpc协议与TF
‑
Serving架构通信连接。也就是说,路由服务、推荐服务、模型管理服务、特征服务均部署在K8S集群中。
[0040]其中,Kubernetes(通常简称为“K8s”)是一种用于自动部署、扩展和管理容器化应用程序的开源容器编排系统。Kubernetes通过将容器组织成逻辑单元(称为“Pod”)来管理应用程序。它可以自动地在集群中的多个节点之间分配容器,并根据需要扩展或缩小应用程序的副本数量。Kubernetes还提供了各种功能,例如负载均衡、自动恢复、自动扩缩容、自动滚动升级等,以确保容器化应本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种深度模型推理装置,其特征在于,包括:部署在K8S集群中的模型管理服务模块、路由服务模块、推荐服务模块和特征服务模块;所述路由服务模块、所述推荐服务模块和所述特征服务模块与所述模型管理服务模块通信连接;所述K8S集群通过http、grpc协议与TF
‑
Serving架构通信连接。2.根据权利要求1所述的一种深度模型推理装置,其特征在于,所述路由服务模块定时拉取最新的TF
‑
Serving实例信息。3.一种物料推荐方法,其特征在于,包括以下步骤:S1,根据用户部分特征,从物品库里进行多路召回,得到多路召回结果;S2,将所述多路召回结果进行融合,获得混合的召回结果;S3,根据权利要求1或2中的深度模型推理装置,对S2中得到的所述召回结果进行粗略排序;S4,根据权利要求1或2中的深度模型推理装置,精准排序;S5,基于改进用户体验,重新排序;S6,输出结果。4.根据权利要求3所述的一种物料推荐方法,其特征在于,步骤S1中,所述多路召回结果包括个性化召回结果、热门召回结果和随机召回结果中的一种或多种。...
【专利技术属性】
技术研发人员:张锦麟,
申请(专利权)人:上海二三四五网络科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。