模型训练方法及装置制造方法及图纸

技术编号:18019303 阅读:47 留言:0更新日期:2018-05-23 05:23
本申请实施例公开了一种模型训练方法及装置。方法包括:线下系统获取目标模型的多个类型的特征;生成多个类型的特征的特征组合序列,特征组合序列包括多组特征组合和多个特征组合之间的序列关系,特征组合包括多个类型的特征中的至少一个类型的特征;根据特征组合序列划分目标模型为多层级模型,多层级模型中每个层级的特征权值与特征组合序列中对应位置的特征组合中的特征相匹配;针对每个层级的特征权值执行预设训练操作,得到训练后的目标模型,训练后的目标模型中的一个或多个层级用于预估目标推荐任务的推荐结果。本申请实施例有利于提高目标模型处理推荐任务的全面性和准确度。

【技术实现步骤摘要】
模型训练方法及装置
本申请涉及移动终端
,具体涉及模型训练方法及装置。
技术介绍
目前市场上相当一部分个性化推荐模型是基于LR或者RankLR机器学习方法实现的。通过用户历史在系统中的行为(点击、浏览、购买、点评……),训练机器学习模型。利用训练好的模型来预估用户与待推荐物品的相关性分数或者点击通过率(Click-Through-Rate,CTR),根据相关性分数或者CTR选取物品向用户推荐达成个性化推荐的效果。
技术实现思路
本申请实施例提供了模型训练方法及装置,可以提高目标模型处理推荐任务的全面性和准确度。第一方面,本申请实施例提供一种模型训练方法,应用于信息推荐系统,所述信息推荐系统包括线下系统,所述线下系统包括目标模型,所述方法包括:所述线下系统获取所述目标模型的多个类型的特征;所述线下系统生成所述多个类型的特征的特征组合序列,所述特征组合序列包括多组特征组合和所述多个特征组合之间的序列关系,所述特征组合包括所述多个类型的特征中的至少一个类型的特征;所述线下系统根据所述特征组合序列划分所述目标模型为多层级模型,所述多层级模型中每个层级的特征权值与所述特征组合序列中对应位置的特征组合中的特征相匹配;所述线下系统针对所述每个层级的特征权值执行预设训练操作,得到训练后的目标模型,所述训练后的目标模型中的一个或多个层级用于预估目标推荐任务的推荐结果。第二方面,本申请实施例提供一种模型训练装置,应用于信息推荐系统,所述信息推荐系统包括线下系统,所述线下系统包括目标模型,所述模型训练装置包括获取单元、生成单元、划分单元和训练单元,其中,所述获取单元,用于获取所述目标模型的多个类型的特征;所述生成单元,用于生成所述多个类型的特征的特征组合序列,所述特征组合序列包括多组特征组合和所述多个特征组合之间的序列关系,所述特征组合包括所述多个类型的特征中的至少一个类型的特征;所述划分单元,用于根据所述特征组合序列划分所述目标模型为多层级模型,所述多层级模型中每个层级的特征权值与所述特征组合序列中对应位置的特征组合中的特征相匹配;所述训练单元,用于针对所述每个层级的特征权值执行预设训练操作,得到训练后的目标模型,所述训练后的目标模型中的一个或多个层级用于预估目标推荐任务的推荐结果。第三方面,本申请实施例提供一种移动终端,包括处理器、存储器、通信接口以及一个或多个程序,其中,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行本申请实施例第一方面任一方法中的步骤的指令。第四方面,本申请实施例提供了一种计算机可读存储介质,其中,所述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如本申请实施例第一方面任一方法中所描述的部分或全部步骤,所述计算机包括移动终端。第五方面,本申请实施例提供了一种计算机程序产品,其中,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序可操作来使计算机执行如本申请实施例第一方面任一方法中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包,所述计算机包括移动终端。可以看出,本申请实施例中,线下系统首先获取目标模型的多个类型的特征,其次,生成多个类型的特征的特征组合序列,再次,根据特征组合序列划分目标模型为多层级模型,最后,针对每个层级的特征权值执行预设训练操作,得到训练后的目标模型,训练后的目标模型中的一个或多个层级用于预估目标推荐任务的推荐结果。由于上述特征组合序列包括多组特征组合和多个特征组合之间的序列关系,特征组合包括多个类型的特征中的至少一个类型的特征,且多层级模型中每个层级的特征权值与特征组合序列中对应位置的特征组合中的特征相匹配,这使得目标模型在处理特征缺失的推荐任务,能够基于该推荐任务的特征适配对应的模型层级,并使用该对应的模型层级处理该推荐任务以更为准确的得到推荐结果,降低因特征缺失而导致推荐任务的推荐结果出现较大偏差的情况发生,有利于提高目标模型处理推荐任务的全面性和准确度。附图说明下面将对本申请实施例所涉及到的附图作简单地介绍。图1是一种智能手机的程序运行空间的示意图;图2是本申请实施例提供的一种模型训练方法的流程示意图;图3是本申请实施例公开的一种模型训练方法的流程示意图;图4是本申请实施例公开的一种模型训练方法的流程示意图;图5是本申请实施例公开的一种移动终端的结构示意图;图6是本申请实施例公开的一种移动终端的功能单元组成框图。具体实施方式为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。本申请实施例所涉及到的移动终端可以包括各种具有无线通信功能的手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其他处理设备,以及各种形式的用户设备(UserEquipment,UE),移动台(MobileStation,MS),终端设备(terminaldevice)等等。为方便描述,上面提到的设备统称为移动终端。本申请实施例所涉及到的操作系统是对硬件资源进行统一管理,并向用户提供业务接口的软件系统。示例性的,如图1所示,图1是本申请实施例提供的一种信息推荐系统100的系统架构图。该信息推荐系统100的物理形态可以是服务器集群和/或云计算资源,此处不做唯一限定。该信息推荐系统100具体包括线上系统10和线下系统20,线下系统可以是服务器集群,线上系统可以是云计算资源或者服务器集群,其中,线上系统10包括训练好的目标模型11和预估器12,该训练好的目标模型11用于处理实时在线的推荐任务,预估器12用于结合训练好的目标模型11和待处理的推荐任务关联的参考特征数据生成预估先验结果,线下系统20包括训练数据库21、待训练的目标模型22,线下系统20会定时使用训练数据库21中的训练数据来训练待训练的目标模型22,得到训练好的目标模型11,并将该训练好的目标模型11推送给线上系统10使用。一般设计中,基于LR、RankLR个性化推荐模型都是一次过训练模型所有特征的。但是在新增待推荐物品变化非常多的场景效果并不理想,例如新闻推荐,时时刻刻都有新的新闻需要推荐。模型计算新物本文档来自技高网
...
模型训练方法及装置

【技术保护点】
一种模型训练方法,其特征在于,应用于信息推荐系统,所述信息推荐系统包括线下系统,所述线下系统包括目标模型,所述方法包括:所述线下系统获取所述目标模型的多个类型的特征;所述线下系统生成所述多个类型的特征的特征组合序列,所述特征组合序列包括多组特征组合和所述多个特征组合之间的序列关系,所述特征组合包括所述多个类型的特征中的至少一个类型的特征;所述线下系统根据所述特征组合序列划分所述目标模型为多层级模型,所述多层级模型中每个层级的特征权值与所述特征组合序列中对应位置的特征组合中的特征相匹配;所述线下系统针对所述每个层级的特征权值执行预设训练操作,得到训练后的目标模型,所述训练后的目标模型中的一个或多个层级用于预估目标推荐任务的推荐结果。

【技术特征摘要】
1.一种模型训练方法,其特征在于,应用于信息推荐系统,所述信息推荐系统包括线下系统,所述线下系统包括目标模型,所述方法包括:所述线下系统获取所述目标模型的多个类型的特征;所述线下系统生成所述多个类型的特征的特征组合序列,所述特征组合序列包括多组特征组合和所述多个特征组合之间的序列关系,所述特征组合包括所述多个类型的特征中的至少一个类型的特征;所述线下系统根据所述特征组合序列划分所述目标模型为多层级模型,所述多层级模型中每个层级的特征权值与所述特征组合序列中对应位置的特征组合中的特征相匹配;所述线下系统针对所述每个层级的特征权值执行预设训练操作,得到训练后的目标模型,所述训练后的目标模型中的一个或多个层级用于预估目标推荐任务的推荐结果。2.根据权利要求1所述的方法,其特征在于,所述线下系统生成所述多个类型的特征的特征组合序列,包括:所述线下系统确定所述多个类型的特征中每个类型的特征的稳定性;所述线下系统根据所述每个类型的特征的稳定性生成所述特征组合序列。3.根据权利要求2所述的方法,其特征在于,所述线下系统确定每个类型的特征的稳定性,包括:所述线下系统通过第一样本数据训练所述目标模型,得到所述每个类型的特征的第一特征权值;所述线下系统通过第二样本数据训练所述目标模型,得到所述每个类型的特征的第二特征权值;所述线下系统根据所述第一特征权值和所述第二特征权值确定所述每个类型的特征的特征权值的差异性;所述线下系统确定所述第一样本数据和所述第二样本数据中部分特征缺失的样本数据的占比;所述线下系统根据所述占比和所述差异性确定所述每个类型的特征的稳定性。4.根据权利要求1-3任一项所述的方法,其特征在于,所述预设训练操作包括:保持所述多层级模型中除当前层级之外的其他层级的特征权值不变,根据预设样本数据训练所述当前层级的特征权值。5.根据权利要求1-4任一项所述的方法,其特征在于,所述信息推荐系统还包括线上系统;所述线下系统针对所述每个层级的特征权值执行预设训练操作,得到训练后的目标模型之后,所述方法还包括:所述线下系统向所述线上系统发送训练后的所述目标模型,所述训练后的所述目标模...

【专利技术属性】
技术研发人员:朱泰鹏
申请(专利权)人:广东欧珀移动通信有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1