在线特征确定方法、装置、电子设备及存储介质制造方法及图纸

技术编号:20243473 阅读:19 留言:0更新日期:2019-01-29 23:38
本申请公开了一种在线特征确定方法,属于计算机技术领域,解决现有技术中无法灵活增加新特征的问题。本申请实施例公开的在线特征确定方法包括:根据预测需求加载目标模型;根据所述目标模型的预设配置信息,确定所述目标模型的输入特征的第一特征维度以及组合生成所述第一特征维度的组合机制描述信息;根据所述组合机制描述信息,确定所述输入特征的特征值。本申请实施例公开的在线特征确定方法通过配置信息设置模型需要的特征维度以及特征维度生成方法,从而在线进行特征交叉计算生成新的特征,极大提升了特征的扩展性。

【技术实现步骤摘要】
在线特征确定方法、装置、电子设备及存储介质
本申请涉及计算机
,特别是涉及一种在线特征确定方法、装置、电子设备及存储介质。
技术介绍
在O2O搜索推荐场景中,基于机器学习的排序是一个重要环节,排序效果的好坏直接影响用户体验和O2O平台的收益。其中特征决定了排序效果的上限。目前大多数排序算法,在获取特征时主要事先通过离线任务将不同维度和来源的数据关联在一起,然后提供一个特征数据的查询接口。申请人发现,现有技术中基于离线任务产生特征的方式存在以下问题:无法很好的保证线上特征和离线特征数据的一致,从而影响排序效果;只能依赖人工增加大量离线任务来增加新特征,无法灵活增加新特征,从而影响了特征的扩展性。
技术实现思路
本申请提供一种在线特征确定方法,解决现有技术中以上至少一个问题。第一方面,本申请实施例提供了一种在线特征确定方法,包括:根据预测需求加载目标模型;根据所述目标模型的预设配置信息,确定所述目标模型的输入特征的第一特征维度以及组合生成所述第一特征维度的组合机制描述信息;根据所述组合机制描述信息,确定所述输入特征的特征值。第二方面,本申请实施例提供了一种在线特征确定装置,包括:目标模型加载模块,用于根据预测需求加载目标模型;特征及组合机制描述信息确定模块,用于根据所述目标模型的预设配置信息,确定所述目标模型的输入特征的第一特征维度以及组合生成所述第一特征维度的组合机制描述信息;特征在线确定模块,用于根据所述组合机制描述信息,确定所述输入特征的特征值。第三方面,本申请实施例还公开了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本申请实施例所述的在线特征确定方法。第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时本申请实施例公开的在线特征确定方法的步骤。本申请实施例公开的在线特征确定方法,通过根据预测需求加载目标模型,然后,根据所述目标模型的预设配置信息,确定所述目标模型的输入特征的第一特征维度以及组合生成所述第一特征维度的组合机制描述信息;最后,根据所述组合机制描述信息,确定所述输入特征的特征值,解决了现有技术中无法灵活增加新特征的问题。本申请实施例公开的在线特征确定方法通过配置信息设置模型需要的特征维度以及特征维度生成方法,从而在线进行特征交叉计算生成新的特征,极大提升了特征的扩展性。附图说明为了更清楚地说明本申请实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本申请实施例一的在线特征确定方法流程图;图2是本申请实施例二的在线特征确定方法的流程图;图3是本申请实施例二的复合特征组合机制的描述信息示意图;图4是本申请实施例二的复合特征定义数据示意图;图5是本申请实施例二的抽象算法树示意图;图6是本申请实施例三的在线特征确定装置结构示意图之一;图7是本申请实施例三的在线特征确定装置的结构示意图之二。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。实施例一本实施例公开的一种在线特征确定方法,如图1所示,该方法包括:步骤110至步骤130。步骤110,根据预测需求加载目标模型。本申请具体实施时,预先构建了策略数据,所述策略数据包括模型数据。其中,模型数据包括模型库和模型文件。例如,所述模型数据包括O2O搜索推荐业务在线排序的机器学习排序模型,如:逻辑回归模型和模型文件、梯度提升决策树及模型文件、深度学习模型及模型文件等。具体实施时,不同的应用场景或业务需求需要加载不同的模型,需要根据预测需求从预设的策略数据中加载目标模型。以商户搜索为例,商户搜索请求包含用户信息(如用户标识、位置等),然后,根据预设的模型映射信息(如用户的请求流量类型)确定逻辑回归模型为目标模型,之后,加载所述逻辑回归模型。本申请实施例中所述的模型数据是一种离线文件,在线使用的时候,必须加载到计算机的内存中,所以通过对所述模型文件进行解析,然后在内存中创建目标模型的实例,以实现模型加载。所述商户搜索请求包含的召回商户的条件信息(条件例如:中山公园美食),将作为数据服务的输入信息,以获取待排序的数据。步骤120,根据所述目标模型的预设配置信息,确定所述目标模型的输入特征的第一特征维度以及组合生成所述第一特征维度的组合机制描述信息。本申请具体实施时,所述策略数据还包括特征元数据。所述特征元数据包括模型需要的输入特征和复合特征定义数据。例如,所述特征元数据可以包括:索引特征、服务特征、键值特征以及复合特征等,所述特征元数据还包括复合特征定义数据。所述复合特征定义数据包括各种复合特征的声明,以及组合生成所述复合特征需要的特征处理算子的定义和实现。在本申请的一些实施例中,所述模型文件中预置有配置信息,所述配置信息中包括相应模型需要的输入特征的维度信息以及组合生成所述输入特征的组合机制描述信息。在本申请的另一些实施例中,可以通过独立的模型与输入特征对应关系文件存储各模型需要的输入特征的维度信息和组合生成所述输入特征的组合机制描述信息。在目标模型加载完成之后,所述目标模型对应的输入特征和组合生成所述输入特征的组合机制描述信息即可通过模型文件或模型与输入特征对应关系文件确定。步骤130,根据所述组合机制描述信息,确定所述输入特征的特征值。进一步的,根据确定的输入特征的维度信息确定所述输入特征所述复合特征属性,并进一步确定所述输入特征对应的复合特征定义数据。然后,根据所述组合机制描述信息生成组合生成所述输入特征的组合机制的定义,所述组合机制的定义为由第二特征维度、特征处理算子组成的算法定义,如算法公式。然后,通过继承所述复合特征定义数据中定义的特征处理算子的实现,作为所述组合机制的定义中引用的所述特征处理算子的实现。最后,通过根据所述组合机制的定义,实例化组合机制。实例化的组合机制类似于创建了特征组合线程,通过执行所述组合机制实例,既可以根据所述第二特征维度的特征值计算出所述输入特征的特征值。本申请实施例公开的在线特征确定方法,通过根据预测需求加载目标模型,然后,根据所述目标模型的预设配置信息,确定所述目标模型的输入特征的第一特征维度以及组合生成所述第一特征维度的组合机制描述信息;最后,根据所述组合机制描述信息,确定所述输入特征的特征值,解决了现有技术中无法灵活增加新特征的问题。本申请实施例公开的在线特征确定方法通过配置信息设置模型需要的特征维度以及特征维度生成方法,从而在线进行特征交叉计算生成新的特征,极大提升了特征的扩展性。实施例二本实施例公开的一种在线特征确定方法,如图2所示,该方法包括:步骤210至步骤270。步骤210,预置策略数据。在本申请的一些实施例中,所述策略数据包括模型数据和特征元数据。其中,模型数据包括模型库和模型文件本文档来自技高网...

【技术保护点】
1.一种在线特征确定方法,其特征在于,包括:根据预测需求加载目标模型;根据所述目标模型的预设配置信息,确定所述目标模型的输入特征的第一特征维度以及组合生成所述第一特征维度的组合机制描述信息;根据所述组合机制描述信息,确定所述输入特征的特征值。

【技术特征摘要】
1.一种在线特征确定方法,其特征在于,包括:根据预测需求加载目标模型;根据所述目标模型的预设配置信息,确定所述目标模型的输入特征的第一特征维度以及组合生成所述第一特征维度的组合机制描述信息;根据所述组合机制描述信息,确定所述输入特征的特征值。2.根据权利要求1所述的方法,其特征在于,所述组合机制描述信息包括依序排列的所述第一特征维度、特征处理算子和第二特征维度,所述根据所述组合机制描述信息,确定所述输入特征的特征值的步骤,包括:根据所述组合机制描述信息,确定组合生成所述第一特征维度的组合机制的定义,其中,所述组合机制用于指示通过所述特征处理算子对所述第二特征维度的特征值进行运算处理得到所述第一特征维度的特征值的算法;根据预设的复合特征定义数据和所述组合机制的定义,实例化所述组合机制;通过执行所述组合机制的实例对所述第二特征维度的特征值进行组合运算,确定所述输入特征的特征值。3.根据权利要求2所述的方法,其特征在于,所述根据预设的复合特征定义数据和所述组合机制的定义,实例化所述组合机制的步骤,包括:根据预设的复合特征定义数据,确定所述第一特征维度对应的所述复合特征定义数据中对所述特征处理算子的定义;根据所述特征处理算子的定义和所述组合机制的定义,确定所述组合机制的实现;根据所述组合机制的实现,实例化所述组合机制。4.根据权利要求2所述的方法,其特征在于,所述根据所述组合机制描述信息,确定组合生成所述第一特征维度的组合机制的定义的步骤,包括:将所述第二特征维度作为叶子节点,将所述第一特征维度作为根节点,将所述特征处理算子按照由所述第二特征维度向所述第一特征维度的排列顺序逐级作为所述叶子节点的上一级父节点,生成抽象算法树,其中,所述父节点用于指示对下一级节点生成的值执行的运算处理;根据所述抽象算法树,确定所述组合机制的定义。5.根据权利要求4所述的方法,其特征在于,所述特征处理算子包括逻辑运算符、函数。6.根据权利要求1至5任一项所述的方法,其特征在于,所述根据所述组合机制描述信息,确定所述输入特征的特征值的步骤之后,还包括:将所述输入特征的特征值输入至所述目标模型,确定所述特征值的预测结果;通过所述预测结果、所述输入特征,更新所述目标模型的训练样本;基于更新后的所述训练样本,更新训练所述目标模型。7.一种在线特征确定装置,其特征在于,包括:目标模型加载模块,用于根据预测需求加载目标模型;特征及组合机制描述信息确定模块,用于根据所述目标模型的预设配置信息,确定所述目标模...

【专利技术属性】
技术研发人员:陈孝峰张弓
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1