本发明专利技术提供一种广告点击率预估方法和装置,通过接收请求消息,请求消息中包含离散特征,根据离散特征以及映射关系表进行特征抽取,得到离散特征对应的连续值表达向量,加载第一深度神经网络模型以及连续值表达向量至分类器,得到连续值表达向量对应的广告点击率,由于映射关系表中存储离散特征与连续值表达向量的对应关系,因此,可以直接通过映射关系表查找到离散特征对应的连续值表达向量,提高了广告点击率预估的准确性。
Prediction method and device of advertising click through rate
【技术实现步骤摘要】
广告点击率预估方法和装置
本专利技术涉及计算机技术,尤其涉及一种广告点击率预估方法和装置。
技术介绍
广告点击率预估(Click-ThroughRatePrediction,CRP)是通过对用户搜索与点击行为的历史数据进行分析,预测当前的特定状态下,用户点击特定广告的概率。现有技术中,通常采用简单的线性判别模型进行广告点击率预估,例如:逻辑斯特回归(LogisticsRegression,LR)模型、因子分解(FactorizationMachines,FM)模型、矩阵分解(MatrixFactorization,MF)模型或梯度提升决策树(GradientBoostDecisionTree,GBDT)模型等。然而,采用现有技术的线性判别模型进行广告点击率预估,由于模型简单,表达能力有限,广告点击率预估的准确性不高。
技术实现思路
本专利技术提供一种广告点击率预估方法和装置,以提高广告点击率预估的准确性。第一方面,本专利技术提供一种广告点击率预估方法,包括:接收请求消息,所述请求消息中包含离散特征,所述请求消息用于请求预估所述离散特征对应的广告点击率;根据所述离散特征以及映射关系表进行特征抽取,得到所述离散特征对应的连续值表达向量,所述映射关系表用于将所述离散特征映射为连续值表达向量;加载第一深度神经网络模型以及所述连续值表达向量至分类器,得到所述连续值表达向量对应的广告点击率。可选地,所述接收请求消息之前,还包括:根据离散特征样本、至少两个插件以及第二深度神经网络模型,训练得到所述映射关系表以及所述第一深度神经网络模型,所述至少两个插件对应至少两个不同的线性判别模型。可选地,所述根据离散特征样本、至少两个插件以及第二深度神经网络模型,训练得到所述映射关系表,包括:将所述离散特征样本分别输入所述至少两个插件,得到至少两个第一表达向量;将所述至少两个第一表达向量输入所述第二深度神经网络模型,得到第二表达向量,所述第二表达向量为连续值表达向量;根据所述离散特征样本和所述第二表达向量得到所述映射关系表。可选地,所述根据离散特征样本、至少两个插件以及第二深度神经网络模型,训练得到所述第一深度神经网络模型,包括:根据J(θ)=argmaxL(θ)、θt=αθt-1-ηgt以及更新所述至少两个插件以及所述第二深度神经网络模型的参数。其中,表示第二深度神经网络模型的输出,xi表示第二深度神经网络的模型的输入,yi=0表示离散特征样本未被点击,yi=1表示离散特征样本被点击,P(Y=1|x)表示离散特征样本被点击的概率,P(Y=0|x)表示离散特征样本未被点击的概率;α表示动量值,η代表学习率,θt表示t时刻参数θ的值,gt表示t时刻第二深度神经网络模型回传至所述插件的梯度值。可选地,所述插件为下述任一种:逻辑斯特回归LR模型;因子分解FM模型;矩阵分解MF模型;梯度提升决策树GBDT模型。第二方面,本专利技术提供一种广告点击率预估装置,包括:接收模块,用于接收请求消息,所述请求消息中包含离散特征,所述请求消息用于请求预估所述离散特征对应的广告点击率;处理模块,用于根据所述离散特征以及映射关系表进行特征抽取,得到所述离散特征对应的连续值表达向量,所述映射关系表用于将所述离散特征映射为连续值表达向量;所述处理模块,还用于加载第一深度神经网络模型以及所述连续值表达向量至分类器,得到所述连续值表达向量对应的广告点击率。可选地,还包括:训练模块,用于根据离散特征样本、至少两个插件以及第二深度神经网络模型,训练得到所述映射关系表以及所述第一深度神经网络模型,所述至少两个插件对应至少两个不同的线性判别模型。可选地,所述训练模块具体用于将所述离散特征样本分别输入所述至少两个插件,得到至少两个第一表达向量;将所述至少两个第一表达向量输入所述第二深度神经网络模型,得到第二表达向量,所述第二表达向量为连续值表达向量;根据所述离散特征样本和所述第二表达向量得到所述映射关系表。可选地,所述训练模块具体用于根据J(θ)=argmaxL(θ)、θt=αθt-1-ηgt以及更新所述至少两个插件以及所述第二深度神经网络模型的参数;其中,表示第二深度神经网络模型的输出,xi表示第二深度神经网络的模型的输入,yi=0表示离散特征样本未被点击,yi=1表示离散特征样本被点击,P(Y=1|x)表示离散特征样本被点击的概率,P(Y=0|x)表示离散特征样本未被点击的概率;α表示动量值,η代表学习率,θt表示t时刻参数θ的值,gt表示t时刻第二深度神经网络模型回传至所述插件的梯度值。可选地,所述插件为下述任一种:逻辑斯特回归LR模型;因子分解FM模型;矩阵分解MF模型;梯度提升决策树GBDT模型。本专利技术提供的广告点击率预估方法和装置,通过接收请求消息,请求消息中包含离散特征,根据离散特征以及映射关系表进行特征抽取,得到离散特征对应的连续值表达向量,加载第一深度神经网络模型以及连续值表达向量至分类器,得到连续值表达向量对应的广告点击率,由于映射关系表中存储离散特征与连续值表达向量的对应关系,因此,可以直接通过映射关系表查找到离散特征对应的连续值表达向量,提高了广告点击率预估的准确性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术广告点击率预估系统的示意图;图2为本专利技术提供的一种广告点击率预估方法实施例一的流程示意图;图3为本专利技术提供的另一种广告点击率预估方法实施例二的流程示意图;图4为本专利技术提供的再一种广告点击率预估方法实施例三的流程示意图;图5为本专利技术提供的又一种广告点击率预估方法实施例四的流程示意图;图6为本专利技术提供的一种广告点击率预估装置实施例一的结构示意图;图7为本专利技术提供的另一种广告点击率预估装置实施例二的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。在广告点击率预估方法中,不同的广告对应的特征不同,这些特征包括但不限于用户特征和广告内容特征等,用户特征例如用户标识(Identification,ID),广告内容特征例如广告ID,这些特征通常都是离散特征,这些离散特征可以通过字符串表达本文档来自技高网...
【技术保护点】
1.一种广告点击率预估方法,其特征在于,包括:接收请求消息,所述请求消息中包含离散特征,所述请求消息用于请求预估所述离散特征对应的广告点击率;根据所述离散特征以及映射关系表进行特征抽取,得到所述离散特征对应的连续值表达向量,所述映射关系表用于将所述离散特征映射为连续值表达向量;加载第一深度神经网络模型以及所述连续值表达向量至分类器,得到所述连续值表达向量对应的广告点击率。
【技术特征摘要】
1.一种广告点击率预估方法,其特征在于,包括:接收请求消息,所述请求消息中包含离散特征,所述请求消息用于请求预估所述离散特征对应的广告点击率;根据所述离散特征以及映射关系表进行特征抽取,得到所述离散特征对应的连续值表达向量,所述映射关系表用于将所述离散特征映射为连续值表达向量;加载第一深度神经网络模型以及所述连续值表达向量至分类器,得到所述连续值表达向量对应的广告点击率。2.根据权利要求1所述的方法,其特征在于,所述接收请求消息之前,还包括:根据离散特征样本、至少两个插件以及第二深度神经网络模型,训练得到所述映射关系表以及所述第一深度神经网络模型,所述至少两个插件对应至少两个不同的线性判别模型。3.根据权利要求2所述的方法,其特征在于,所述根据离散特征样本、至少两个插件以及第二深度神经网络模型,训练得到所述映射关系表,包括:将所述离散特征样本分别输入所述至少两个插件,得到至少两个第一表达向量;将所述至少两个第一表达向量输入所述第二深度神经网络模型,得到第二表达向量,所述第二表达向量为连续值表达向量;根据所述离散特征样本和所述第二表达向量得到所述映射关系表。4.根据权利要求2所述的方法,其特征在于,所述根据离散特征样本、至少两个插件以及第二深度神经网络模型,训练得到所述第一深度神经网络模型,包括:根据J(θ)=argmaxL(θ)、θt=αθt-1-ηgt以及更新所述至少两个插件以及所述第二深度神经网络模型的参数;其中,表示第二深度神经网络模型的输出,xi表示第二深度神经网络的模型的输入,yi=0表示离散特征样本未被点击,yi=1表示离散特征样本被点击,P(Y=1|x)表示离散特征样本被点击的概率,P(Y=0|x)表示离散特征样本未被点击的概率;α表示动量值,η代表学习率,θt表示t时刻参数θ的值,gt表示t时刻第二深度神经网络模型回传至所述插件的梯度值。5.根据权利要求4所述的方法,其特征在于,所述插件为下述任一种:逻辑斯特回归LR模型;因子分解F...
【专利技术属性】
技术研发人员:赵磊,张秀武,姚春念,
申请(专利权)人:广东神马搜索科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。