【技术实现步骤摘要】
信息点击率的确定方法、装置、计算机设备和存储介质
[0001]本申请涉及计算机
,特别是涉及一种信息点击率的确定方法、装置、计算机设备和存储介质。
技术介绍
[0002]点击率是指网页中某一内容,例如,新闻、广告或者产品详情页等被用户点击的次数与被显示次数之比,它反映的是该内容被用户点击的概率。而通过预测用户对某个内容的点击率,可以为是否向该用户推荐该内容相关的信息提供依据。
[0003]在预测用户对某个内容的点击率时,一般会依据用户的年龄、性别等用户特征,以及该内容的类别、关键词信息等内容特征预测用户的点击率。然而,用户的用户特征以及内容的内容特征的复杂度较高,难以保证所预测的点击率的精准性,使得预测的点击率的精准度低。
技术实现思路
[0004]基于此,有必要针对上述技术问题,提供一种能够提高精准度的信息点击率的确定方法、装置、计算机设备和存储介质。
[0005]一种信息点击率的确定方法,所述方法包括:获取与推广信息对应的推广描述内容和推广属性数据,并获取与用户对象对应的用户相关数据,所述用户相关数据至少包括用户属性数据;对所述推广描述内容进行分词处理,得到对应的词序列;基于预先构建的目标词向量字典将所述词序列中的每个词分别映射至对应的向量空间,得到各个词分别对应的词嵌入特征;对所述推广属性数据和所述用户相关数据分别进行编码处理,得到对应的推广属性特征和用户相关特征;基于所述词嵌入特征、所述推广属性特征和所述用户相关特征,确定信息点击率,所述信息点击率表征所述用户对象点击所述 ...
【技术保护点】
【技术特征摘要】
1.一种信息点击率的确定方法,其特征在于,所述方法包括:获取与推广信息对应的推广描述内容和推广属性数据,并获取与用户对象对应的用户相关数据,所述用户相关数据至少包括用户属性数据;对所述推广描述内容进行分词处理,得到对应的词序列;基于预先构建的目标词向量字典将所述词序列中的每个词分别映射至对应的向量空间,得到各个词分别对应的词嵌入特征;对所述推广属性数据和所述用户相关数据分别进行编码处理,得到对应的推广属性特征和用户相关特征;基于所述词嵌入特征、所述推广属性特征和所述用户相关特征,确定信息点击率,所述信息点击率表征所述用户对象点击所述推广信息的概率。2.根据权利要求1所述的方法,其特征在于,所述目标词向量字典是从训练好的词向量模型中获得,所述词向量模型的第一训练步骤包括:获取与样本推广信息对应的样本推广描述内容,并对所述样本推广描述内容进行分词处理,得到对应的各样本分词;从各所述样本分词中选取输入词和相应的关联词,将所述输入词和所述关联词组合为样本词对;所述关联词为所述输入词的上文词或下文词;将所述输入词输入待训练的词向量模型,基于所述待训练的词向量模型中的初始词向量字典,预测各个候选词对应所述关联词的关联概率;根据各个所述候选词分别对应所述关联词的关联概率,构建第一损失函数;通过所述第一损失函数对所述待训练的词向量模型进行训练,以调整所述初始词向量词典,直至达到第一训练停止条件时停止,得到训练好的词向量模型,以及所述训练好的词向量模型中的目标词向量字典。3.根据权利要求2所述的方法,其特征在于,所述从各所述样本分词中选取输入词和相应的关联词,将所述输入词和所述关联词组合为样本词对,包括:获取预设相邻参数,从各所述样本分词中选取输入词,并基于所述预设相邻参数确定各所述样本分词中与所述输入词相应的关联词;将所述输入词分别和每个关联词组合,获得样本词对。4.根据权利要求1所述的方法,其特征在于,所述对所述推广属性数据和所述用户相关数据分别进行编码处理,得到对应的推广属性特征和用户相关特征,包括:当所述推广属性数据属于数值类型时,直接将所述推广属性数据作为对应的推广属性特征;当所述推广属性数据属于非数值类型时,采用独热编码方式对所述推广属性数据进行编码处理,得到对应的推广属性特征;对所述用户相关数据中的用户属性数据进行划分编号后,采用所述独热编码方式进行编码处理,得到对应的用户相关特征;所述用户属性数据至少包括用户性别、用户年龄和用户所属地域中的一种。5.根据权利要求1所述的方法,其特征在于,所述基于所述词嵌入特征、所述推广属性特征和所述用户相关特征,确定信息点击率,包括:将所述词嵌入特征、所述推广属性特征和所述用户相关特征输入点击率预测模型,分
别得到所述点击率预测模型中每个子预测模型输出的子点击率;基于所述每个子预测模型分别输出的子点击率和对应的权重,确定所述用户对象针对所述推广信息的信息点击率。6.根据权利要求1所述的方法,其特征在于,所述基于所述词嵌入特征、所述推广属性特征和所述用户相关特征,确定信息点击率,包括:将各个词分别对应的词嵌入特征进行融合处理,得到所述推广描述内容对应的词嵌入表达;通过点击率预测模型对所述词嵌入表达、所述推广属性特征和所述用户相关特征进行拼接处理,以输出信息点击率。7.根据权利要求6所述的方法,其特征在于,所述点击率预测模型通过第二训练步骤获得,所述第二训练步骤包括:获取与样本推广信息对应的样本推广描述内容和样本推广属性数据,并获取与样本用户对象对应的样本用户相关数据,以及所述样本用户对象对所述样本推广信息的期望点击率;对所述样本推广描述内容进行分词处理,得到对应的各样本分词;通过所述目标词向量字典将所述各样本分词转换为对应的样本词嵌入特征;对所述样本推广属性数据和所述样本用户相关数据分别进行编码处理,得...
【专利技术属性】
技术研发人员:王韵陶,陈炳文,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。