信息点击率的确定方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:28477463 阅读:13 留言:0更新日期:2021-05-15 21:46
本申请涉及一种信息点击率的确定方法、装置、计算机设备和存储介质。该方法包括:获取与推广信息对应的推广描述内容和推广属性数据,并获取与用户对象对应的用户相关数据,该用户相关数据至少包括用户属性数据;对推广描述内容进行分词处理,得到对应的词序列;基于预先构建的目标词向量字典将词序列中的每个词分别映射至对应的向量空间,得到各个词分别对应的词嵌入特征;对推广属性数据和用户相关数据分别进行编码处理,得到对应的推广属性特征和用户相关特征;基于词嵌入特征、推广属性特征和用户相关特征,确定信息点击率,信息点击率表征用户对象点击推广信息的概率。采用本方法能够提高信息点击率预估的精准度。能够提高信息点击率预估的精准度。能够提高信息点击率预估的精准度。

【技术实现步骤摘要】
信息点击率的确定方法、装置、计算机设备和存储介质


[0001]本申请涉及计算机
,特别是涉及一种信息点击率的确定方法、装置、计算机设备和存储介质。

技术介绍

[0002]点击率是指网页中某一内容,例如,新闻、广告或者产品详情页等被用户点击的次数与被显示次数之比,它反映的是该内容被用户点击的概率。而通过预测用户对某个内容的点击率,可以为是否向该用户推荐该内容相关的信息提供依据。
[0003]在预测用户对某个内容的点击率时,一般会依据用户的年龄、性别等用户特征,以及该内容的类别、关键词信息等内容特征预测用户的点击率。然而,用户的用户特征以及内容的内容特征的复杂度较高,难以保证所预测的点击率的精准性,使得预测的点击率的精准度低。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够提高精准度的信息点击率的确定方法、装置、计算机设备和存储介质。
[0005]一种信息点击率的确定方法,所述方法包括:获取与推广信息对应的推广描述内容和推广属性数据,并获取与用户对象对应的用户相关数据,所述用户相关数据至少包括用户属性数据;对所述推广描述内容进行分词处理,得到对应的词序列;基于预先构建的目标词向量字典将所述词序列中的每个词分别映射至对应的向量空间,得到各个词分别对应的词嵌入特征;对所述推广属性数据和所述用户相关数据分别进行编码处理,得到对应的推广属性特征和用户相关特征;基于所述词嵌入特征、所述推广属性特征和所述用户相关特征,确定信息点击率,所述信息点击率表征所述用户对象点击所述推广信息的概率。
[0006]一种信息点击率的确定装置,所述装置包括:获取模块,用于获取与推广信息对应的推广描述内容和推广属性数据,并获取与用户对象对应的用户相关数据,所述用户相关数据至少包括用户属性数据;分词模块,用于对所述推广描述内容进行分词处理,得到对应的词序列;映射模块,用于基于预先构建的目标词向量字典将所述词序列中的每个词分别映射至对应的向量空间,得到各个词分别对应的词嵌入特征;编码模块,用于对所述推广属性数据和所述用户相关数据分别进行编码处理,得到对应的推广属性特征和用户相关特征;确定模块,用于基于所述词嵌入特征、所述推广属性特征和所述用户相关特征,确定信息点击率,所述信息点击率表征所述用户对象点击所述推广信息的概率。
[0007]一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取与推广信息对应的推广描述内容和推广属性数据,并获取与用户对象对应的用户相关数据,所述用户相关数据至少包括用户属性数据;对所述推广描述内容进行分词处理,得到对应的词序列;基于预先构建的目标词向量字典将所述词序列中的每个词分别映射至对应的向量空间,得到各个词分别对应的词嵌入特征;对所述推广属性数据和所述用户相关数据分别进行编码处理,得到对应的推广属性特征和用户相关特征;基于所述词嵌入特征、所述推广属性特征和所述用户相关特征,确定信息点击率,所述信息点击率表征所述用户对象点击所述推广信息的概率。
[0008]一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:获取与推广信息对应的推广描述内容和推广属性数据,并获取与用户对象对应的用户相关数据,所述用户相关数据至少包括用户属性数据;对所述推广描述内容进行分词处理,得到对应的词序列;基于预先构建的目标词向量字典将所述词序列中的每个词分别映射至对应的向量空间,得到各个词分别对应的词嵌入特征;对所述推广属性数据和所述用户相关数据分别进行编码处理,得到对应的推广属性特征和用户相关特征;基于所述词嵌入特征、所述推广属性特征和所述用户相关特征,确定信息点击率,所述信息点击率表征所述用户对象点击所述推广信息的概率。
[0009]上述信息点击率的确定方法、装置、计算机设备和存储介质,获取与推广信息对应的推广描述内容和推广属性数据,并获取与用户对象对应的用户相关数据,对推广描述内容进行分词处理,得到对应的词序列,基于预先构建的目标词向量字典将词序列中的每个词分别映射至对应的向量空间,得到各个词分别对应的词嵌入特征,从而能够将推广描述内容的文字信息转换为可计算的数值特征,可以有效完整地表达原始数据的信息,从信息源头保证数据的完整性和有效性。对推广属性数据和用户相关数据分别进行编码处理,得到对应的推广属性特征和用户相关特征,基于词嵌入特征、推广属性特征和用户相关特征,能够准确预测用户对象点击推广信息的信息点击率,从而提升信息点击率预估的精准度。
附图说明
[0010]图1为一个实施例中信息点击率的确定方法的应用环境图;图2为一个实施例中信息点击率的确定方法的流程示意图;图3为一个实施例中词向量模型的训练步骤的流程示意图;图4为一个实施例中词向量模型的输入和输出的示意图;图5为一个实施例中对推广属性数据和用户相关数据分别进行编码处理,得到对应的推广属性特征和用户相关特征的流程示意图;图6为一个实施例中点击率预测模型的训练步骤的流程示意图;
图7为另一个实施例中点击率预测模型的训练步骤的流程示意图;图8为另一个实施例中信息点击率的确定方法的流程示意图;图9为一个实施例中信息点击率的确定装置的结构框图;图10为一个实施例中计算机设备的内部结构图。
具体实施方式
[0011]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[0012]本申请涉及人工智能(Artificial Intelligence,AI)
,其中,人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。本申请实施例提供的方案涉及人工智能的信息点击率的确定方法,具体通过如下各实施例进行说明。
[0013]本申请提供的信息点击率的确定方法,可以应用于如图1所示的信息点击率确定系统。如图1所示,该信息点击率确定系统包括终端110和服务器120。在一个实施例中,终端110和服务器120均可单独执行本申请实施例中提供的信息点击率的确定方法。终端110和服务器120也可协同用于执行本申请实施例中提供的信息点击率的确定方法。当终端110和服务器120协同用于执行本申请实施例中提供的信息点击率的确定方法时,终端110获取与推广信息对应的推广描述内容和推广属性数据,并获取与用户对象对应的用户相关数据,该用户相关数据至少包括用户属性数据。终端110对推广描述内容进行分词处理,得到对应的词序列。终端110基于预先构建的目标词向量字典将词序列中的每个词分别映射至对应的向量空间,得到各个词分本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息点击率的确定方法,其特征在于,所述方法包括:获取与推广信息对应的推广描述内容和推广属性数据,并获取与用户对象对应的用户相关数据,所述用户相关数据至少包括用户属性数据;对所述推广描述内容进行分词处理,得到对应的词序列;基于预先构建的目标词向量字典将所述词序列中的每个词分别映射至对应的向量空间,得到各个词分别对应的词嵌入特征;对所述推广属性数据和所述用户相关数据分别进行编码处理,得到对应的推广属性特征和用户相关特征;基于所述词嵌入特征、所述推广属性特征和所述用户相关特征,确定信息点击率,所述信息点击率表征所述用户对象点击所述推广信息的概率。2.根据权利要求1所述的方法,其特征在于,所述目标词向量字典是从训练好的词向量模型中获得,所述词向量模型的第一训练步骤包括:获取与样本推广信息对应的样本推广描述内容,并对所述样本推广描述内容进行分词处理,得到对应的各样本分词;从各所述样本分词中选取输入词和相应的关联词,将所述输入词和所述关联词组合为样本词对;所述关联词为所述输入词的上文词或下文词;将所述输入词输入待训练的词向量模型,基于所述待训练的词向量模型中的初始词向量字典,预测各个候选词对应所述关联词的关联概率;根据各个所述候选词分别对应所述关联词的关联概率,构建第一损失函数;通过所述第一损失函数对所述待训练的词向量模型进行训练,以调整所述初始词向量词典,直至达到第一训练停止条件时停止,得到训练好的词向量模型,以及所述训练好的词向量模型中的目标词向量字典。3.根据权利要求2所述的方法,其特征在于,所述从各所述样本分词中选取输入词和相应的关联词,将所述输入词和所述关联词组合为样本词对,包括:获取预设相邻参数,从各所述样本分词中选取输入词,并基于所述预设相邻参数确定各所述样本分词中与所述输入词相应的关联词;将所述输入词分别和每个关联词组合,获得样本词对。4.根据权利要求1所述的方法,其特征在于,所述对所述推广属性数据和所述用户相关数据分别进行编码处理,得到对应的推广属性特征和用户相关特征,包括:当所述推广属性数据属于数值类型时,直接将所述推广属性数据作为对应的推广属性特征;当所述推广属性数据属于非数值类型时,采用独热编码方式对所述推广属性数据进行编码处理,得到对应的推广属性特征;对所述用户相关数据中的用户属性数据进行划分编号后,采用所述独热编码方式进行编码处理,得到对应的用户相关特征;所述用户属性数据至少包括用户性别、用户年龄和用户所属地域中的一种。5.根据权利要求1所述的方法,其特征在于,所述基于所述词嵌入特征、所述推广属性特征和所述用户相关特征,确定信息点击率,包括:将所述词嵌入特征、所述推广属性特征和所述用户相关特征输入点击率预测模型,分
别得到所述点击率预测模型中每个子预测模型输出的子点击率;基于所述每个子预测模型分别输出的子点击率和对应的权重,确定所述用户对象针对所述推广信息的信息点击率。6.根据权利要求1所述的方法,其特征在于,所述基于所述词嵌入特征、所述推广属性特征和所述用户相关特征,确定信息点击率,包括:将各个词分别对应的词嵌入特征进行融合处理,得到所述推广描述内容对应的词嵌入表达;通过点击率预测模型对所述词嵌入表达、所述推广属性特征和所述用户相关特征进行拼接处理,以输出信息点击率。7.根据权利要求6所述的方法,其特征在于,所述点击率预测模型通过第二训练步骤获得,所述第二训练步骤包括:获取与样本推广信息对应的样本推广描述内容和样本推广属性数据,并获取与样本用户对象对应的样本用户相关数据,以及所述样本用户对象对所述样本推广信息的期望点击率;对所述样本推广描述内容进行分词处理,得到对应的各样本分词;通过所述目标词向量字典将所述各样本分词转换为对应的样本词嵌入特征;对所述样本推广属性数据和所述样本用户相关数据分别进行编码处理,得...

【专利技术属性】
技术研发人员:王韵陶陈炳文
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1