System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请实施例涉及数据处理的,具体而言,涉及一种广告召回方法、装置和存储介质。
技术介绍
1、随着广告业务的快速发展,广告召回作为广告展现链路的第一个环节,也引起了人们广泛的关注,广告召回的作用主要是在有限的时间内为用户召回广告候选集,然后经过后续的排序等确定可以投放给用户的广告。
2、目前的广告召回方法主要包括用户标签召回以及用户向量召回两种方法,但是在用户标签召回方法中,仅考虑了用户的历史购买商品的行为召回广告,导致广告召回结果不够准确;而在用户向量召回中,根据用户针对广告的点击以及转化的行为将用户和广告映射到同一维度的向量空间中,为用户向量召回距离最近的若干个广告向量作为召回的广告候选集合。
3、但是目前这两种广告召回方法忽视了用户的兴趣对于广告的影响,使得广告召回的结果与用户的兴趣适配性较低,影响了使得广告投放的效果较差。
技术实现思路
1、本申请实施例提供一种广告召回方法、装置和存储介质,旨在召回更符合用户兴趣的广告。
2、第一方面,本申请实施例提供一种广告召回方法,所述方法包括:
3、获取多个用户中每个用户各自对应的基础特征数据和行为统计数据;
4、根据所述多个用户中每个用户各自对应的基础特征数据和行为统计数据,确定所述每个用户对应的兴趣标签集合,所述兴趣标签集合中包括所述每个用户对应的多个兴趣标签以及所述多个兴趣标签各自的标签权重;
5、根据所述每个用户对应的多个兴趣标签以及所述多个兴趣标签各自的标
6、根据所述每个用户的用户向量与多个广告各自对应的广告向量之间的距离,在所述多个广告中确定召回的候选广告集合。
7、可选地,根据所述多个用户中每个用户各自对应的基础特征数据和行为统计数据,确定所述每个用户对应的兴趣标签集合,包括:
8、将所述多个用户中每个用户各自对应的基础特征数据和行为统计数据输入每个兴趣标签对应的标签预测模型;
9、所述每个兴趣标签对应的标签预测模型,输出所述多个用户各自对应的该兴趣标签的标签权重;
10、根据所述多个用户中每个用户各自对应的所有兴趣标签的标签权重,构建所述每个用户对应的兴趣标签集合。
11、可选地,所述每个兴趣标签对应的标签预测模型是根据每个兴趣标签的种子人群的基础特征数据和行为统计数据作为正样本,所述每个兴趣标签的非种子人群的基础特征数据和行为统计数据作为负样本训练得到的。
12、可选地,根据所述多个用户中每个用户各自对应的所有兴趣标签的标签权重,构建所述每个用户对应的兴趣标签集合,包括:
13、对所述每个兴趣标签对应的标签预测模型,将该标签预测模型输出的所述多个用户各自对应的该兴趣标签的标签权重按照递减顺序排序;
14、根据任一用户对应的该兴趣标签的标签权重在所述多个用户中的排名,按照预设规则确定该用户的兴趣标签集合中是否添加该兴趣标签以及添加的兴趣标签对应的标签权重。
15、可选地,根据所述每个用户对应的多个兴趣标签以及所述多个兴趣标签各自的标签权重,生成所述每个用户的用户向量,包括:
16、根据所述每个用户对应的多个兴趣标签,生成所述每个用户的多个兴趣标签各自对应的标签向量,其中,每个兴趣标签对应一个标签向量;
17、根据所述每个用户的多个兴趣标签各自对应的标签向量和每个兴趣标签各自的标签权重,加权求和得到所述每个用户的用户向量。
18、可选地,所述方法还包括:
19、获取所有的兴趣标签和所述多个广告各自对应的广告数据;
20、将所述所有的兴趣标签输入用户标签广告向量模型的用户侧,将所述多个广告各自对应的广告数据输入所述用户标签广告向量模型的广告侧;
21、基于所述用户标签广告向量模型,输出所述所有的兴趣标签各自对应的标签向量和所述多个广告各自对应的广告向量;
22、根据所述所有的兴趣标签各自对应的标签向量,构建标签向量词典;
23、根据所述多个广告各自对应的广告向量,构建广告向量词典。
24、可选地,根据所述每个用户对应的多个兴趣标签以及所述多个兴趣标签各自的标签权重,生成所述每个用户的用户向量,包括:
25、根据所述每个用户对应的多个兴趣标签,在所述标签向量词典中获取所述每个用户对应的多个兴趣标签各自的标签向量;
26、根据所述每个用户对应的多个兴趣标签各自的标签向量和每个兴趣标签各自的标签权重,加权求和得到所述每个用户的用户向量。
27、可选地,根据所述每个用户的用户向量与多个广告各自对应的广告向量之间的距离,在所述多个广告中确定召回的候选广告集合,包括:
28、计算所述每个用户的用户向量与所述广告向量词典中多个广告各自对应的广告向量之间的余弦距离;
29、对于任一用户,将所述余弦距离大于距离阈值的广告作为候选广告,添加在该用户的候选广告集合中。
30、可选地,所述方法还包括:
31、获取多个样本用户的基础特征数据和行为统计数据,并确定所述多个样本用户各自的基础兴趣标签;
32、根据所述多个样本用户各自的基础兴趣标签,将所述多个样本用户划分为每个兴趣标签的种子人群;
33、将所述每个兴趣标签的种子人群中所有样本用户的基础特征数据和行为统计数据作为多个正样本;
34、在所述每个兴趣标签的非种子人群进行随机负采样,将所述非种子人群中的多个样本用户的基础特征数据和行为统计数据作为多个负样本;
35、将所述每个兴趣标签对应的多个正样本和多个负样本输入预设模型,训练得到所述每个兴趣标签对应的标签预测模型;
36、其中,所述每个兴趣标签对应的标签预测模型用于基于每个用户各自对应的基础特征数据和行为统计数据,确定是否为所述每个用户添加该兴趣标签以及该兴趣标签对应的标签权重。
37、第二方面,本申请实施例提供一种广告召回装置,所述装置包括:
38、获取模块,用于获取多个用户中每个用户各自对应的基础特征数据和行为统计数据;
39、兴趣标签确定模块,用于根据所述多个用户中每个用户各自对应的基础特征数据和行为统计数据,确定所述每个用户对应的兴趣标签集合,所述兴趣标签集合中包括所述每个用户对应的多个兴趣标签以及所述多个兴趣标签各自的标签权重;
40、用户向量确定模块,用于根据所述每个用户对应的多个兴趣标签以及所述多个兴趣标签各自的标签权重,生成所述每个用户的用户向量;
41、广告召回模块,用于根据所述每个用户的用户向量与多个广告各自对应的广告向量之间的距离,在所述多个广告中确定召回的候选广告集合。
42、第三方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如实施例本文档来自技高网...
【技术保护点】
1.一种广告召回方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,根据所述多个用户中每个用户各自对应的基础特征数据和行为统计数据,确定所述每个用户对应的兴趣标签集合,包括:
3.根据权利要求2所述的方法,其特征在于,所述每个兴趣标签对应的标签预测模型是根据每个兴趣标签的种子人群的基础特征数据和行为统计数据作为正样本,所述每个兴趣标签的非种子人群的基础特征数据和行为统计数据作为负样本训练得到的。
4.根据权利要求2所述的方法,其特征在于,根据所述多个用户中每个用户各自对应的所有兴趣标签的标签权重,构建所述每个用户对应的兴趣标签集合,包括:
5.根据权利要求1所述的方法,其特征在于,根据所述每个用户对应的多个兴趣标签以及所述多个兴趣标签各自的标签权重,生成所述每个用户的用户向量,包括:
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
7.根据权利要求6所述的方法,其特征在于,根据所述每个用户对应的多个兴趣标签以及所述多个兴趣标签各自的标签权重,生成所述每个用户的用户向量,包括
8.根据权利要求6或7所述的方法,其特征在于,根据所述每个用户的用户向量与多个广告各自对应的广告向量之间的距离,在所述多个广告中确定召回的候选广告集合,包括:
9.根据权利要求1-7任一项所述的方法,其特征在于,所述方法还包括:
10.一种广告召回装置,其特征在于,所述装置包括:
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至9中任一项所述的广告召回方法。
...【技术特征摘要】
1.一种广告召回方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,根据所述多个用户中每个用户各自对应的基础特征数据和行为统计数据,确定所述每个用户对应的兴趣标签集合,包括:
3.根据权利要求2所述的方法,其特征在于,所述每个兴趣标签对应的标签预测模型是根据每个兴趣标签的种子人群的基础特征数据和行为统计数据作为正样本,所述每个兴趣标签的非种子人群的基础特征数据和行为统计数据作为负样本训练得到的。
4.根据权利要求2所述的方法,其特征在于,根据所述多个用户中每个用户各自对应的所有兴趣标签的标签权重,构建所述每个用户对应的兴趣标签集合,包括:
5.根据权利要求1所述的方法,其特征在于,根据所述每个用户对应的多个兴趣标签以及所述多个兴趣标签各自的标签权重,生成所述每个用...
【专利技术属性】
技术研发人员:李旸,
申请(专利权)人:上海众源网络有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。