本公开关于一种兴趣特征数据的获取方法、装置、电子设备以及存储介质,属于计算机领域,所述方法包括:获取第一兴趣特征数据和第二兴趣特征数据,第一兴趣特征数据用于表征目标账户第一时间段的兴趣特征,第二兴趣特征数据表征用于目标账户第二时间段的兴趣特征,第一时间段大于第二时间段,利用第一兴趣特征数据和第二兴趣特征数据,确定兴趣倾向权重,兴趣倾向权重用于表征目标账户的各兴趣倾向程度,基于兴趣倾向权重和预先构建的兴趣空间数据,确定第三兴趣特征数据,兴趣空间数据用于表征系统兴趣集合中每个兴趣的本身特征,第三兴趣特征数据用于表征所述目标账户的整体兴趣。本公开丰富了兴趣特征数据,有利于兴趣特征的多样性。性。性。
【技术实现步骤摘要】
兴趣特征数据的获取方法、装置、电子设备以及存储介质
[0001]本申请涉及计算机
,尤其涉及一种兴趣特征数据的获取方法、装置、电子设备以及存储介质。
技术介绍
[0002]在推荐系统中,无论是推荐模型的训练,还是推荐模型的推理,都需要输入兴趣特征数据,这使得兴趣特征数据对推荐模型的性能有着直接的影响。
[0003]现有的兴趣特征数据的获取方式通常是基于历史序列数据或者显示记录的兴趣标签来获得,这些数据常常比较单一,并不能全面地表征出兴趣特征,直接影响到推荐模型性能。
技术实现思路
[0004]本申请提供一种兴趣特征数据的获取方法,以至少解决相关技术中兴趣特征数据过于单一的问题。
[0005]根据本申请公开实施例的第一方面,提供一种兴趣特征数据的获取方法,包括:
[0006]获取第一兴趣特征数据和第二兴趣特征数据,其中,第一兴趣特征数据用于表征目标账户第一时间段的兴趣特征,第二兴趣特征数据用于表征目标账户第二时间段的兴趣特征,第一时间段大于第二时间段,
[0007]利用第一兴趣特征数据和第二兴趣特征数据,确定兴趣倾向权重,兴趣倾向权重用于表征目标账户的各兴趣倾向程度,
[0008]基于兴趣倾向权重和兴趣空间数据,确定第三兴趣特征数据,其中,兴趣空间数据用于表征兴趣集合中每个兴趣的本身特征,第三兴趣特征数据用于表征目标账户的整体兴趣。
[0009]作为一种可能的实施方式,利用第一兴趣特征数据和第二兴趣特征数据,确定兴趣倾向权重,包括:
[0010]根据目标账户的账户属性特征数据以及历史兴趣序列特征信息,确定兴趣倾向权重,
[0011]其中,
[0012]账户属性特征数据属于第一兴趣特征数据,
[0013]历史兴趣序列特征信息属于第二兴趣特征数据。
[0014]作为一种可能的实施方式,根据目标账户的账户属性特征数据以及历史兴趣序列特征信息,确定兴趣倾向权重,包括:
[0015]将账户属性特征数据、以及历史兴趣序列特征信息,输入至第一神经网络模型,得到目标账户的兴趣倾向权重向量,其中,兴趣倾向权重向量中每一位置的元素值表征对应于每一位置的兴趣倾向权重。
[0016]作为一种可能的实施方式,该方法还包括:
[0017]获取目标兴趣属性特征数据、以及兴趣嵌入特征数据,其中,目标兴趣属性特征数据用于表征目标兴趣的属性特征;兴趣嵌入特征数据用于表征目标账户的基础特征、目标兴趣的基础特征和上下文特征至少之一;
[0018]将第三兴趣特征数据、第一兴趣特征数据、第二兴趣特征数据目标兴趣属性特征数据、以及兴趣嵌入特征数据进行向量维度的融合,得到输入特征向量。
[0019]作为一种可能的实施方式,兴趣空间数据按照以下方式预先构建:
[0020]为每个兴趣设置用于表征该兴趣本身特征的兴趣基向量,
[0021]将每个兴趣基向量作为第一维度向量,将所有兴趣基向量作为第二维度向量,得到由第一维度向量和第二维度向量组成的兴趣空间向量,其中,第一维度向量的维数为兴趣基向量的维数,第二维度向量的维数为兴趣基向量的总数,兴趣空间向量为兴趣空间数据,
[0022]对兴趣空间向量中的向量值进行随机均匀的初始化。
[0023]作为一种可能的实施方式,基于兴趣倾向权重和兴趣属性特征数据,确定第三兴趣特征数据,包括:
[0024]对目标账户的每个兴趣,融合目标账户的该每个兴趣的兴趣基向量与该每个兴趣的兴趣倾向权重,得到融合兴趣基向量,
[0025]计算所有融合兴趣基向量的平均值,得到目标账户的第三兴趣特征向量,其中,第三兴趣特征向量为第三兴趣特征数据。
[0026]作为一种可能的实施方式,该方法进一步包括:
[0027]将所获取的第一兴趣特征数据和第二兴趣特征数据、以及第三兴趣特征数据作为输入数据输入至兴趣推荐模型,
[0028]根据兴趣推荐模型输出的预测结果,为目标账户进行兴趣推荐。
[0029]作为一种可能的实施方式,该方法通过兴趣推荐模型实现,兴趣推荐模型的训练方法包括:
[0030]获取第一兴趣特征样本数据和第二兴趣特征样本数据;
[0031]利用第一兴趣特征样本数据和第二兴趣特征样本数据,确定样本兴趣倾向权重;
[0032]基于样本兴趣倾向权重和样本兴趣空间数据,确定第三兴趣特征样本数据;
[0033]将所获取的第一兴趣特征样本数据、第二兴趣特征样本数据以及第三兴趣特征样本数据作为输入样本数据输入至兴趣推荐模型;
[0034]根据兴趣推荐模型输出的预测结果,确定目标损失函数值,
[0035]根据目标损失函数值,更新兴趣推荐模型的模型参数,直至满足训练结束条件。
[0036]作为一种可能的实施方式,该方法进一步包括:
[0037]获取目标兴趣属性特征样本数据、以及兴趣嵌入特征样本数据;
[0038]将第三兴趣特征样本数据、第一兴趣特征样本数据、第二兴趣特征样本数据、目标兴趣属性特征样本数据、以及兴趣嵌入特征样本数据进行向量维度融合,得到兴趣推荐模型的输入样本特征向量。
[0039]作为一种可能的实施方式,利用第一兴趣特征样本数据和第二兴趣特征样本数据,确定样本兴趣倾向权重,包括:
[0040]根据样本账户的账户属性特征样本数据、以及历史兴趣序列特征样本信息,确定
样本兴趣倾向权重,
[0041]其中,
[0042]账户属性特征样本数据属于第一兴趣特征样本数据,
[0043]历史兴趣序列特征样本信息属于第二兴趣特征样本数据。
[0044]作为一种可能的实施方式,根据样本账户的账户属性特征样本数据以及历史兴趣序列特征样本信息,确定样本兴趣倾向权重,包括:
[0045]将账户属性特征样本数据、以及历史兴趣序列特征样本信息,输入至第一神经网络模型,得到样本账户的样本兴趣倾向权重向量,其中,样本兴趣倾向权重向量中每一位置的元素值表征对应于每一位置的样本兴趣倾向权重。
[0046]作为一种可能的实施方式,样本兴趣空间数据按照以下方式预先构建:
[0047]为每个兴趣设置用于表征该兴趣本身特征的样本兴趣基向量,
[0048]将每个样本兴趣基向量作为第一样本维度向量,将所有样本兴趣基向量作为第二样本维度向量,得到由第一样本维度向量和第二样本维度向量组成的样本兴趣空间向量,其中,第一样本维度向量的维数为样本兴趣基向量的维数,第二样本维度向量的维数为样本兴趣基向量的总数,样本兴趣空间向量为样本兴趣空间数据,
[0049]对样本兴趣空间向量中的向量值进行随机均匀的初始化。
[0050]作为一种可能的实施方式,基于样本兴趣倾向权重和兴趣属性特征样本数据,确定第三兴趣特征样本数据,包括:
[0051]对样本账户的每个兴趣,融合样本账户的该每个兴趣的样本兴趣基向量与该每个兴趣的样本兴趣倾向权重,得到样本融合兴趣本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种兴趣特征数据的获取方法,其特征在于,包括:获取第一兴趣特征数据和第二兴趣特征数据,其中,所述第一兴趣特征数据用于表征目标账户第一时间段的兴趣特征,所述第二兴趣特征数据用于表征所述目标账户第二时间段的兴趣特征,所述第一时间段大于所述第二时间段,利用所述第一兴趣特征数据和所述第二兴趣特征数据,确定兴趣倾向权重,所述兴趣倾向权重用于表征所述目标账户的各兴趣倾向程度,基于所述兴趣倾向权重和兴趣空间数据,确定第三兴趣特征数据,其中,所述兴趣空间数据用于表征兴趣集合中每个兴趣的本身特征,所述第三兴趣特征数据用于表征所述目标账户的整体兴趣。2.根据权利要求1所述的获取方法,其特征在于,所述利用所述第一兴趣特征数据和所述第二兴趣特征数据,确定兴趣倾向权重,包括:根据所述目标账户的账户属性特征数据以及历史兴趣序列特征信息,确定所述兴趣倾向权重,其中,所述账户属性特征数据属于所述第一兴趣特征数据,所述历史兴趣序列特征信息属于所述第二兴趣特征数据。3.根据权利要求2所述的获取方法,其特征在于,所述根据所述目标账户的账户属性特征数据以及历史兴趣序列特征信息,确定兴趣倾向权重,包括:将所述账户属性特征数据、以及所述历史兴趣序列特征信息,输入至第一神经网络模型,得到所述目标账户的兴趣倾向权重向量,其中,所述兴趣倾向权重向量中每一位置的元素值表征对应于所述每一位置的兴趣倾向权重。4.根据权利要求1所述的获取方法,其特征在于,所述兴趣空间数据按照以下方式预先构建:为每个兴趣设置用于表征该兴趣本身特征的兴趣基向量,将每个所述兴趣基向量作为第一维度向量,将所有所述兴趣基向量作为第二维度向量,得到由所述第一维度向量和所述第二维度向量组成的兴趣空间向量,其中,第一维度向量的维数为所述兴趣基向量的维数,第二维度向量的维数为所述兴趣基向量的总数,所述兴趣空间向量为所述兴趣空间数据,对所述兴趣空间向量中的向量值进行随机均匀的初始化。5.根据权利要求1所述的获取方法,其特征在于,该方法进一步包括:将所获取的所述第一兴趣特征数据和所述第二兴趣特征数据、以及所述第三兴趣特征数据作为输入数...
【专利技术属性】
技术研发人员:骆明楠,廖一桥,
申请(专利权)人:北京达佳互联信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。