一种数据处理方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:38857158 阅读:17 留言:0更新日期:2023-09-17 10:01
本申请实施例公开了一种数据处理方法、装置、计算机设备及存储介质,包括:获取目标对象的对象历史特征对应的目标对象历史序列;目标对象历史序列包括N个目标对象历史向量;获取与业务行业相关联的目标行业向量池;目标行业向量池包括M个行业向量;从M个行业向量中,分别确定每个目标对象历史向量对应的激活行业向量,得到N个激活行业向量;在N个激活行业向量中,将具有相同向量类型的激活行业向量所对应的目标对象历史向量进行合并处理,得到用于表征目标对象的目标多关联向量;目标多关联向量包括L种向量类型分别对应的对象关联子向量。采用本申请实施例,可以准确且灵活的预测目标对象的对象兴趣。目标对象的对象兴趣。目标对象的对象兴趣。

【技术实现步骤摘要】
一种数据处理方法、装置、计算机设备及存储介质


[0001]本申请涉及计算机
,尤其涉及一种数据处理方法、装置、计算机设备及存储介质。

技术介绍

[0002]传统兴趣激活方式在表征某一目标对象的对象兴趣时,往往通过自注意力机制生成该目标对象的意图向量,以使该意图向量可以激活传统兴趣池中的固定个数的激活兴趣,进而根据该具有固定个数(例如,10个)的激活兴趣生成该目标对象的兴趣向量集合。其中,由于传统兴趣池是一种通用的结构,与各行各业的业务场景并无关联,因此传统兴趣池难以学习到行业相关的知识和约束,进而导致该传统兴趣池的学习质量难以得到保障,以至于选择的激活兴趣可能不够准确,从而降低预测目标对象的对象兴趣的准确率。
[0003]此外,对于某一兴趣分布集中的目标对象(例如,具有3个兴趣的用户A)而言,传统兴趣激活方式可以固定的获取到该用户A的10个兴趣,这样的激活方式所生成的兴趣向量集合在表征用户A的实际兴趣时造成不必要的拆分。而对于某一兴趣分散的目标对象(例如,具有20个兴趣的用户B)而言,传统兴趣激活方式依旧固定的获取到该用户B的10个兴趣,这样的激活方式所生成的兴趣向量集合可能将不同类别的兴趣聚合在一起,从而对该用户B的实际兴趣造成表达误差,因此,采用传统兴趣激活方式无法准确地表征兴趣分布不同的目标对象的实际兴趣。

技术实现思路

[0004]本申请实施例提供一种数据处理方法、装置、计算机设备及存储介质,可以灵活且快速的对转化数据概率分布进行预测。
[0005]本申请实施例一方面提供一种数据处理方法,包括:
[0006]获取目标对象的对象历史特征对应的目标对象历史序列;目标对象历史序列包括N个目标对象历史向量;N为正整数;目标对象的对象历史特征是基于目标对象交互过的业务子行业下的业务数据所确定的;
[0007]获取与业务行业相关联的目标行业向量池;目标行业向量池包括M个行业向量;一个行业向量是对业务行业中的一个业务子行业对应的行业特征进行特征提取后所得到的;M为大于1的正整数;
[0008]从M个行业向量中,分别确定每个目标对象历史向量对应的激活行业向量,得到N个激活行业向量;N个激活行业向量属于M个行业向量;N个激活行业向量包括L种向量类型;L为正整数;
[0009]在N个激活行业向量中,将具有相同向量类型的激活行业向量所对应的目标对象历史向量进行合并处理,得到用于表征目标对象的目标多关联向量;目标多关联向量包括L种向量类型分别对应的对象关联子向量。
[0010]本申请实施例一方面提供一种数据处理方法,包括:
[0011]通过初始行业多关联模型,获取样本对象的对象历史特征对应的样本对象历史序列;样本对象的对象历史特征是基于样本对象交互过的业务子行业下的业务数据所确定的;样本对象历史序列包括A个样本对象历史向量;A为正整数;初始行业多关联模型中的与业务行业相关联的样本行业向量池包括B个行业向量;一个行业向量是对业务行业中的一个业务子行业对应的行业特征进行特征提取后所得到的;B为大于1的正整数;
[0012]通过初始行业多关联模型,从B个行业向量中,分别确定每个样本对象历史向量对应的激活行业向量,得到A个激活行业向量,在A个激活行业向量中,将具有相同向量类型的激活行业向量所对应的样本对象历史向量进行合并处理,得到样本多关联向量;A个激活行业向量属于B个行业向量;A个激活行业向量包括C种向量类型;C为正整数;样本多关联向量包括C种向量类型分别对应的对象关联子向量;
[0013]基于样本多关联向量对初始行业多关联模型进行训练,得到用于对目标对象对应的目标多关联向量进行预测的目标行业多关联模型。
[0014]本申请实施例一方面提供一种数据处理装置,包括:
[0015]目标历史序列获取模块,用于获取目标对象的对象历史特征对应的目标对象历史序列;目标对象历史序列包括N个目标对象历史向量;N为正整数;目标对象的对象历史特征是基于目标对象交互过的业务子行业下的业务数据所确定的;
[0016]目标向量池获取模块,用于获取与业务行业相关联的目标行业向量池;目标行业向量池包括M个行业向量;一个行业向量是对业务行业中的一个业务子行业对应的行业特征进行特征提取后所得到的;M为大于1的正整数;
[0017]激活行业向量确定模块,用于从M个行业向量中,分别确定每个目标对象历史向量对应的激活行业向量,得到N个激活行业向量;N个激活行业向量属于M个行业向量;N个激活行业向量包括L种向量类型;L为正整数;
[0018]合并处理模块,用于在N个激活行业向量中,将具有相同向量类型的激活行业向量所对应的目标对象历史向量进行合并处理,得到用于表征目标对象的目标多关联向量;目标多关联向量包括L种向量类型分别对应的对象关联子向量。
[0019]其中,该目标历史序列获取模块包括:
[0020]业务请求获取单元,用于获取与目标对象相关联的业务请求;业务请求包括目标对象的目标对象标识;
[0021]对象信息确定单元,用于基于业务请求中的目标对象标识,确定目标对象对应的对象信息;对象信息包括目标对象交互过的N个业务数据;
[0022]特征提取编码单元,用于分别对N个业务数据进行特征提取编码处理,得到每个业务数据对应的目标对象历史向量;
[0023]目标历史序列组合单元,用于将每个业务数据对应的目标对象历史向量组合为目标对象的目标对象历史序列。
[0024]其中,目标行业向量池是从目标行业多关联模型中获取到的;目标行业多关联模型包括激活网络层;N个目标对象历史向量包括目标对象历史向量X
i
;i为小于或者等于N的正整数;
[0025]该激活行业向量确定模块包括:
[0026]目标历史向量输入单元,用于将N个目标对象历史向量输入激活网络层;
[0027]向量相似度确定单元,用于在激活网络层中,分别确定目标对象历史向量X
i
与M个行业向量中的每个行业向量之间的向量相似度;
[0028]激活行业向量确定单元,用于从M个向量相似度中获取最大向量相似度,将最大向量相似度对应的行业向量作为目标对象历史向量X
i
对应的激活行业向量,直至得到N个目标对象历史向量分别对应的激活行业向量。
[0029]其中,目标行业向量池是从目标行业多关联模型中获取到的;目标行业多关联模型包括合并网络层;L种向量类型包括向量类型Y
k
;k为小于或者等于L的正整数;
[0030]该合并处理模块包括:
[0031]待合并历史向量确定单元,用于将N个目标对象历史向量分别对应的激活行业向量输入合并网络层,在N个激活行业向量中,确定向量类型Y
k
所对应的目标激活行业向量,将目标激活行业向量所对应的目标对象历史向量确定为待合并历史向量;
[0032]权重参数获取单元,用于通过合并网络层,获取待合并向量与目标激活行业向量之本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取目标对象的对象历史特征对应的目标对象历史序列;所述目标对象历史序列包括N个目标对象历史向量;所述N为正整数;所述目标对象的对象历史特征是基于所述目标对象交互过的业务子行业下的业务数据所确定的;获取与业务行业相关联的目标行业向量池;所述目标行业向量池包括M个行业向量;一个行业向量是对所述业务行业中的一个业务子行业对应的行业特征进行特征提取后所得到的;所述M为大于1的正整数;从所述M个行业向量中,分别确定每个目标对象历史向量对应的激活行业向量,得到N个激活行业向量;所述N个激活行业向量属于所述M个行业向量;所述N个激活行业向量包括L种向量类型;所述L为正整数;在所述N个激活行业向量中,将具有相同向量类型的激活行业向量所对应的目标对象历史向量进行合并处理,得到用于表征所述目标对象的目标多关联向量;所述目标多关联向量包括所述L种向量类型分别对应的对象关联子向量。2.根据权利要求1所述的方法,其特征在于,所述获取目标对象的对象历史特征对应的目标对象历史序列,包括:获取与所述目标对象相关联的业务请求;所述业务请求包括所述目标对象的目标对象标识;基于所述业务请求中的所述目标对象标识,确定所述目标对象对应的对象信息;所述对象信息包括所述目标对象交互过的N个业务数据;分别对所述N个业务数据进行特征提取编码处理,得到每个业务数据对应的目标对象历史向量;将每个业务数据对应的目标对象历史向量组合为所述目标对象的目标对象历史序列。3.根据权利要求1所述的方法,其特征在于,所述目标行业向量池是从目标行业多关联模型中获取到的;所述目标行业多关联模型包括激活网络层;所述N个目标对象历史向量包括目标对象历史向量X
i
;所述i为小于或者等于所述N的正整数;所述从所述M个行业向量中,分别确定每个目标对象历史向量对应的激活行业向量,得到N个激活行业向量,包括:将所述N个目标对象历史向量输入所述激活网络层;在所述激活网络层中,分别确定所述目标对象历史向量X
i
与所述M个行业向量中的每个行业向量之间的向量相似度;从M个向量相似度中获取最大向量相似度,将最大向量相似度对应的行业向量作为所述目标对象历史向量X
i
对应的激活行业向量,直至得到所述N个目标对象历史向量分别对应的激活行业向量。4.根据权利要求1所述的方法,其特征在于,所述目标行业向量池是从目标行业多关联模型中获取到的;所述目标行业多关联模型包括合并网络层;所述L种向量类型包括向量类型Y
k
;所述k为小于或者等于L的正整数;所述在所述N个激活行业向量中,将具有相同向量类型的激活行业向量所对应的目标对象历史向量进行合并处理,得到用于表征所述目标对象的目标多关联向量,包括:将所述N个目标对象历史向量分别对应的激活行业向量输入所述合并网络层,在所述N
个激活行业向量中,确定所述向量类型Y
k
所对应的目标激活行业向量,将所述目标激活行业向量所对应的目标对象历史向量确定为待合并历史向量;通过所述合并网络层,获取所述待合并向量与所述目标激活行业向量之间的权重参数;基于所述权重参数以及所述待合并历史向量,生成所述向量类型Y
k
对应的对象关联子向量;将所述L种向量类型中的每个向量类型分别对应的对象关联子向量,组合为用于表征所述目标对象的目标多关联向量。5.根据权利要求4所述的方法,其特征在于,所述待合并向量包括目标对象历史向量X
i
和目标对象历史向量X
j
;所述i和所述j均为小于或者等于所述N的正整数;所述通过所述合并网络层,获取所述待合并向量与所述目标激活行业向量之间的权重参数,包括:在所述合并网络层中,对所述目标对象历史向量X
i
与所述目标激活行业向量进行内积处理,将内积处理后得到的向量积进行归一化处理,得到所述目标对象历史向量X
i
与所述目标激活行业向量之间的权重参数a
i
;对所述目标对象历史向量X
j
与所述目标激活行业向量进行内积处理,将内积处理后得到的向量积进行归一化处理,得到所述目标对象历史向量X
j
与所述目标激活行业向量之间的权重参数a
j
;基于所述权重参数a
i
和权重参数a
j
,确定所述待合并向量与所述目标激活行业向量之间的权重参数。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:在获取到与所述目标对象相关联的业务请求时,获取与所述业务行业相关联的目标召回模型;所述目标召回模型包括用于预测所述目标多关联向量的目标行业多关联模型;从与所述业务行业相关联的业务数据池中,确定所述业务数据池中每个候选业务数据对应的候选业务特征,分别对每个候选业务特征进行特征提取,得到每个候选业务特征对应的候选业务向量;在通过所述目标行业多关联模型输出所述目标多关联向量时,基于所述目标多关联向量在所述每个候选业务特征对应的候选业务向量中进行向量检索,将向量检索到的候选业务向量确定为召回向量,根据所述召回向量确定与所述目标对象相关联的召回结果。7.根据权利要求6所述的方法,其特征在于,所述方法还包括:基于所述业务请求获取所述目标对象的对象信息,对所述对象信息进行特征提取,得到所述目标对象对应的对象特征;对所述召回结果进行特征提取,得到所述召回结果对应的待排序业务特征;获取与所述业务行业相关联的第一排序模型;将所述对象特征与所述待排序业务特征输入至所述第一排序模型,由所述第一排序模型对所述待排序业务特征进行排序处理,得到与所述第一排序模型的输...

【专利技术属性】
技术研发人员:杨月奎李少童伍海洋张敏
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1