一种数据处理方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：38857158 阅读：21 留言：0更新日期：2023-09-17 10:01

本申请实施例公开了一种数据处理方法、装置、计算机设备及存储介质，包括：获取目标对象的对象历史特征对应的目标对象历史序列；目标对象历史序列包括N个目标对象历史向量；获取与业务行业相关联的目标行业向量池；目标行业向量池包括M个行业向量；从M个行业向量中，分别确定每个目标对象历史向量对应的激活行业向量，得到N个激活行业向量；在N个激活行业向量中，将具有相同向量类型的激活行业向量所对应的目标对象历史向量进行合并处理，得到用于表征目标对象的目标多关联向量；目标多关联向量包括L种向量类型分别对应的对象关联子向量。采用本申请实施例，可以准确且灵活的预测目标对象的对象兴趣。目标对象的对象兴趣。目标对象的对象兴趣。

全部详细技术资料下载

【技术实现步骤摘要】
一种数据处理方法、装置、计算机设备及存储介质

[0001]本申请涉及计算机
，尤其涉及一种数据处理方法、装置、计算机设备及存储介质。

技术介绍

[0002]传统兴趣激活方式在表征某一目标对象的对象兴趣时，往往通过自注意力机制生成该目标对象的意图向量，以使该意图向量可以激活传统兴趣池中的固定个数的激活兴趣，进而根据该具有固定个数(例如，10个)的激活兴趣生成该目标对象的兴趣向量集合。其中，由于传统兴趣池是一种通用的结构，与各行各业的业务场景并无关联，因此传统兴趣池难以学习到行业相关的知识和约束，进而导致该传统兴趣池的学习质量难以得到保障，以至于选择的激活兴趣可能不够准确，从而降低预测目标对象的对象兴趣的准确率。
[0003]此外，对于某一兴趣分布集中的目标对象(例如，具有3个兴趣的用户A)而言，传统兴趣激活方式可以固定的获取到该用户A的10个兴趣，这样的激活方式所生成的兴趣向量集合在表征用户A的实际兴趣时造成不必要的拆分。而对于某一兴趣分散的目标对象(例如，具有20个兴趣的用户B)而言，传统兴趣激活方式依旧固定的获取到该用户B的10个兴趣，这样的激活方式所生成的兴趣向量集合可能将不同类别的兴趣聚合在一起，从而对该用户B的实际兴趣造成表达误差，因此，采用传统兴趣激活方式无法准确地表征兴趣分布不同的目标对象的实际兴趣。

技术实现思路

[0004]本申请实施例提供一种数据处理方法、装置、计算机设备及存储介质，可以灵活且快速的对转化数据概率分布进行预测。
[0005]本申请实施例一方面提供...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法，其特征在于，包括：获取目标对象的对象历史特征对应的目标对象历史序列；所述目标对象历史序列包括N个目标对象历史向量；所述N为正整数；所述目标对象的对象历史特征是基于所述目标对象交互过的业务子行业下的业务数据所确定的；获取与业务行业相关联的目标行业向量池；所述目标行业向量池包括M个行业向量；一个行业向量是对所述业务行业中的一个业务子行业对应的行业特征进行特征提取后所得到的；所述M为大于1的正整数；从所述M个行业向量中，分别确定每个目标对象历史向量对应的激活行业向量，得到N个激活行业向量；所述N个激活行业向量属于所述M个行业向量；所述N个激活行业向量包括L种向量类型；所述L为正整数；在所述N个激活行业向量中，将具有相同向量类型的激活行业向量所对应的目标对象历史向量进行合并处理，得到用于表征所述目标对象的目标多关联向量；所述目标多关联向量包括所述L种向量类型分别对应的对象关联子向量。2.根据权利要求1所述的方法，其特征在于，所述获取目标对象的对象历史特征对应的目标对象历史序列，包括：获取与所述目标对象相关联的业务请求；所述业务请求包括所述目标对象的目标对象标识；基于所述业务请求中的所述目标对象标识，确定所述目标对象对应的对象信息；所述对象信息包括所述目标对象交互过的N个业务数据；分别对所述N个业务数据进行特征提取编码处理，得到每个业务数据对应的目标对象历史向量；将每个业务数据对应的目标对象历史向量组合为所述目标对象的目标对象历史序列。3.根据权利要求1所述的方法，其特征在于，所述目标行业向量池是从目标行业多关联模型中获取到的；所述目标行业多关联模型包括激活网络层；所述N个目标对象历史向量包括目标对象历史向量X
i
；所述i为小于或者等于所述N的正整数；所述从所述M个行业向量中，分别确定每个目标对象历史向量对应的激活行业向量，得到N个激活行业向量，包括：将所述N个目标对象历史向量输入所述激活网络层；在所述激活网络层中，分别确定所述目标对象历史向量X
i
与所述M个行业向量中的每个行业向量之间的向量相似度；从M个向量相似度中获取最大向量相似度，将最大向量相似度对应的行业向量作为所述目标对象历史向量X
i
对应的激活行业向量，直至得到所述N个目标对象历史向量分别对应的激活行业向量。4.根据权利要求1所述的方法，其特征在于，所述目标行业向量池是从目标行业多关联模型中获取到的；所述目标行业多关联模型包括合并网络层；所述L种向量类型包括向量类型Y
k
；所述k为小于或者等于L的正整数；所述在所述N个激活行业向量中，将具有相同向量类型的激活行业向量所对应的目标对象历史向量进行合并处理，得到用于表征所述目标对象的目标多关联向量，包括：将所述N个目标对象历史向量分别对应的激活行业向量输入所述合并网络层，在所述N
个激活行业向量中，确定所述向量类型Y
k
所对应的目标激活行业向量，将所述目标激活行业向量所对应的目标对象历史向量确定为待合并历史向量；通过所述合并网络层，获取所述待合并向量与所述目标激活行业向量之间的权重参数；基于所述权重参数以及所述待合并历史向量，生成所述向量类型Y
k
对应的对象关联子向量；将所述L种向量类型中的每个向量类型分别对应的对象关联子向量，组合为用于表征所述目标对象的目标多关联向量。5.根据权利要求4所述的方法，其特征在于，所述待合并向量包括目标对象历史向量X
i
和目标对象历史向量X
j
；所述i和所述j均为小于或者等于所述N的正整数；所述通过所述合并网络层，获取所述待合并向量与所述目标激活行业向量之间的权重参数，包括：在所述合并网络层中，对所述目标对象历史向量X
i
与所述目标激活行业向量进行内积处理，将内积处理后得到的向量积进行归一化处理，得到所述目标对象历史向量X
i
与所述目标激活行业向量之间的权重参数a
i
；对所述目标对象历史向量X
j
与所述目标激活行业向量进行内积处理，将内积处理后得到的向量积进行归一化处理，得到所述目标对象历史向量X
j
与所述目标激活行业向量之间的权重参数a
j
；基于所述权重参数a
i
和权重参数a
j
，确定所述待合并向量与所述目标激活行业向量之间的权重参数。6.根据权利要求1所述的方法，其特征在于，所述方法还包括：在获取到与所述目标对象相关联的业务请求时，获取与所述业务行业相关联的目标召回模型；所述目标召回模型包括用于预测所述目标多关联向量的目标行业多关联模型；从与所述业务行业相关联的业务数据池中，确定所述业务数据池中每个候选业务数据对应的候选业务特征，分别对每个候选业务特征进行特征提取，得到每个候选业务特征对应的候选业务向量；在通过所述目标行业多关联模型输出所述目标多关联向量时，基于所述目标多关联向量在所述每个候选业务特征对应的候选业务向量中进行向量检索，将向量检索到的候选业务向量确定为召回向量，根据所述召回向量确定与所述目标对象相关联的召回结果。7.根据权利要求6所述的方法，其特征在于，所述方法还包括：基于所述业务请求获取所述目标对象的对象信息，对所述对象信息进行特征提取，得到所述目标对象对应的对象特征；对所述召回结果进行特征提取，得到所述召回结果对应的待排序业务特征；获取与所述业务行业相关联的第一排序模型；将所述对象特征与所述待排序业务特征输入至所述第一排序模型，由所述第一排序模型对所述待排序业务特征进行排序处理，得到与所述第一排序模型的输...

【专利技术属性】
技术研发人员：杨月奎，李少童，伍海洋，张敏，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人