一种异构多媒体数据的表征模型训练方法、装置、设备及介质制造方法及图纸

技术编号：35213764 阅读：23 留言：0更新日期：2022-10-15 10:27

本公开关于一种异构多媒体数据的表征模型训练方法、装置、设备及介质，用以解决相关技术无法做到高关联度的跨领域信息推荐，致使兴趣关联性稀疏，推荐效率低的问题。本公开的异构多媒体数据的表征模型训练方法，包括：对预先获取的异构多媒体数据样本进行标注，获得异构多媒体数据样本数据；利用所述异构多媒体数据样本数据对初始模型进行训练，得到特征数据和用于提取特征数据的主干网络；利用所述特征数据对所述主干网络进行对齐学习训练，得到异构多媒体数据的表征模型，所述对齐学习训练包括对比学习训练和对抗学习训练中至少一种。括对比学习训练和对抗学习训练中至少一种。括对比学习训练和对抗学习训练中至少一种。

全部详细技术资料下载

【技术实现步骤摘要】
一种异构多媒体数据的表征模型训练方法、装置、设备及介质

[0001]本公开涉及深度学习
，尤其涉及一种异构多媒体数据的表征模型训练方法、装置、设备及介质。

技术介绍

[0002]信息推荐领域的内容理解中，包含了物品,直播,短视频,推荐信息等多类异构多媒体数据的类目识别，实体识别，属性识别等。现有内容理解方案中，大多都是基于同构内容进行建模的，对不同的异构多媒体数据有不同的识别任务，所得到的内容表征也不在同一空间，因此无法通过表征进行异构多媒体数据的互相关联。而如果使用在一种异构多媒体数据上建模的模型直接去预估其它形式的内容，虽然也可以得到同空间下的表征，但是无法消除不同异构多媒体数据之间的领域差异性，且异构多媒体数据在同空间下的分布并不均匀。且对于内容相似或相同的异构多媒体数据来说，例如短视频中所提及的物品，由于视频和物品在标签体系上存在较大差异性，会导致两者在隐空间中的类聚性差，无法分到同一个聚类蔟上，且异构多媒体数据之间的表征壁垒限制了使用者在各个异构多媒体数据上的关联打通，极大的限制了跨域兴趣的应用，且在兴趣建模视角预估模型(Search
‑
Based Interest Model，SIM)这样的长期兴趣序列建模中，无法把全部异构多媒体数据上的兴趣进行高效的整合，致使兴趣关联性稀疏。
[0003]综上所述，在信息推荐领域中，无法做到高关联度的跨领域信息推荐，致使兴趣关联性稀疏，推荐效率低。

技术实现思路

[0004]本公开提供一种异构多媒体数据的表征模型训练方法、...

【技术保护点】

【技术特征摘要】
1.一种异构多媒体数据的表征模型训练方法，其特征在于，包括：对预先获取的异构多媒体数据样本进行标注，获得异构多媒体数据样本数据；利用所述异构多媒体数据样本数据对初始模型进行训练，得到特征数据和用于提取特征数据的主干网络；利用所述特征数据对所述主干网络进行对齐学习训练，得到异构多媒体数据的表征模型，所述对齐学习训练包括对比学习训练和对抗学习训练中至少一种。2.根据权利要求1所述的方法，其特征在于，所述对齐学习训练为对比学习训练时，所述主干网络后连接对比学习分支网络；所述利用所述特征数据对所述主干网络进行对齐学习训练，包括：利用所述特征数据对所述对比学习分支网络进行训练，得到对比学习分支网络。3.根据权利要求2所述的方法，其特征在于，所述利用所述特征数据对所述对比学习分支网络进行训练，得到对比学习分支网络，包括：选取标注相同的特征数据为正例对，并在所述特征数据中随机选取负例对；利用所述正例对和所述负例对计算得到对比损失，利用所述对比损失调整所述对比学习分支网络的模型参数，以得到所述对比学习分支网络。4.根据权利要求1所述的方法，其特征在于，所述对齐学习训练为对抗学习训练时，所述主干网络后连接对抗学习分支网络；所述利用所述特征数据对所述主干网络进行对齐学习训练，包括：利用所述特征数据对所述对抗学习分支网络进行训练，得到对抗学习分支网络。5.根据权利要求4所述的方法，其特征在于，所述在所述主干网络后连接对抗学习分支网络，包括：在所述主干网络上连接域分类器；所述利用所述特征数据对所述对抗学习分支网络进行训练，得到对抗学习分支网络，包括：将所述特征数据映射到特征空间中；在所述主干网络和所述域分类器之间进行梯度反转，得到所述对抗学习分支网络，使得所述特征数据在所述特征空间中分布一致。...

【专利技术属性】
技术研发人员：代成，李帆，林英乔，
申请(专利权)人：北京达佳互联信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人