多媒体信息编码方法、对象检索方法及装置制造方法及图纸

技术编号:35096457 阅读:20 留言:0更新日期:2022-10-01 16:59
本申请涉及机器学习技术领域,尤其涉及一种多媒体信息编码方法、对象检索方法及装置,所述多媒体信息编码方法包括:获取待编码多媒体信息;基于目标编码模型对所述待编码多媒体信息进行信息编码,得到与所述待编码多媒体信息对应的目标编码信息;所述目标编码模型基于损失信息对待训练编码模型进行模型训练得到;所述损失信息基于各项样本编码信息分别对应的相似编码信息以及差异编码信息确定;所述各项样本编码信息分别对应的相似编码信息以及差异编码信息基于所述各项样本多媒体信息之间的两两相似信息,从所述样本编码信息集合中确定出。本申请能够提高了多媒体信息的编码准确性。确性。确性。

【技术实现步骤摘要】
多媒体信息编码方法、对象检索方法及装置


[0001]本申请涉及机器学习
,尤其涉及一种多媒体信息编码方法、对象检索方法及装置。

技术介绍

[0002]随着互联网的高速发展,多媒体信息的数量急剧增长,为了便于对多媒体信息进行应用以及存储,可通过编码模型对多媒体资源进行编码,以得到相应的编码信息,并基于多媒体信息对应的编码信息进行应用或者存储。
[0003]现有技术中,在样本信息包括原始样本信息,以及对原始样本信息进行相似变换的变换样本信息时,一般是基于每项原始样本信息与其对应的变换样本信息的相似关系确定损失函数的,导致损失函数不准确,进而导致基于该损失函数训练得到的编码模型的编码性能不佳,基于该编码模型进行编码降低了对多媒体信息的编码准确性。

技术实现思路

[0004]本申请所要解决的技术问题在于,提供一种多媒体信息编码方法、对象检索方法及装置,能够提高编码模型的编码准确性,进而提高对象检索的检索准确性。
[0005]为了解决上述技术问题,一方面,本申请实施例提供了一种多媒体信息编码方法,包括:
[0006]获取待编码多媒体信息;
[0007]基于目标编码模型对所述待编码多媒体信息进行信息编码,得到与所述待编码多媒体信息对应的目标编码信息;
[0008]所述目标编码模型基于损失信息对待训练编码模型进行模型训练得到;所述损失信息基于各项样本编码信息分别对应的相似编码信息以及差异编码信息确定;所述各项样本编码信息分别对应的相似编码信息以及差异编码信息基于所述各项样本多媒体信息之间的两两相似信息,从所述样本编码信息集合中确定出;所述样本编码信息集合基于所述待训练编码模型对各项样本多媒体信息分别进行信息编码得到。
[0009]另一方面,本申请实施例提供了一种对象检索方法,包括:
[0010]获取待检索对象的编码信息以及候选对象的编码信息;所述待检索对象的编码信息基于目标编码模型对所述待检索对象的多媒体信息进行信息编码得到;所述候选对象的编码信息基于所述目标编码模型对所述候选对象的多媒体信息进行信息编码得到;
[0011]所述目标编码模型基于损失信息对待训练编码模型进行模型训练得到;所述损失信息基于各项样本编码信息分别对应的相似编码信息以及差异编码信息确定;所述各项样本编码信息分别对应的相似编码信息以及差异编码信息基于所述各项样本多媒体信息之间的两两相似信息,从所述样本编码信息集合中确定出;所述样本编码信息集合基于所述待训练编码模型对各项样本多媒体信息分别进行信息编码得到;
[0012]对所述待检索对象的编码信息以及所述候选对象的编码信息进行信息匹配,得到
信息匹配结果;
[0013]基于所述信息匹配结果,从所述候选对象中确定出目标检索对象。
[0014]另一方面,本申请实施例提供了一种多媒体信息编码装置,包括:
[0015]第一获取模块,用于获取待编码多媒体信息;
[0016]第一编码模块,用于基于目标编码模型对所述待编码多媒体信息进行信息编码,得到与所述待编码多媒体信息对应的目标编码信息;
[0017]所述目标编码模型基于损失信息对待训练编码模型进行模型训练得到;所述损失信息基于各项样本编码信息分别对应的相似编码信息以及差异编码信息确定;所述各项样本编码信息分别对应的相似编码信息以及差异编码信息基于所述各项样本多媒体信息之间的两两相似信息,从所述样本编码信息集合中确定出;所述样本编码信息集合基于所述待训练编码模型对各项样本多媒体信息分别进行信息编码得到。
[0018]另一方面,本申请实施例提供了一种对象检索装置,包括:
[0019]第二获取模块,用于获取待检索对象的编码信息以及候选对象的编码信息;所述待检索对象的编码信息基于目标编码模型对所述待检索对象的多媒体信息进行信息编码得到;所述候选对象的编码信息基于所述目标编码模型对所述候选对象的多媒体信息进行信息编码得到;
[0020]所述目标编码模型基于损失信息对待训练编码模型进行模型训练得到;所述损失信息基于各项样本编码信息分别对应的相似编码信息以及差异编码信息确定;所述各项样本编码信息分别对应的相似编码信息以及差异编码信息基于所述各项样本多媒体信息之间的两两相似信息,从所述样本编码信息集合中确定出;所述样本编码信息集合基于所述待训练编码模型对各项样本多媒体信息分别进行信息编码得到;
[0021]信息匹配模块,用于对所述待检索对象的编码信息以及所述候选对象的编码信息进行信息匹配,得到信息匹配结果;
[0022]检索结果确定模块,用于基于所述信息匹配结果,从所述候选对象中确定出目标检索对象。
[0023]另一方面,本申请提供了一种电子设备,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如上述的多媒体信息编码方法,或对象检索方法。
[0024]另一方面,本申请提供了一种计算机存储介质,所述存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由处理器加载并执行如上述的多媒体信息编码方法,或对象检索方法。
[0025]实施本申请实施例,具有如下有益效果:
[0026]本申请在对编码模型进行训练的过程中,基于各项样本多媒体信息之间的两两相似信息,确定各项样本编码信息分别对应的相似编码信息以及差异编码信息;基于相似编码信息以及差异编码信息确定损失信息;即本申请在确定损失信息时,基于的是各项样本多媒体信息之间的两两相似信息,即全面覆盖了各项样本多媒体信息之间的相似信息,每项样本多媒体信息与样本中其他多媒体信息之间的相似信息均能够被包含在损失信息中,从而提高了损失信息确定的准确性;并且本申请既可以适用于样本多媒体信息中包含原始样本多媒体信息以及经过相似变换的变换样本多媒体信息的场景,也可以适用于样本多媒
体信息中包含原始样本多媒体信息的场景,从而能够提高应用灵活性,以及适配性。进一步地,在提高了损失信息准确性的基础上,基于该损失信息进行模型训练,能够提高目标编码模型的编码性能,从而提高了多媒体信息的编码准确性。
附图说明
[0027]为了更清楚地说明本申请实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
[0028]图1是本申请实施例提供的实施环境示意图;
[0029]图2是本申请实施例提供的一种多媒体信息编码方法流程图;
[0030]图3是本申请实施例提供的目标编码模型的训练方法流程图;
[0031]图4是本申请实施例提供的相似编码信息以及差异编码信息的确定方法流程图;
[0032]图5是本申请实施例提供的一种相似信息确定方法流程图;
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多媒体信息编码方法,其特征在于,包括:获取待编码多媒体信息;基于目标编码模型对所述待编码多媒体信息进行信息编码,得到与所述待编码多媒体信息对应的目标编码信息;所述目标编码模型基于损失信息对待训练编码模型进行模型训练得到;所述损失信息基于各项样本编码信息分别对应的相似编码信息以及差异编码信息确定;所述各项样本编码信息分别对应的相似编码信息以及差异编码信息基于所述各项样本多媒体信息之间的两两相似信息,从所述样本编码信息集合中确定出;所述样本编码信息集合基于所述待训练编码模型对各项样本多媒体信息分别进行信息编码得到。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:对于所述样本编码信息集合中的每项样本编码信息,确定所述每项样本编码信息对应的目标样本多媒体信息;基于所述各项样本多媒体信息之间的两两相似信息,确定所述目标样本多媒体信息的相似多媒体信息,以及差异多媒体信息;将所述样本编码信息集合中,所述相似多媒体信息对应的样本编码信息确定为所述相似编码信息;将所述样本编码信息集合中,所述差异多媒体信息对应的样本编码信息确定为所述差异编码信息。3.根据权利要求1所述的方法,其特征在于,待训练编码模型包括基于预训练得到的特征提取层;所述方法还包括:基于所述特征提取层对所述各项样本多媒体信息进行特征提取,得到与所述各项样本多媒体信息分别对应的样本特征信息;基于所述各项样本多媒体信息分别对应的样本特征信息进行相似度计算,得到所述各项样本多媒体信息之间的两两相似信息。4.根据权利要求1所述的方法,其特征在于,所述各项样本多媒体信息包括原始多媒体信息以及变换多媒体信息;所述变换多媒体基于对所述原始多媒体信息进行相似变换得到;所述待训练编码模型包括第一编码模型,以及第二编码模型;所述第一编码模型以及所述第二编码模型共享模型参数;所述方法还包括:基于所述第一编码模型对所述原始多媒体信息进行信息编码,得到第一编码信息;基于所述第二编码模型对所述变换多媒体信息进行信息编码,得到第二编码信息;基于所述第一编码信息以及所述第二编码信息生成所述样本编码信息集合。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:对于所述样本编码信息集合中的每项样本编码信息,基于所述每项样本编码信息对应的相似编码信息构建第一损失信息项;基于所述每项样本编码信息对应的差异编码信息构建第二损失信息项;基于所述第一损失信息项以及所述第二损失信息项,确定所述损失信息。6.根据权利要求5所述的方法,其特征在于,所述基于所述第一损失信息项以及所述第
二损失信息项,确定所述损失信息,包括:基于所述第一编码信息、所述第二编码信息以及相似度矩阵,构建第三损失信息项;所述相似度矩阵表征所述原始多媒体信息中各项多媒体信息之间的相似度;基于所述第一损失信息项、所述第二损失信息项以及所述第三损失信息项,确定所述损失信息。7.根据权利要求4所述的方法,其特征在于,所述方法还包括:基于所述原始多媒体信息的信息类型,确定多种预设相似变换;从所述多种预设相似变换中确定目标相似变换;对所述原始多媒体信息执行所述目标相似变换,得到所述变换多媒体信息。8.根据权利要求1所述的方法,其特征在于,所述待训练编码模型包括信息编码层以及基于预训练得到的特征提取层;所述方法还包...

【专利技术属性】
技术研发人员:蔡成飞涂荣成
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1