【技术实现步骤摘要】
多媒体处理网络生成方法、多媒体处理方法及装置
[0001]本申请涉及人工智能
,尤其涉及一种多媒体处理网络生成方法、多媒体处理方法及装置。
技术介绍
[0002]随着互联网和人工智能技术的发展,以大型语言模型(Large Language Model,LLM)为基础的多种语言模型被广泛应用于各种多模态任务,如对话系统、机器翻译、文本摘要等文本处理任务,图片描述、视觉知识问答等图像处理任务以及语音处理任务等等。目前,预训练
‑
微调已成为了大型语言模型的训练范式,并取得了显著的突破。但是,由于大型语言模型的参数量一般都在数十亿甚至达到千亿规模,使用现有大批量训练数据去微调训练模型不仅会导致大型语言模型微调训练的效率低下,还会带来巨大的计算成本。
技术实现思路
[0003]本申请提供了一种多媒体处理网络生成方法、多媒体处理方法及装置,可以提升多媒体处理网络的生成效率,降低计算成本,同时提升多媒体处理网络的泛化能力,也可以在后续多媒体处理应用过程中,保证多媒体处理结果的准确性。
[0004]一方面,本申请提供了一种多媒体处理网络生成方法,所述方法包括:获取初始多媒体样本集;对所述初始多媒体样本集中的多媒体样本进行聚类处理,得到预设数量个聚类多媒体样本集;对每个聚类多媒体样本集进行至少两次采样,基于至少两次采样得到的采样结果生成所述初始多媒体样本集对应的至少两个初始关键多媒体样本集;每个初始关键多媒体样本集的样本数量不同;基于所述每个初始关键多媒体样本集对预设多媒体处理网络进行训 ...
【技术保护点】
【技术特征摘要】
1.一种多媒体处理网络生成方法,其特征在于,所述方法包括:获取初始多媒体样本集;对所述初始多媒体样本集中的多媒体样本进行聚类处理,得到预设数量个聚类多媒体样本集;对每个聚类多媒体样本集进行至少两次采样,基于至少两次采样得到的采样结果生成所述初始多媒体样本集对应的至少两个初始关键多媒体样本集;每个初始关键多媒体样本集的样本数量不同;基于所述每个初始关键多媒体样本集对预设多媒体处理网络进行训练,得到所述每个初始关键多媒体样本集对应的更新多媒体处理网络;根据所述更新多媒体处理网络对应的多媒体处理评价指标,从所述至少两个初始关键多媒体样本集中确定目标关键多媒体样本集,所述多媒体处理评价指标用于表征所述更新多媒体处理网络的多媒体处理的准确程度;将所述目标关键多媒体样本集对应的更新多媒体处理网络作为目标多媒体处理网络。2.根据权利要求1所述的方法,所述每个聚类多媒体样本集包括一个中心多媒体样本,其特征在于,所述对每个聚类多媒体样本集进行至少两次采样,基于至少两次采样得到的采样结果生成所述初始多媒体样本集对应的至少两个初始关键多媒体样本集包括:基于所述每个聚类多媒体样本集中的其它多媒体样本与所述每个聚类多媒体样本集中的中心多媒体样本的相似度信息,从所述其它多媒体样本中确定所述每个聚类多媒体样本集对应的关键多媒体样本;所述其它多媒体样本为所述每个聚类多媒体样本集中除所述中心多媒体样本外的多媒体样本;基于所述每个聚类多媒体样本集对应的关键多媒体样本,对所述每个聚类多媒体样本集进行至少两次采样,基于至少两次采样得到的采样结果生成所述初始多媒体样本集对应的至少两个初始关键多媒体样本集。3.根据权利要求2所述的方法,其特征在于,所述基于所述每个聚类多媒体样本集对应的关键多媒体样本,对所述每个聚类多媒体样本集进行至少两次采样,基于至少两次采样得到的采样结果生成所述初始多媒体样本集对应的至少两个初始关键多媒体样本集包括:基于所述每个聚类多媒体样本集对应的关键多媒体样本,对所述每个聚类多媒体样本集进行至少两次采样,得到每次采样生成的所述每个聚类多媒体样本集对应的关键多媒体样本集;对所述每次采样生成的所述每个聚类多媒体样本集对应的关键多媒体样本集进行融合,得到每次采样对应的初始关键多媒体样本集;根据所述每次采样对应的初始关键多媒体样本集,生成所述至少两个初始关键多媒体样本集。4.根据权利要求3所述的方法,其特征在于,所述基于所述每个聚类多媒体样本集对应的关键多媒体样本,对所述每个聚类多媒体样本集进行至少两次采样,得到每次采样生成的所述每个聚类多媒体样本集对应的关键多媒体样本集包括:基于所述每次采样对应的初始关键多媒体样本集的样本数量及所述每个聚类多媒体样本集的样本数量在所述初始多媒体样本集的样本数量中的占比信息,确定所述每个聚类多媒体样本集对应的采样样本数量;
将所述每个聚类多媒体样本集对应的关键多媒体样本作为所述每个聚类多媒体样本集对应的当前关键多媒体样本;基于所述每个聚类多媒体样本集中的非当前关键多媒体样本与所述每个聚类多媒体样本集对应的当前关键多媒体样本间的距离信息,从所述非当前关键多媒体样本中确定所述每个聚类多媒体样本集对应的采样多媒体样本;根据所述每个聚类多媒体样本集对应的采样多媒体样本和所述每个聚类多媒体样本集对应的当前关键多媒体样本,生成所述每个聚类多媒体样本集对应的更新关键多媒体样本集;将所述每个聚类多媒体样本集对应的更新关键多媒体样本集中的多媒体样本重新作为所述每个聚类多媒体样本集对应的当前关键多媒体样本,重复所述基于所述每个聚类多媒体样本集中的非当前关键多媒体样本与所述每个聚类多媒体样本集对应的当前关键多媒体样本间的距离信息,至所述生成所述每个聚类多媒体样本集对应的更新关键多媒体样本集的步骤,直至所述更新关键多媒体样本集的样本数量达到所述采样样本数量,得到所述每次采样生成的所述每个聚类多媒体样本集对应的关键多媒体样本集。5.根据权利要求1所述的方法,其特征在于,所述根据所述更新多媒体处理网络对应的多媒体处理评价指标,从所述至少两个初始关键多媒体样本集中确定目标关键多媒体样本集包括:将预设测试多媒体...
【专利技术属性】
技术研发人员:冯晓,何蕾,刘一仝,徐程程,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。