多媒体处理网络生成方法、多媒体处理方法及装置制造方法及图纸

技术编号：39007381 阅读：22 留言：0更新日期：2023-10-07 10:38

本申请公开了一种多媒体处理网络生成方法、多媒体处理方法及装置，涉及人工智能技术领域，该方法基于对初始多媒体样本集对应的每个聚类多媒体样本集进行多次采样得到的多个初始关键多媒体样本集，分别对预设多媒体处理网络进行多次训练，根据训练后的多媒体处理网络的多媒体处理评价指标，从多个初始关键多媒体样本集中确定目标关键多媒体样本集，并得到其对应的训练后的多媒体处理网络，预设多媒体处理网络为经过预训练的大型语言模型。利用本申请提供的技术方案可以提升筛选出的用于微调上述预训练大型语言模型的多媒体样本集的代表性和合理性，进而提升基于该多媒体样本集训练得到的多媒体处理网络的生成效率，同时保证多媒体处理的准确性。证多媒体处理的准确性。证多媒体处理的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
多媒体处理网络生成方法、多媒体处理方法及装置

[0001]本申请涉及人工智能
，尤其涉及一种多媒体处理网络生成方法、多媒体处理方法及装置。

技术介绍

[0002]随着互联网和人工智能技术的发展，以大型语言模型（Large Language Model，LLM）为基础的多种语言模型被广泛应用于各种多模态任务，如对话系统、机器翻译、文本摘要等文本处理任务，图片描述、视觉知识问答等图像处理任务以及语音处理任务等等。目前，预训练
‑
微调已成为了大型语言模型的训练范式，并取得了显著的突破。但是，由于大型语言模型的参数量一般都在数十亿甚至达到千亿规模，使用现有大批量训练数据去微调训练模型不仅会导致大型语言模型微调训练的效率低下，还会带来巨大的计算成本。

技术实现思路

[0003]本申请提供了一种多媒体处理网络生成方法、多媒体处理方法及装置，可以提升多媒体处理网络的生成效率，降低计算成本，同时提升多媒体处理网络的泛化能力，也可以在后续多媒体处理应用过程中，保证多媒体处理结果的准确性。
[0004]一方面，本申请提供了一种多媒体处理网络生成方法，所述方法包括：获取初始多媒体样本集；对所述初始多媒体样本集中的多媒体样本进行聚类处理，得到预设数量个聚类多媒体样本集；对每个聚类多媒体样本集进行至少两次采样，基于至少两次采样得到的采样结果生成所述初始多媒体样本集对应的至少两个初始关键多媒体样本集；每个初始关键多媒体样本集的样本数量不同；基于所述每个初始关键多媒体样本集对预设多媒体处理网络进行训...

【技术保护点】

【技术特征摘要】
1.一种多媒体处理网络生成方法，其特征在于，所述方法包括：获取初始多媒体样本集；对所述初始多媒体样本集中的多媒体样本进行聚类处理，得到预设数量个聚类多媒体样本集；对每个聚类多媒体样本集进行至少两次采样，基于至少两次采样得到的采样结果生成所述初始多媒体样本集对应的至少两个初始关键多媒体样本集；每个初始关键多媒体样本集的样本数量不同；基于所述每个初始关键多媒体样本集对预设多媒体处理网络进行训练，得到所述每个初始关键多媒体样本集对应的更新多媒体处理网络；根据所述更新多媒体处理网络对应的多媒体处理评价指标，从所述至少两个初始关键多媒体样本集中确定目标关键多媒体样本集，所述多媒体处理评价指标用于表征所述更新多媒体处理网络的多媒体处理的准确程度；将所述目标关键多媒体样本集对应的更新多媒体处理网络作为目标多媒体处理网络。2.根据权利要求1所述的方法，所述每个聚类多媒体样本集包括一个中心多媒体样本，其特征在于，所述对每个聚类多媒体样本集进行至少两次采样，基于至少两次采样得到的采样结果生成所述初始多媒体样本集对应的至少两个初始关键多媒体样本集包括：基于所述每个聚类多媒体样本集中的其它多媒体样本与所述每个聚类多媒体样本集中的中心多媒体样本的相似度信息，从所述其它多媒体样本中确定所述每个聚类多媒体样本集对应的关键多媒体样本；所述其它多媒体样本为所述每个聚类多媒体样本集中除所述中心多媒体样本外的多媒体样本；基于所述每个聚类多媒体样本集对应的关键多媒体样本，对所述每个聚类多媒体样本集进行至少两次采样，基于至少两次采样得到的采样结果生成所述初始多媒体样本集对应的至少两个初始关键多媒体样本集。3.根据权利要求2所述的方法，其特征在于，所述基于所述每个聚类多媒体样本集对应的关键多媒体样本，对所述每个聚类多媒体样本集进行至少两次采样，基于至少两次采样得到的采样结果生成所述初始多媒体样本集对应的至少两个初始关键多媒体样本集包括：基于所述每个聚类多媒体样本集对应的关键多媒体样本，对所述每个聚类多媒体样本集进行至少两次采样，得到每次采样生成的所述每个聚类多媒体样本集对应的关键多媒体样本集；对所述每次采样生成的所述每个聚类多媒体样本集对应的关键多媒体样本集进行融合，得到每次采样对应的初始关键多媒体样本集；根据所述每次采样对应的初始关键多媒体样本集，生成所述至少两个初始关键多媒体样本集。4.根据权利要求3所述的方法，其特征在于，所述基于所述每个聚类多媒体样本集对应的关键多媒体样本，对所述每个聚类多媒体样本集进行至少两次采样，得到每次采样生成的所述每个聚类多媒体样本集对应的关键多媒体样本集包括：基于所述每次采样对应的初始关键多媒体样本集的样本数量及所述每个聚类多媒体样本集的样本数量在所述初始多媒体样本集的样本数量中的占比信息，确定所述每个聚类多媒体样本集对应的采样样本数量；
将所述每个聚类多媒体样本集对应的关键多媒体样本作为所述每个聚类多媒体样本集对应的当前关键多媒体样本；基于所述每个聚类多媒体样本集中的非当前关键多媒体样本与所述每个聚类多媒体样本集对应的当前关键多媒体样本间的距离信息，从所述非当前关键多媒体样本中确定所述每个聚类多媒体样本集对应的采样多媒体样本；根据所述每个聚类多媒体样本集对应的采样多媒体样本和所述每个聚类多媒体样本集对应的当前关键多媒体样本，生成所述每个聚类多媒体样本集对应的更新关键多媒体样本集；将所述每个聚类多媒体样本集对应的更新关键多媒体样本集中的多媒体样本重新作为所述每个聚类多媒体样本集对应的当前关键多媒体样本，重复所述基于所述每个聚类多媒体样本集中的非当前关键多媒体样本与所述每个聚类多媒体样本集对应的当前关键多媒体样本间的距离信息，至所述生成所述每个聚类多媒体样本集对应的更新关键多媒体样本集的步骤，直至所述更新关键多媒体样本集的样本数量达到所述采样样本数量，得到所述每次采样生成的所述每个聚类多媒体样本集对应的关键多媒体样本集。5.根据权利要求1所述的方法，其特征在于，所述根据所述更新多媒体处理网络对应的多媒体处理评价指标，从所述至少两个初始关键多媒体样本集中确定目标关键多媒体样本集包括：将预设测试多媒体...

【专利技术属性】
技术研发人员：冯晓，何蕾，刘一仝，徐程程，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人