模型处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号：28376566 阅读：13 留言：0更新日期：2021-05-08 00:04

本申请公开了一种模型处理方法、装置、电子设备及存储介质，应用于计算机技术领域，该模型处理方法包括：获取随机赋值的初始样本；通过预先训练好的原始模型，对所述初始样本进行迭代更新，得到最终更新生成的合成样本，其中，所述原始模型根据原始训练样本对神经网络模型训练得到，所述合成样本用于模拟所述原始训练样本；根据所述合成样本，对所述原始模型的模型参数进行微调；对所述微调后的原始模型进行量化压缩，得到压缩后的目标模型。本方法通过生成近似原始训练样本的合成样本，来微调和量化模型，可以减少量化误差，提升量化精度。

全部详细技术资料下载

【技术实现步骤摘要】
模型处理方法、装置、电子设备及存储介质
本申请涉及计算机
，更具体地，涉及一种模型处理方法、装置、电子设备及存储介质。
技术介绍
伴随着人工智能的发展，深度学习在各个领域取得了突破进展，将深度学习的数学模型部署在移动电子设备与嵌入式系统也成为迫切需求。而当前的深度学习模型，主要依靠强大的硬件计算力来不断提升其架构的层次深度，进而得到较好的准确率。但是，对于现有的嵌入式设备或者大量边缘设备来说，其远远不能承受复杂性较高的数学模型，因此，需要对设备中的深度学习模型进行压缩。
技术实现思路
鉴于上述问题，本申请提出了一种模型处理方法、装置、电子设备及存储介质。第一方面，本申请实施例提供了一种模型处理方法，所述方法包括：获取随机赋值的初始样本；通过预先训练好的原始模型，对所述初始样本进行迭代更新，得到最终更新生成的合成样本，其中，所述原始模型根据原始训练样本对神经网络模型训练得到，所述合成样本用于模拟所述原始训练样本；根据所述合成样本，对所述原始模型的模型参数进行微调；对所述微调后的原始模型进行量化压缩，得到压缩后的目标模型。第二方面，本申请实施例提供了一种模型处理装置，所述装置包括：样本获取模块，用于获取随机赋值的初始样本；样本生成模块，用于通过预先训练好的原始模型，对所述初始样本进行迭代更新，得到最终更新生成的合成样本，其中，所述原始模型根据原始训练样本对神经网络模型训练得到，所述合成样本用于模拟所述原始训练样本；模型微调模块，用于根据所述合成样本，对所述原始模型的模型参

【技术保护点】
1.一种模型处理方法，其特征在于，所述方法包括：/n获取随机赋值的初始样本；/n通过预先训练好的原始模型，对所述初始样本进行迭代更新，得到最终更新生成的合成样本，其中，所述原始模型根据原始训练样本对神经网络模型训练得到，所述合成样本用于模拟所述原始训练样本；/n根据所述合成样本，对所述原始模型的模型参数进行微调；/n对所述微调后的原始模型进行量化压缩，得到压缩后的目标模型。/n

【技术特征摘要】
1.一种模型处理方法，其特征在于，所述方法包括：
获取随机赋值的初始样本；
通过预先训练好的原始模型，对所述初始样本进行迭代更新，得到最终更新生成的合成样本，其中，所述原始模型根据原始训练样本对神经网络模型训练得到，所述合成样本用于模拟所述原始训练样本；
根据所述合成样本，对所述原始模型的模型参数进行微调；
对所述微调后的原始模型进行量化压缩，得到压缩后的目标模型。

2.根据权利要求1所述的方法，其特征在于，所述通过预先训练好的原始模型，对所述初始样本进行迭代更新，得到最终更新生成的合成样本，包括：
将所述初始样本输入所述原始模型进行前向传播，并根据前向传播结果确定第一损失值；
基于所述第一损失值对所述原始模型进行反向传播，并在反向传播的过程中，更新所述初始样本；
重复执行所述将所述初始样本输入所述原始模型进行前向传播，并根据前向传播结果确定第一损失值，至所述基于所述第一损失值对所述原始模型进行反向传播，并在反向传播的过程中，更新所述初始样本的步骤，直到更新后的所述初始样本满足预设条件，停止对所述初始样本的更新，得到所述初始样本最终更新生成的合成样本。

3.根据权利要求2所述的方法，其特征在于，所述原始模型包括批量归一化层以及激活层，所述根据前向传播结果确定第一损失值，包括：
根据前向传播中所述原始模型的输出数据，确定第一因子损失值；
获取所述初始样本经过所述批量归一化层处理后的第一数据，以及所述初始样本经过所述激活层处理后的第二数据；
计算所述第一数据与第二数据的相似度，得到第二因子损失值；
根据所述第一因子损失值以及所述第二因子损失值，确定第一损失值。

4.根据权利要求3所述的方法，其特征在于，所述第一数据包括第一均值和第一方差，所述第二数据包括第二均值和第二方差，所述计算所述第一数据与第二数据的相似度，得到第二因子损失值，包括：
根据所述第一均值和第一方差，确定第一正态分布；
根据所述第二均值和第二方差，确定第二正态分布；
计算所述第一正态分布与第二正态分布之间的相对熵，得到第二因子损失值。

5.根据权利要求3所述的方法，其特征在于，所述根据所述第一因子损失值以及所述第二因...

【专利技术属性】
技术研发人员：谭志鹏，
申请(专利权)人：OPPO广东移动通信有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人