神经网络模型的编译方法、优化模型的训练方法和装置制造方法及图纸

技术编号：38596475 阅读：28 留言：0更新日期：2023-08-26 23:32

本公开实施例公开了一种神经网络模型的编译方法、优化模型的训练方法和装置，其中，方法包括：获取待编译神经网络模型；基于待编译神经网络模型，确定待编译神经网络模型对应的中间指令序列；利用预先训练获得的指令序列优化模型对中间指令序列进行处理，获得中间指令序列对应的目标优化参数；基于目标优化参数，确定中间指令序列对应的优化指令序列；将优化指令序列转换为可执行指令序列，获得待编译神经网络模型对应的神经网络处理器可执行的目标指令序列。本公开实施例可以大大降低编译时间，从而可以有效提高编译效率。从而可以有效提高编译效率。从而可以有效提高编译效率。

全部详细技术资料下载

【技术实现步骤摘要】
神经网络模型的编译方法、优化模型的训练方法和装置

[0001]本公开涉及人工智能技术，尤其是一种神经网络模型的编译方法、优化模型的训练方法和装置。

技术介绍

[0002]随着人工智能的飞速发展，深度神经网络模型(可以简称模型)被广泛应用于计算机视觉、自然语言处理、语音识别、自动驾驶等众多领域。在模型的网络结构确定后，模型的实际执行效率主要依赖于硬件与编译器。为了提升模型的执行效率和处理能力，编译优化技术被提出并应用于模型的编译过程中，编译优化技术可以在不增加硬件成本的情况下提升模型的执行效率和处理能力。在相关技术的编译过程中，通常先将模型转换到中间表示的指令序列(可以称为中间指令序列或计算图)，进而针对模型人工制定识别可优化部分的规则，并针对可优化部分设计启发式算法，以遍历各种优化方案(优化指令序列)，找到最优的优化方案，但是，基于启发式算法确定最优优化方案的方法遍历时间长，导致编译时间过长、编译效率较低。

技术实现思路

[0003]为了解决上述编译时间长、效率低等技术问题，本公开的实施例提供了一种神经网络模型的编译方法、优化模型的训练方法和装置，以降低编译时间，提高编译效率。
[0004]本公开的第一个方面，提供了一种神经网络模型的编译方法，包括：获取待编译神经网络模型；基于所述待编译神经网络模型，确定所述待编译神经网络模型对应的中间指令序列；利用预先训练获得的指令序列优化模型对所述中间指令序列进行处理，获得所述中间指令序列对应的目标优化参数；基于所述目标优化参数，确定所述中间指令序列对应的

【技术保护点】

【技术特征摘要】
1.一种神经网络模型的编译方法，包括：获取待编译神经网络模型；基于所述待编译神经网络模型，确定所述待编译神经网络模型对应的中间指令序列；利用预先训练获得的指令序列优化模型对所述中间指令序列进行处理，获得所述中间指令序列对应的目标优化参数；基于所述目标优化参数，确定所述中间指令序列对应的优化指令序列；将所述优化指令序列转换为可执行指令序列，获得所述待编译神经网络模型对应的神经网络处理器可执行的目标指令序列。2.根据权利要求1所述的方法，其中，所述利用预先训练获得的指令序列优化模型对所述中间指令序列进行处理，获得所述中间指令序列对应的目标优化参数，包括：利用所述指令序列优化模型中的第一特征提取网络对所述中间指令序列进行特征提取，获得指令序列特征；利用所述指令序列优化模型中的预测头网络对所述指令序列特征进行处理，获得处理结果，所述处理结果包括所述中间指令序列对应的优化参数预测概率；基于所述处理结果及预设映射规则，确定所述目标优化参数。3.根据权利要求2所述的方法，还包括：获取当前内存信息序列；所述利用预先训练获得的指令序列优化模型对所述中间指令序列进行处理，获得所述中间指令序列对应的目标优化参数，还包括：利用所述指令序列优化模型中的第二特征提取网络对所述当前内存信息序列进行特征提取，获得内存信息特征；将所述指令序列特征与所述内存信息特征进行融合，获得融合特征；所述利用所述指令序列优化模型中的预测头网络对所述指令序列特征进行处理，获得处理结果，包括：利用所述预测头网络对所述融合特征进行处理，获得所述处理结果。4.根据权利要求3所述的方法，其中，所述将所述指令序列特征与所述内存信息特征进行融合，获得融合特征，包括：将所述指令序列特征按照第一聚合规则进行聚合，获得第一聚合特征；将所述内存信息特征按照第二聚合规则进行聚合，获得第二聚合特征；所述第二聚合特征与所述第一聚合特征在至少一个方向上的维度相同；将所述第一聚合特征和所述第二聚合特征进行拼接，获得所述融合特征。5.根据权利要求1所述的方法，其中，所述目标优化参数包括内存管理参数、算子执行模式参数和张量拆分参数；所述基于所述目标优化参数，确定所述中间指令序列对应的优化指令序列，包括：基于所述内存管理参数、所述算子执行模式参数和所述张量拆分参数，对所述中间指令序列进行优化，获得所述优化指令序列。6.一种指令序列优化模型的训练方法，包括：获取至少一个神经网络模型分别对应的训练中间指令序列及各所述训练中间指令序列分别对应的最优优化参数标签；
基于各所述训练中间指令序列及各所述训练中间指令序列分别对应的所述最优优化参数标签，对预先建立的指令序列优化网络进行训练，获得训练好的指令序列优化模型。7.根据权利要求6所述的方法，其中，所述基于各所述训练中间指令序列及各所述训练中间指令序列分别对应的所述最优优化参数标签，对预先建立的指令序列优化网络进行训练，获得训练好的指令序列优化模型，包括：利用所述指令序列优化网络对各所述训练中间指令序列进行处理，获得各所述训练中间指令序列分别对应的预测处理结果；基于各所述训练中间指令序列分别对应的所述预测处理结果、各所述训练中间指令序列分别对应的所述最优优化参数标签及预设损失函数，确定网络损失；基于所述网络损失对所述指令序列优化网络的网络参数进行更新，获得更新后的网络参数；基于所述更新后的网络参数，确定更新后的指令序列优化网络；将所述更新后的指令序列优化网络作为所述指令序列优化网络，重复执行利用所述指令序列优化网络对各所述训练中间指令序列进行处理，获得各所述训练中间指令序列分别对应的预测处理结果的步骤；响应...

【专利技术属性】
技术研发人员：沈碧螺，邓博文，李建军，张骞，
申请(专利权)人：北京地平线信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人