一种基于神经网络结构的NPU功耗优化方法及系统技术方案

技术编号：38341918 阅读：34 留言：0更新日期：2023-08-02 09:22

本发明专利技术涉及处理器功耗优化技术领域，尤其涉及一种基于神经网络结构的NPU功耗优化方法及系统，其方法包括：S1、获取目标神经网络的基础结构信息，根据目标神经网络的基础结构信息确定NPU网络基础架构；S2、根据基础结构信息对目标神经网络进行训练，以得到目标神经网络的目标网络参数；S3、基于目标网络参数对NPU基础架构进行调整，以得到初始NPU网络架构；S4、获取NPU的历史运行数据，根据NPU的历史运行数据确定功耗指标参数，并形成功耗训练样本；S5、将功耗训练样本投入初始NPU网络架构进行训练和验证，以得到功耗验证结果；S6、基于功耗验证结果对初始NPU网络架构进行优化调整，以得到目标NPU网络架构。本发明专利技术大大降低NPU运行功耗，提高其运行性能。提高其运行性能。提高其运行性能。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于神经网络结构的NPU功耗优化方法及系统

[0001]本专利技术涉及处理器功耗优化
，尤其涉及一种基于神经网络结构的NPU功耗优化方法及系统。

技术介绍

[0002]随着人工智能领域相关技术的飞速发展，众多行业正进行着智能化的转变。深度学习是机器学习领域一个研究方向，近年来受到广泛的应用。随着应用场景和人们需求的不断变化，所需处理的数据也变得更加的复杂且数据量也显著增加，这就使得AI算法必须能够高效的运行在硬件平台上，因此，对运行硬件也有了更高的要求。在硬件方面，目前主要是使用GPU并行计算神经网络和嵌入式神经网络处理器(NPU)。
[0003]但是，现有技术中，使用嵌入式神经网络处理器NPU存在功耗很大的问题，无法更好的解决NPU的功耗问题，其能效比还需进行进一步的提升，以更好的满足应用需求。

技术实现思路

[0004]本专利技术的目的在于提出一种基于神经网络结构的NPU功耗优化方法及系统，可大大降低NPU运行功耗，提高其运行性能。
[0005]为达此目的，本专利技术采用以下技术方案：一种基于神经网络结构的NPU功耗优化方法，包括以下步骤：S1、获取目标神经网络的基础结构信息，根据目标神经网络的基础结构信息确定NPU网络基础架构；S2、根据神经网络的基础结构信息对目标神经网络进行训练，以得到目标神经网络的目标网络参数；S3、基于目标网络参数对NPU基础架构进行调整，以得到初始NPU网络架构；S4、获取NPU的历史运行数据，根据NPU的历史运行数据确定功耗指标参数，并形成功...

【技术保护点】

【技术特征摘要】
1.一种基于神经网络结构的NPU功耗优化方法，其特征在于，包括以下步骤：S1、获取目标神经网络的基础结构信息，根据目标神经网络的基础结构信息确定NPU网络基础架构；S2、根据神经网络的基础结构信息对目标神经网络进行训练，以得到目标神经网络的目标网络参数；S3、基于目标网络参数对NPU基础架构进行调整，以得到初始NPU网络架构；S4、获取NPU的历史运行数据，根据NPU的历史运行数据确定功耗指标参数，并形成功耗训练样本；S5、将功耗训练样本投入初始NPU网络架构进行训练和验证，以得到功耗验证结果；S6、基于功耗验证结果对初始NPU网络架构进行优化调整，以得到目标NPU网络架构。2.根据权利要求1所述的一种基于神经网络结构的NPU功耗优化方法，其特征在于，还包括以下步骤：S7、根据目标神经网络的基础结构信息获取NPU硬件架构；S8、获取NPU的历史运行数据中的硬件特征数据，形成硬件性能数据样本，并将硬件性能数据样本对NPU硬件架构进行训练和验证，以得到硬件验证结果；S9、基于硬件验证结果对NPU硬件架构进行优化调整，以得到NPU硬件优化架构；S10、结合NPU硬件优化架构和目标NPU网络架构建立最优NPU。3.根据权利要求2所述的一种基于神经网络结构的NPU功耗优化方法，其特征在于，所述S3、基于目标网络参数对NPU基础架构进行调整，以得到初始NPU网络架构；具体包括以下步骤：S31、获取目标网络参数中的各个参数和其对应的属性特征，其中各个参数包括网络结构特征T、计算量C、参数量N、参数权重、网络层占比P以及依赖关系R，其对应的属性特征是指各个参数的具体量值；S32、对NPU基础架构进行拆分，以得到多个架构层，并对各个架构层进行属性标记；S33、基于目标网络参数中的各类参数的属性特征和各个架构层的属性标记对NPU基础架构的各个架构层进行调整，以得到初始NPU网络架构。4.根据权利要求3所述的一种基于神经网络结构的NPU功耗优化方法，其特征在于，所述S8、获取NPU的历史运行数据中的硬件特征数据，形成硬件性能数据样本，并将硬件性能数据样本对NPU硬件架构进行训练和验证，以得到硬件验证结果；具体包括以下步骤：S81、提取NPU的历史运行数据中的硬件特征数据，包括硬件资源约束文件、硬件架构描述文件和控制描述文件中的相关特征数据；S82、将硬件特征数据整理为各个类别的历史训练样本；S83、基于获取的各个类别的历史训练样本结合神经网络学习，对各NPU硬件架构中的各个参数进行训练和验证，得到对应的验证结果。5.根据权利要求1所述的一种基于神经网络结构的NPU功耗优化系统，其特征在于，采用如权利要求1
‑
4任一项所述的一种基于神经网络结构的NPU功耗优化方法，包括：基础架构确定模块，用于获取目标神经网络的基础结构信息，根据目标神经网络的基础结构信息确定NPU网络基础架...

【专利技术属性】
技术研发人员：黄茂芹，
申请(专利权)人：广东赛昉科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人