一种任务编译方法、装置和编译器制造方法及图纸

技术编号：34553809 阅读：14 留言：0更新日期：2022-08-17 12:39

本发明专利技术实施例提供了一种任务编译方法、装置和编译器。该方法包括：编译器接收用户输入的至少一个编译任务，编译器判断编译任务是否包括多个分支任务，若判断出编译任务包括多个分支任务时，则根据多个分支任务对获取的嵌入式神经网络处理器NPU的硬件资源进行划分，生成硬件分配结果，根据硬件分配结果、用户输入的编译参数和获取的每个NPU核心计算需要的核心参数，生成第一编译指令；编译器将第一编译指令发送给调度器，以供调度器根据第一编译指令对硬件资源进行调度，从而通过编译器实现了合理分配NPU的硬件资源，提高了NPU的运算速度。度。度。

全部详细技术资料下载

【技术实现步骤摘要】
一种任务编译方法、装置和编译器

[0001]本专利技术实施例涉及人工智能(Artificial Intelligence，AI)
，尤其涉及一种任务编译方法、装置和编译器。

技术介绍

[0002]随着科技的发展，AI产业发展迅速，对于图像或视频的处理需求在不断增加。嵌入式神经网络处理器(Nueral
‑
Network Processing Unit,NPU)作为一种专门用于加速神经网络推理的处理器，NPU主要采用专用集成电路(Application Specific Integrated Circuit，ASIC)技术通过硬件模拟神经网络的方式，弥补了中央处理单元(Central Processing Unit，CPU)、图像处理单元(Graphics Processing Unit，GPU)对于神经网络计算架构设计上的不足，大大提高了AI芯片的运算速度。
[0003]相关技术中，为了进一步提高AI芯片的运算速度，对于NPU的设计不可避免地朝着多核架构的方向发展。目前，多核NPU的发展尚未形成完整的体系，缺乏成熟且具有针对性的编译器分析前端模型，无法根据任务对后端硬件配置进行合理分配，导致运算速度有所降低。

技术实现思路

[0004]有鉴于此，本专利技术实施例提供了一种任务编译方法、装置和编译器，通过编译器实现合理分配NPU的硬件资源，用以提高NPU的运算速度。
[0005]第一方面，本专利技术实施例提供了一种任务编译方法，所述方法包括：
[...

【技术保护点】

【技术特征摘要】
1.一种任务编译方法，其特征在于，所述方法包括：接收用户输入的至少一个编译任务；判断所述编译任务是否包括多个分支任务；若判断出所述编译任务包括多个分支任务时，则根据多个分支任务对获取的嵌入式神经网络处理器NPU的硬件资源进行划分，生成硬件分配结果；根据所述硬件分配结果、用户输入的编译参数和获取的每个NPU核心计算需要的核心参数，生成第一编译指令；将所述第一编译指令发送给调度器，以供所述调度器根据所述第一编译指令对所述硬件资源进行调度。2.根据权利要求1所述的方法，其特征在于，所述根据多个分支任务对获取的嵌入式神经网络处理器NPU的硬件资源进行划分，生成硬件分配结果，包括：对多个分支任务进行聚类，生成多个任务类别数据；根据多个任务类别数据对所述硬件资源进行划分，生成硬件分配结果。3.根据权利要求1所述的方法，其特征在于，还包括：若判断出所述编译任务不包括分支任务时，则根据所述编译参数和核心参数，生成第二编译指令；将所述第二编译指令发送给调度器，以供所述调度器根据所述第二编译指令对所述硬件资源进行调度。4.根据权利要求1所述的方法，其特征在于，所述编译任务的数量为多个，所述判断所述编译任务是否包括多个分支任务之前，还包括：若判断出所述编译任务的数目小于或等于所述NPU集群的数目时，则将每个编译任务分配至对应的NPU集群，并行执行判断所述编译任务是否包括多个分支任务的步骤。5.根据权利要求1所述的方法，其特征在于，所述编译任务的数量为多个，所述方法还包括：若判断出所述编译任务的数目大于所述NPU集群的数目时，则计算每个编译任务的计算需求量；从用户输入的多个编译任务中选取出特定数目个编译任务，所述特定数目个编译任务的计算需求量均小于用户输入的多个编译任务中其它编译任务的计算需求量，所述特定数目等于所述NP...

【专利技术属性】
技术研发人员：马海涛，
申请(专利权)人：展讯通信天津有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人