应用于AI芯片的计算图可视化方法、装置、设备及介质制造方法及图纸

技术编号:37791524 阅读:11 留言:0更新日期:2023-06-09 09:21
本发明专利技术公开了一种应用于AI芯片的计算图可视化方法、装置、设备及介质。该方法包括:获取算法模型在指定AI芯片下所对应的任意深度学习框架所生成的初始计算图;获取AI芯片信息,基于AI芯片信息构建与初始计算图所匹配的第一双向节点图结构体;根据第一双向节点图结构体获取计算图结构图、内存使用峰值和节点运行评估图。在双向节点图结构的基础上实现快速搜索,大型深度学习模型分级可视化,并将计算图结构图、内存使用峰值图和节点运行评估图进行可视化展示,在增加多种优化信息的同时实现计算图的可视化,并能够实现对不同深度学习框架的兼容,减少了AI芯片上算法模型优化分析的成本。成本。成本。

【技术实现步骤摘要】
应用于AI芯片的计算图可视化方法、装置、设备及介质


[0001]本专利技术实施例涉及人工智能芯片技术,尤其涉及一种应用于AI芯片的计算图可视化方法、装置、设备及介质。

技术介绍

[0002]现有的人工智能(Artificial Intelligence,AI)芯片通常会应用于神经网络模型等复杂多节点结构的计算,从而提高多节点结构所对应的算法模型的运算效率。
[0003]但是在应用AI芯片进行复杂多节点结构的计算时,需要使用可视化技术支持模型的分析与优化,但是由于算法模型计算图复杂度高,且神经网络模型框架繁多,现有的可视化方法无法兼容多样的网络模型架构,从而增加了算法模型分析优化的成本。

技术实现思路

[0004]本专利技术实施例提供一种应用于AI芯片的计算图可视化方法、装置、设备及介质,以实现对计算图的可视化展示。
[0005]第一方面,本专利技术实施例提供了一种应用于AI芯片的计算图可视化方法,包括:获取算法模型在指定AI芯片下所对应的任意深度学习框架所生成的初始计算图,其中,所述任意深度学习框架所生成的初始计算图中包括所述算法模型的节点和节点描述;
[0006]获取AI芯片信息,基于所述AI芯片信息构建与所述初始计算图所匹配的第一双向节点图结构体;
[0007]根据所述第一双向节点图结构体获取计算图结构图、内存使用峰值图和节点运行时间评估图,并将所述计算图结构图、所述内存使用峰值图和所述节点运行时间评估图进行可视化展示。
[0008]第二方面,本专利技术实施例提供了一种应用于AI芯片的计算图可视化装置,包括:初始计算图获取模块,用于获取算法模型在指定AI芯片下所对应的任意深度学习框架所生成的初始计算图,其中,所述任意深度学习框架所生成的初始计算图中包括所述算法模型的节点;
[0009]第一双向节点图结构体构建模块,用于获取AI芯片信息,基于所述AI芯片信息构建与所述初始计算图所匹配的第一双向节点图结构体;
[0010]可视化展示模块,用于根据所述第一双向节点图结构体获取计算图结构图、内存使用峰值图和节点运行时间评估图,并将所述计算图结构图、所述内存使用峰值图和所述节点运行时间评估图进行可视化展示。
[0011]第三方面,本专利技术实施例提供了计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述的方法。
[0012]第四方面,本专利技术实施例提供了一种计算机可执行指令的存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述方法。
附图说明
[0013]图1是本专利技术实施例一提供的一种应用于AI芯片的计算图可视化方法的流程图;
[0014]图2是本专利技术实施例一提供的计算图结构图的示意图;
[0015]图3是本专利技术实施例一提供的内存使用峰值图的示意图;
[0016]图4是本专利技术实施例一提供的节点运行时间评估图的示意图;
[0017]图5是本专利技术实施例二提供的一种应用于AI芯片的计算图可视化方法的流程图;
[0018]图6是本专利技术实施例三提供的一种应用于AI芯片的计算图可视化装置的结构示意图;
[0019]图7是本专利技术实施例四提供的一种计算机设备的结构示意图。
具体实施方式
[0020]下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。
[0021]实施例一
[0022]图1为本专利技术实施例一提供的一种应用于AI芯片的计算图可视化方法的流程图,本实施例可适用于对计算图进行可视化展示的情况,该方法可以由应用于AI芯片的计算图可视化装置来执行,该装置可以由软件和/或硬件的方式实现,方法包括:
[0023]步骤S101,获取算法模型在指定AI芯片下所对应的任意深度学习框架所生成的初始计算图。
[0024]其中,算法模型可以是神经网络模型或者贝叶斯模型,本实施方式中并不对算法模型的具体类型进行限定。并且在指定的AI芯片下,可以通过任意深度学习框架生成与算法模型所对应的初始计算图,而通过任意深度学习框架所生成的初始计算图中可以包括算法模型的节点和节点描述。此时所获取的初始计算图具体可以是一种中间表达源码的形式,例如:%22=“gather”(%arg60,%19){dimension_numbers=collapsed_slice_dims=dense<0>:tensor<1xi64>,index_vector_dim=1:i64,offset_dims=dense<1>:tensor<1xi64>,start_index_map=dense<0>:tenso r<1xi64>,indices_are_sorted=false,name=“gather.278”,op_id=7:i64,slice_size=dense<[1,1024]>:tensor<2xi64>,tensor_split=dense<[4,1]>:tensor<1x2xi32>,uniq ue_name=“common20_gather”}。其中,gather是节点的名称,而{}内所包含的内容为节点描述,当然,本实施方式中仅是举例说明,而并不对初始计算图中所包含的节点数量,以及节点描述内容进行具体限定。
[0025]步骤S102,获取AI芯片信息,基于AI芯片信息构建与初始计算图所匹配的第一双向节点图结构体。
[0026]可选的,基于AI芯片信息构建与初始计算图所匹配的第一双向节点图结构体,包括:对初始计算图中的各节点进行后向遍历获取节点依赖关系,并根据节点、节点描述和节点依赖关系构建第二双向节点图结构体;根据第二双向节点图结构体以及AI芯片信息获取与初始计算图所匹配的第一双向节点图结构体。
[0027]可选的,根据第二双向节点图结构体以及AI芯片信息获取与初始计算图所匹配的第一双向节点图结构体,包括:按照指定规则对第二双向节点图结构体进行简化,获取简化
后的第三双向节点图结构体,其中,第三双向节点图结构体中包括简化后的节点、简化后的节点描述和节点依赖关系;确定AI芯片信息中所包含的硬件参数信息以及基于AI芯片的底层硬件算子信息;根据第三双向节点图结构体、硬件参数信息以及底层硬件算子信息获取与初始计算图所匹配的第一双向节点图结构体。
[0028]可选的,按照指定规则对第二双向节点图结构体进行简化,获取简化后的第三双向节点图结构体,包括:将第二双向节点图结构体中指定类型的节点进行删除,获取本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种应用于AI芯片的计算图可视化方法,其特征在于,包括:获取算法模型在指定AI芯片下所对应的任意深度学习框架所生成的初始计算图,其中,所述任意深度学习框架所生成的初始计算图中包括所述算法模型的节点和节点描述;获取AI芯片信息,基于所述AI芯片信息构建与所述初始计算图所匹配的第一双向节点图结构体;根据所述第一双向节点图结构体获取计算图结构图、内存使用峰值图和节点运行时间评估图,并将所述计算图结构图、所述内存使用峰值图和所述节点运行时间评估图进行可视化展示。2.根据权利要求1所述的方法,其特征在于,所述构建与所述初始计算图所匹配的第一双向节点图结构体,包括:对所述初始计算图中的各节点进行后向遍历获取节点依赖关系,并根据所述节点、所述节点描述和所述节点依赖关系构建第二双向节点图结构体;根据所述第二双向节点图结构体以及所述AI芯片信息获取与所述初始计算图所匹配的第一双向节点图结构体。3.根据权利要求2所述的方法,其特征在于,所述根据所述第二双向节点图结构体以及所述AI芯片信息获取与所述初始计算图所匹配的第一双向节点图结构体,包括:按照指定规则对所述第二双向节点图结构体进行简化,获取简化后的第三双向节点图结构体,其中,所述第三双向节点图结构体中包括简化后的节点、简化后的节点描述和节点依赖关系;确定所述AI芯片信息中所包含的硬件参数信息以及基于所述AI芯片的底层硬件算子信息;根据所述第三双向节点图结构体、所述硬件参数信息以及所述底层硬件算子信息获取与所述初始计算图所匹配的第一双向节点图结构体。4.根据权利要求3所述的方法,其特征在于,所述按照指定规则对所述第二双向节点图结构体进行简化,获取简化后的第三双向节点图结构体,包括:将所述第二双向节点图结构体中指定类型的节点进行删除,获取所述简化后的节点,其中,所述指定类型包括非计算类节点;将所述第二双向节点图结构中指定形式的节点描述进行删除,获取所述简化后的节点描述,其中,所述指定形式包括形状对应排布以及为了向下映射硬件所拥有的信息;根据所述简化后的节点、所述简化后的节点描述和所述节点依赖关系构建所述第三双向节点图结构体。5.根据权利要求3所述的方法,其特征在于,所述根据所述第三双向节点图结构体、所述硬件参数信息以及所述底层硬件算子信息获取与所述初始计算图所匹配的第一双向节点图结构体,包括:根据所述硬件参数信息和所述底层硬件算子信息对所述第三双向节点图结构体进行节点遍历计算,获取各节点的节点运行信息,其中,所述节点运行信息包括预估运行时间、存储空间使用量、算力和带宽;根据所述简化后的节点、所述简化后的节点描述、所述节点依赖关系和所述节点运行信息构建所述第一双向节点图结构体。
6.根据权利要求5所述的方法,其特征在于,所述根据...

【专利技术属性】
技术研发人员:孙诚程李超豪张亚林
申请(专利权)人:上海燧原科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1