数据处理方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:27466027 阅读:28 留言:0更新日期:2021-03-02 17:28
本公开涉及一种数据处理方法、装置、计算机设备和存储介质。所述计算机设备包括控制模块,所述控制模块包括:指令缓存单元、指令处理单元和存储队列单元;所述指令缓存单元,用于存储所述人工神经网络运算关联的计算指令;所述指令处理单元,用于对所述计算指令解析得到多个运算指令;所述存储队列单元,用于存储指令队列,该指令队列包括:按该队列的前后顺序待执行的多个运算指令或计算指令。通过以上方法,本公开可以提高相关产品在进行神经网络模型训练过程中的运算效率。型训练过程中的运算效率。型训练过程中的运算效率。

【技术实现步骤摘要】
数据处理方法、装置、计算机设备和存储介质


[0001]本公开涉及人工智能
,特别是涉及一种数据处理方法、装置、计算机设备和存储介质。

技术介绍

[0002]随着人工智能技术的发展,出现了深度学习技术,目前深度学习都是采用在线模型进行实现,采用在线模型进行深度学习会在神经网络模型的训练过程中,依次在人工智能处理器上将神经网络模型中每一个算子编译为二进制指令进行运行,并返回计算结果和状态,这种神经网络模型的训练方法占用CPU资源过多,CPU的功耗高。

技术实现思路

[0003]基于此,有必要针对上述技术问题,提供一种能够减少在神经网络模型的训练过程中对CPU资源的占用,降低CPU功耗的神数据处理方法、装置、计算机设备和存储介质。
[0004]根据本公开的一方面,提供了一种数据处理方法,所述方法包括:
[0005]获取执行文件,所述执行文件包括将神经网络模型进行编译后得到的,用于在人工智能处理器上执行的二进制指令;
[0006]将所述执行文件输入人工智能处理器,以使所述人工智能处理器根据输入数据和所述执行文件对所述神经网络模型进行训练,得到所述神经网络模型的训练结果。
[0007]根据本公开的另一方面,提供了一种数据处理装置,包括:
[0008]获取模块,用于获取执行文件,所述执行文件包括将神经网络模型进行编译后得到的,用于在人工智能处理器上执行的二进制指令;
[0009]执行模块,用于将所述执行文件输入人工智能处理器,以使所述人工智能处理器根据输入数据和所述执行文件对所述神经网络模型进行训练,得到所述神经网络模型的训练结果。
[0010]根据本公开的另一方面,提供了一种人工智能芯片,所述芯片包括前述任意一项所述的数据处理装置。
[0011]根据本公开的另一方面,提供了一种电子设备,所述电子设备包括如前述的人工智能芯片。
[0012]根据本公开的另一方面,提供了一种板卡,所述板卡包括:存储器件、接口装置和控制器件以及如前述的人工智能芯片;
[0013]其中,所述人工智能芯片与所述存储器件、所述控制器件以及所述接口装置分别连接;
[0014]所述存储器件,用于存储数据;
[0015]所述接口装置,用于实现所述人工智能芯片与外部设备之间的数据传输;
[0016]所述控制器件,用于对所述人工智能芯片的状态进行监控。
[0017]根据本公开的另一方面,提供了一种电子设备,包括:
[0018]处理器;
[0019]用于存储处理器可执行指令的存储器;
[0020]其中,所述处理器被配置为调用所述存储器存储的指令,以执行前述任意一项数据处理方法。
[0021]根据本公开的另一方面,提供了一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现前述任意一项所述的数据处理方法。
[0022]这样,根据本公开实施例提供的数据处理方法、装置、计算机设备和存储介质,可以将神经网络模型预先编译为执行文件保存,进而在进行神经网络模型的训练时,直接将该执行文件输入人工智能处理器中,使人工智能处理器根据读入的输入数据及执行文件对神经网络模型进行训练,这样一来,减少了处理器对神经网络模型中各算子的在线编译操作,可以减少训练过程中对CPU资源的占用,降低CPU的功耗。
[0023]通过权要中的技术特征进行推导,能够达到对应
技术介绍
中的技术问题的有益效果。根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
[0024]包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本公开的示例性实施例、特征和方面,并且用于解释本公开的原理。
[0025]图1示出本公开实施例提供的数据处理方法的应用场景的示意图;
[0026]图2示出根据本公开实施例的数据处理方法的人工智能处理器的示意图;
[0027]图3示出根据本公开一实施例的数据处理方法的流程图;
[0028]图4示出本公开一示例性的数据处理方法的示意图;
[0029]图5示出根据本公开实施例的数据处理装置的框图;
[0030]图6示出根据本公开实施例的板卡的结构框图;
[0031]图7示出根据本公开实施例的一种电子设备800的框图;
[0032]图8示出根据本公开实施例的一种电子设备1900的框图。
具体实施方式
[0033]下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
[0034]应当理解,本公开的权利要求、说明书及附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。本公开的说明书和权利要求书中使用的术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
[0035]还应当理解,在此本公开说明书中所使用的术语仅仅是出于描述特定实施例的目的,而并不意在限定本公开。如在本公开说明书和权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。还应当进一
步理解,在本公开说明书和权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
[0036]如在本说明书和权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
[0037]图1示出本公开实施例提供的数据处理方法的应用场景的示意图,本公开实施例可以应用于图1所示的计算机系统中,该计算机系统包括存储器和处理器,该存储器可以用于存储计算机程序,该处理器可以用于执行数据处理操作,例如,可以用于执行本公开实施例提供的数据处理方法。通过本公开实施例提供的数据处理方法,可以降低在神经网络的训练过程中所占用的CPU资源,降低CPU的功耗。
[0038]本公开实施例中涉及的人工智能处理器可以为用于执行人工智能运算的人工智能处理器。人工智能运算可包括机器学习运算,类脑运算等。其中,机器学习运算包括神经网络运算、k-means运算、支持向量机运算等。该人工智能处理器可例如包括GPU(Graphics Processing Unit,图形处理单元)、NPU(Neural-Network Processing Unit,神经网络处本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取执行文件,所述执行文件包括将神经网络模型进行编译后得到的,用于在人工智能处理器上执行的二进制指令;将所述执行文件输入人工智能处理器,以使所述人工智能处理器根据输入数据和所述执行文件对所述神经网络模型进行训练,得到所述神经网络模型的训练结果。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:对所述神经网络模型进行优化处理,所述优化处理至少包括算子融合、数据复用和去除冗余算子中的至少一种;将优化后的神经网络模型进行编译,得到所述执行文件。3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:确定针对所述神经网络模型的划分粒度;根据所述划分粒度将所述神经网络模型划分为多个子图,所述多个子图中的至少一个子图包括两个以上算子;根据各所述子图对所述神经网络模型进行编译,得到所述执行文件,所述执行文件中包括各所述子图标识,所述子图标识用于指示人工智能处理器完成该子图中所有算子的运算后,返回该子图的运算结果。4.根据权利要求1至3任一项所述的方法,其特征在于,所述执行文件包括权值文件和模型文件,其中,所述权值文件中包括所述神经网络模型的权值的地址,所述模型文件中包括所述神经网络模型中各算子的二进制指令和算子之间的连接关系。5.一种数据处理装置...

【专利技术属性】
技术研发人员:ꢀ七四专利代理机构
申请(专利权)人:中科寒武纪科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1