System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及计算机数据处理,尤其涉及一种算力引擎构建方法、装置、设备和存储介质。
技术介绍
1、算力引擎是指通过计算能力、网络能力和存储能力的协同发展,提供高效的数据处理和存储服务。它不仅是数字经济时代的新型战略性资源,也是推动经济社会高质量发展的重要驱动力。
2、现有张量火车加速器是目前最具代表性的张量火车加速器,其架构通过定制的数据流和内存访问模式,显著提高了张量火车分解模型的执行效率。但是,现有的it计算器在计算过程中,虽然通过张量火车分解显著减少了模型大小,但其计算量的减少并不如存储节省显著。这导致了在处理高压缩比模型时,计算节省不足,无法充分利用张量火车分解带来的压缩优势。计算节省不足限制了整体加速器的性能,导致实际的加速效果远低于理论上的可能性。
技术实现思路
1、本申请提供一种算力引擎构建方法、装置、设备和存储介质,用以解决数据压缩过程中计算节省不足的问题。
2、第一方面,本申请提供一种算力引擎构建方法,包括:基于一种计算芯片,所述计算芯片包括处理单元架构、第一存储器以及第二存储器,所述处理单元架构与所述第一存储器和所述第二存储器连接,所述处理单元架构包括至少两个处理单元阵列;所述方法包括:根据神经网络中每一层的权重,将原始张量逐步分解为多个子张量;其中,各个子张量的秩满足设定要求,每个子张量对应一层的权重;将所述多个子张量存储于所述第一存储器中以及将各个子张量对应的权重存储于所述第二存储器中;根据子张量的排序顺序以及各子张量之间的计算依赖关系,
3、在一种可能的设计中,将原始张量逐步分解为多个子张量,包括:基于目标张量的秩,选择一个维度进行分割,将原始张量分解为多个中间张量,并对各个中间张量递归应用分解算法,直到分解得到的张量与目标张量的秩相等,以分解得到的张量作为子张量。
4、在一种可能的设计中,根据所述计算顺序,利用处理单元阵列执行并行计算,包括:
5、消除阶段:基于计算顺序,将第一存储器中的第一目标子张量输入至第二存储器中;其中,所述第一目标子张量为消除阶段所要应用的子张量;响应于输入的原始数据,执行连续的多阶段消除计算;其中,在各阶段消除计算过程中,基于计算顺序,从所述第二存储器中读取对应的第一目标子张量进行消除计算,得到的第一计算结果直接传递至下一阶段的消除计算,直到多阶段消除计算结束,得到中间数据;
6、扩展阶段:基于计算顺序,将第一存储器中的第二目标子张量输入至第二存储器中;其中,所述第二目标子张量为扩展阶段所要应用的子张量;响应于输入的中间数据,执行多次连续的多阶段扩展计算;其中,在每次连续的多阶段扩展计算中,基于计算顺序,从第二存储器中读取对应的第二目标子张量进行扩展计算,得到的第二计算结果直接传递至下一阶段的扩展计算,直到多阶段扩展计算结束,得到中间压缩数据;将每次连续的多阶段扩展计算所得到的中间压缩数据叠加,得到目标压缩数据。
7、在一种可能的设计中,所述原始数据包括图像数据、视频数据、语音数据以及文本数据中的一种。
8、在一种可能的设计中,在根据所述计算顺序,利用处理单元阵列执行并行计算的过程中,所述方法还包括:根据所述第二存储器的输入数据和输出数据的维度因子,确定所述第二存储器中的存储数据的重排顺序,并基于所述重排顺序,重新组织数据存储结构;根据所述第二存储器中每次被访问的数据的大小,调整访问数据;从所述第二存储器中读取数据,进行矩阵变换,得到变换数据替换对应读取的数据。
9、在一种可能的设计中,所述第二存储器设置为两个,分别为第三存储器和第四存储器;在消除阶段,基于计算顺序,将第一存储器中的第一目标子张量输入至第三存储器中;在扩展阶段,基于计算顺序,将第一存储器中的第二目标子张量输入至第四存储器中。
10、第二方面,本申请提供一种算力引擎构建装置,包括计算芯片和处理单元;所述计算芯片包括处理单元架构、第一存储器以及第二存储器,所述处理单元架构与所述第一存储器和所述第二存储器连接,所述处理单元架构包括至少两个处理单元阵列;所述处理单元与所述计算芯片连接,所述处理单元被配置为:将原始张量逐步分解为多个子张量;其中,各个子张量的秩满足设定要求;将所述多个子张量存储于所述第一存储器中;根据子张量的排序顺序以及各子张量之间的计算依赖关系,确定计算顺序;根据所述计算顺序,利用处理单元架构执行并行计算。
11、第三方面,本申请实施例提供一种电子设备,包括:至少一个处理器和存储器;所述存储器存储计算机执行指令;所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上第一方面以及第一方面各种可能的设计所述的算力引擎构建方法。
12、第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上第一方面以及第一方面各种可能的设计所述的算力引擎构建方法。
13、第五方面,本申请实施例提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时,实现如上第一方面以及第一方面各种可能的设计所述的算力引擎构建方法。
14、本申请提供的算力引擎构建方法、装置、设备和存储介质,通过提出新的张量核构建和计算排序机制,减少张量火车分解模型的计算冗余,从而显著提高计算效率。本申请能够在保持高压缩比的同时,实现更高的计算节省,充分利用张量火车分解带来的优势,显著提升整体加速器的性能。
本文档来自技高网...【技术保护点】
1.一种算力引擎构建方法,其特征在于,基于一种计算芯片,所述计算芯片包括处理单元架构、第一存储器以及第二存储器,所述处理单元架构与所述第一存储器和所述第二存储器连接,所述处理单元架构包括至少两个处理单元阵列;所述方法包括:
2.根据权利要求1所述的方法,其特征在于,将原始张量逐步分解为多个子张量,包括:
3.根据权利要求1所述的方法,其特征在于,根据所述计算顺序,利用处理单元阵列执行并行计算,包括:
4.根据权利要求3所述的方法,其特征在于,所述原始数据包括图像数据、视频数据、语音数据以及文本数据中的一种。
5.根据权利要求3所述的方法,其特征在于,在根据所述计算顺序,利用处理单元阵列执行并行计算的过程中,所述方法还包括:
6.根据权利要求3所述的方法,其特征在于,所述第二存储器设置为两个,分别为第三存储器和第四存储器;
7.一种算力引擎构建装置,其特征在于,包括计算芯片和处理单元;
8.一种电子设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;
9.一种计算机可读存储
10.一种计算机程序产品,其特征在于,包括计算机程序,该计算机程序被处理器执行时实现权利要求1-6中任一项所述的方法。
...【技术特征摘要】
1.一种算力引擎构建方法,其特征在于,基于一种计算芯片,所述计算芯片包括处理单元架构、第一存储器以及第二存储器,所述处理单元架构与所述第一存储器和所述第二存储器连接,所述处理单元架构包括至少两个处理单元阵列;所述方法包括:
2.根据权利要求1所述的方法,其特征在于,将原始张量逐步分解为多个子张量,包括:
3.根据权利要求1所述的方法,其特征在于,根据所述计算顺序,利用处理单元阵列执行并行计算,包括:
4.根据权利要求3所述的方法,其特征在于,所述原始数据包括图像数据、视频数据、语音数据以及文本数据中的一种。
5.根据权利要求3所述的方法,其特征在于,在根据所述计算顺序,利用处理单...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。