System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本公开涉及一种分散神经处理单元的峰值功率的技术。
技术介绍
1、人工智能(ai:artificial intelligence)正在逐步发展。ai是指人工模仿人类的智能,即,能够进行识别(recognition)、分类(classification)、推理(inference)、预测(predict)、操作/决策(control/decision making)等的智能。
2、此外,近年来为了加速用于人工智能(ai)的运算速度,正在开发神经处理单元(npu:neural processing unit)。
3、根据人工智能服务的目的,可以存在各种类型的人工神经网络(ann)模型。例如,在输入的数据是图像或影像的情况下,为了人工智能服务而可以使用用于图像/影像内的对象分类、对象检测、对象跟踪等的cnn类型的人工神经网络模型。
4、通常,人工神经网络模型在每个层中的运算量可以不同。
5、尤其,若运算量在特定层中显著增加,则功耗可能会瞬间增加。
技术实现思路
1、人工神经网络运算具有数据强度(intensive)的特性。尤其,人工神经网络运算需要并行处理运算。即,人工神经网络运算具有在不能同时快速地并行处理庞大的数据时会降低处理速度的特性。
2、由此,本公开的专利技术人开发了一种专用于人工神经网络运算的神经处理单元。本公开的专利技术人试图通过增加神经处理单元的多个处理元件的数量来提高神经处理单元的并行处理性能。此外,本公开的专利
3、另外,与在服务器或个人计算机(pc)中操作的图形处理装置(gpu)的电源供应部相比,设置于边缘设备(edge device)的专用于低功率操作的神经处理单元的电源供应部的电源供应能力可能相对较低。此外,设置于边缘设备的专用于低功率操作的神经处理单元的电源供应部的电容器的容量可能不足以应对瞬时的电源供应。
4、但是,本公开的专利技术人认识到,随着专用于低功率操作的神经处理单元的处理元件的数量增加,供应电压瞬时振荡的程度可能会增加。具体而言,所需的神经处理单元的瞬时电源供应量可以与操作的处理元件的数量成比例。
5、此外,人工神经网络模型的运算量在每个不同层中具有较大的偏差。因此,根据人工神经网络模型的层的运算量,并行操作的处理元件的数量可能会不同。即,在许多处理元件同时操作的情况下,神经处理单元的电源供应部的电压可能会瞬时振荡或降低。
6、此外,人工神经网络模型的特定层的运算量可能会非常小。在这种情况下,本公开的专利技术人认识到,即使增加神经处理单元的驱动频率,也能够保障神经处理单元的供应电压稳定性。
7、此外,在供应电压瞬时振荡或降低的情况下,为了系统安全性,还可能会发生需要提高供应电压vdd的情况。因此,如果不能确保系统安全性,则可能会发生供应电压不必要地升高的问题。在供应电压升高的情况下,可能会发生神经处理单元的功耗可能急剧增加的问题。此外,在功耗增加的情况下,可能会发生神经处理单元的发热增加的问题。在这种情况下,本公开的专利技术人认识到,可以通过降低神经处理单元的驱动频率来使神经处理单元的电源供应部的电压稳定。
8、与此相反,随着供应电压稳定,可以降低供应电压vdd。因此,只要确保神经处理单元的供应电压的安全性,就可以降低供应电压,其结果,可以降低神经处理单元的功耗。
9、由此,本公开的专利技术人认识到,即使通过增加处理元件的数量来增加峰值功率,也需要改善专用于人工神经网络运算的神经处理单元的供应电压的稳定性。
10、因此,本公开的示例旨在提供一种用于使由特定运算步骤中的过度功率引起的电源供应部的供应电压的抖动稳定的技术方案。
11、为了实现上述的目的,本公开的一示例提供了一种神经处理单元。所述神经处理单元可以包括:第一电路,被设定为能够执行用于人工神经网络(ann:artificial neuralnetwork)模型的运算,并为了包括多个处理元件(pe)的多个pe组而布置;以及第二电路,为了时钟分配器而布置,所述时钟分配器基于来自时钟源的原始时钟信号来分割生成相位彼此不同的多个时钟信号并提供给所述多个pe组。所述多个时钟信号中的第一时钟信号可以被提供给所述多个pe组中的第一pe组,所述多个时钟信号中的第二时钟信号可以被提供给所述多个pe组中的第二pe组。
12、本公开的一示例提供一种片上系统。所述片上系统可以包括:半导体(semi-conductor)基板;第一电路,被设定为能够执行用于人工神经网络(ann:artificialneural network)模型的运算,并为了包括多个处理元件(pe)的多个神经处理单元(npu)而布置在所述半导体基板上;以及第二电路,为了时钟分配器而布置在所述半导体基板上,所述时钟分配器基于来自时钟源的原始时钟信号来分割生成相位彼此不同的多个时钟信号并提供给所述多个npu。所述多个时钟信号中的第一时钟信号可以被提供给所述多个npu中的第一npu,所述多个时钟信号中的第二时钟信号可以被提供给所述多个npu中的第二npu。
13、本公开的一示例提供一种电子装置。所述电子装置可以包括:印刷电路基板;第一电路,被设定为能够执行用于人工神经网络(ann:artificial neural network)模型的运算,并为了包括多个处理元件(pe)的多个神经处理单元(npu)而布置在所述印刷电路基板上;以及第二电路,为了时钟分配器而布置在所述印刷电路基板上,所述时钟分配器基于来自时钟源的原始时钟信号来分割生成相位彼此不同的多个时钟信号并提供给所述多个npu。所述多个时钟信号中的第一时钟信号可以被提供给所述多个npu中的第一npu,所述多个时钟信号中的第二时钟信号可以被提供给所述多个npu中的第二npu。
14、根据本公开的示例,人工神经网络运算根据多个时钟信号来分散操作,因此具有能够降低特定运算步骤的峰值功率的效果。
15、根据本公开的示例,人工神经网络运算根据多个时钟信号来分散操作,因此具有能够改善供应到神经处理单元的供应电压的安全性的效果。
16、根据本公开的示例,即使人工神经网络运算量相同,也能够降低瞬时峰值功率,因此具有能够以相同的运算量为基准提供相对较低的峰值功率的效果。
本文档来自技高网...【技术保护点】
1.一种神经处理单元,包括:
2.根据权利要求1所述的神经处理单元,其中,
3.根据权利要求1所述的神经处理单元,其中,
4.根据权利要求1所述的神经处理单元,其中,
5.根据权利要求1所述的神经处理单元,其中,
6.根据权利要求1所述的神经处理单元,其中,
7.根据权利要求1所述的神经处理单元,其中,
8.根据权利要求1所述的神经处理单元,其中,
9.根据权利要求1所述的神经处理单元,其中,
10.一种片上系统,包括:
11.根据权利要求10所述的片上系统,其中,
12.根据权利要求10所述的片上系统,其中,
13.根据权利要求10所述的片上系统,其中,
14.根据权利要求10所述的片上系统,其中,
15.根据权利要求10所述的片上系统,其中,
16.一种电子装置,包括:
17.根据权利要求16所述的电子装置,其中,
18.根据权利要求16所述的电子装置,其中,
1
20.根据权利要求16所述的电子装置,其中,
...【技术特征摘要】
1.一种神经处理单元,包括:
2.根据权利要求1所述的神经处理单元,其中,
3.根据权利要求1所述的神经处理单元,其中,
4.根据权利要求1所述的神经处理单元,其中,
5.根据权利要求1所述的神经处理单元,其中,
6.根据权利要求1所述的神经处理单元,其中,
7.根据权利要求1所述的神经处理单元,其中,
8.根据权利要求1所述的神经处理单元,其中,
9.根据权利要求1所述的神经处理单元,其中,
10.一种片上系统,包括:
1...
【专利技术属性】
技术研发人员:金录元,李成真,宋珍根,
申请(专利权)人:蒂普爱可斯有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。