System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 用于实施卷积神经网络加速器上的层的方法和装置制造方法及图纸_技高网

用于实施卷积神经网络加速器上的层的方法和装置制造方法及图纸

技术编号:40140818 阅读:26 留言:0更新日期:2024-01-23 23:35
提供用于实施卷积神经网络加速器上的层的方法和装置。用于在目标上实施卷积神经网络(CNN)加速器的方法包括利用一个或者多个处理元件实施标准卷积层。修改CNN加速器的配置以改变CNN加速器上的部件之间的数据流。响应于数据流的改变,利用一个或者多个处理元件实施完全连接层。

【技术实现步骤摘要】

本专利技术的实施例涉及用于设计目标设备上的系统的工具。更具体地,本专利技术的实施例涉及用于实施卷积神经网络加速器上的层的方法和装置


技术介绍

1、由于图像和视频在因特网上已经变得越来越普遍,产生了对有能力针对包括搜索和概括在内的各种应用高效地分析其语义内容的算法的需要。卷积神经网络(cnn)已经显示出是用于执行图像识别、检测、以及检索的有效工具。cnn可以被扩大规模并且被配置为支持学习过程所需要的大标记(large labeled)数据集。在这些条件下,发现cnn在学习复杂并且鲁棒的图像特征方面是成功的。

2、cnn是前馈人工神经网络的类型的,其中单独的神经元以如下方式拼接,使得它们响应于视场中的重叠区域。cnn是受到了生物体内的视神经的行为的启发。cnn使用多层神经元连接来处理数据,以在图像识别中实现高准确度。多层cnn的发展导致了复杂识别任务(诸如大类别图像分类、自动语音识别、以及其它数据分类/识别任务)的准确度的改善。

3、单个处理器的计算功率上的限制导致了对其它计算配置的探索,以满足对于支持cnn的需要。在这些探索领域中,对cnn加速器进行了研究,其利用图形处理单元上的通用计算(gpgpu)、多核处理器、现场可编程门阵列(fpga)、以及专用集成电路(asic)形式的硬件专用性。


技术实现思路

1、根据本专利技术的实施例,公开了用于设计和实施卷积神经网络(cnn)加速器的方法。该方法利用电子设计自动化(eda)工具,eda工具响应于cnn加速器的特征(其可以包括由用户指定的cnn加速器的特性和参数)和由用户选择的目标上的可用资源,来生成用于cnn加速器的设计。目标可以包括一个或者多个类型的一个或者多个目标设备。eda工具分配用于实施cnn加速器的目标上的资源以实现高性能。例如,分配目标上的资源以实施尺寸适当的缓冲器以处理要由cnn加速器处理的图像的类型和尺寸。还分配目标上的资源以实施适当类型和数目的计算单元(诸如处理元件)以支持由cnn加速器应用的过滤器和层的类型。eda工具还生成定序单元,该定序单元被编程为将数据的传输协调到适当的计算单元以便时分复用计算单元上的计算。

2、根据本专利技术的实施例,某一范围的特性可以由用户指定,以允许cnn加速器执行多个cnn算法。在这一实施例中,实施一个或者多个可配置状态寄存器(csr),以便在cnn加速器在目标上被编程之后,允许用户在运行时对目标进行配置以支持用于执行多个cnn算法中的一个cnn算法所需要的指定特性。当在现场可编程门阵列(fpga)上实施时,csr有效地允许对cnn加速器的运行时配置。这便于以cnn应用为目的的fpga覆盖。

3、根据本专利技术的实施例,用于在目标上实施cnn加速器的方法包括标识要在cnn加速器上执行的cnn算法。标识支持cnn算法的执行的cnn加速器的变化。cnn的变化可以包括特定数目或者类型的卷积层、池化层、过滤器尺寸、和/或过滤器系数。目标设备上的csr可以被设置为支持期望的变化。当期望在目标设备上执行不同cnn算法时,可以标识支持不同cnn算法的cnn加速器的不同变化。目标设备上的csr可以被设置为支持cnn加速器的不同变化。

4、根据本专利技术的实施例,用于在目标上实施cnn加速器的方法包括利用一个或者多个处理元件实施标准卷积层。修改cnn加速器的配置以改变cnn加速器上的部件之间的数据流。响应于数据流的改变,利用该一个或者多个处理元件实施完全连接层。

5、根据本专利技术的实施例,在目标上实施的cnn加速器包括定序单元,该定序单元在第一配置期间协调目标上的部件之间的第一数据流并且在第二配置期间协调目标上的部件之间的第二数据流。cnn加速器还包括多个处理元件,该多个处理元件在第一配置期间实施标准卷积层,并且在第二配置期间实施完全连接层。

本文档来自技高网...

【技术保护点】

1.一种用于在目标上实施卷积神经网络(CNN)加速器的方法,包括:

2.根据权利要求1所述的方法,其中修改所述CNN加速器的所述配置包括:

3.根据权利要求2所述的方法,进一步包括:

4.根据权利要求1所述的方法,进一步包括设置用于实施所述标准卷积层的所述CNN加速器的初始配置,包括:

5.根据权利要求4所述的方法,进一步包括:

6.根据权利要求1所述的方法,其中所述修改在所述CNN加速器的运行时间期间由驻留在所述CNN加速器上的定序单元来执行。

7.根据权利要求1所述的方法,其中所述一个或者多个处理元件在某一时间实例下实施所述标准卷积层或者所述完全连接层。

8.根据权利要求1所述的方法,其中所述一个或者多个处理元件中的每个处理元件包括:

9.根据权利要求1所述的方法,其中所述标准卷积层生成输出特征图,所述输出特征图包括作为来自输入特征图的数据的不同集合与固定系数数据的集合的乘积的和的输出。

10.根据权利要求1所述的方法,其中所述完全连接层生成输出特征图,所述输出特征图包括作为来自输入特征图的数据的固定集合与系数数据的不同集合的乘积的和的输出。

11.一种在目标上实施的卷积神经网络(CNN)加速器,包括:

12.根据权利要求11所述的CNN加速器,其中所述多个处理元件中的每个处理元件包括:

13.根据权利要求11所述的CNN加速器,其中所述多个处理元件在某一时间实例下实施所述标准卷积层或者所述完全连接层。

14.根据权利要求11所述的CNN加速器,其中所述第一数据流包括:

15.根据权利要求14所述的CNN加速器,进一步包括:

16.根据权利要求11所述的CNN加速器,其中所述第二数据流包括:

17.根据权利要求16所述的CNN加速器,进一步包括:

18.一种非瞬态计算机可读介质,包括存储在其上的指令序列,所述指令序列用于使得计算机执行用于在目标上实施卷积神经网络(CNN)加速器的方法,所述方法包括:

19.根据权利要求18所述的非瞬态计算机可读介质,其中修改所述CNN加速器的所述配置包括:

20.根据权利要求11所述的非瞬态计算机可读介质,其中所述一个或者多个处理元件在某一时间实例下实施所述标准卷积层或者所述完全连接层。

...

【技术特征摘要】

1.一种用于在目标上实施卷积神经网络(cnn)加速器的方法,包括:

2.根据权利要求1所述的方法,其中修改所述cnn加速器的所述配置包括:

3.根据权利要求2所述的方法,进一步包括:

4.根据权利要求1所述的方法,进一步包括设置用于实施所述标准卷积层的所述cnn加速器的初始配置,包括:

5.根据权利要求4所述的方法,进一步包括:

6.根据权利要求1所述的方法,其中所述修改在所述cnn加速器的运行时间期间由驻留在所述cnn加速器上的定序单元来执行。

7.根据权利要求1所述的方法,其中所述一个或者多个处理元件在某一时间实例下实施所述标准卷积层或者所述完全连接层。

8.根据权利要求1所述的方法,其中所述一个或者多个处理元件中的每个处理元件包括:

9.根据权利要求1所述的方法,其中所述标准卷积层生成输出特征图,所述输出特征图包括作为来自输入特征图的数据的不同集合与固定系数数据的集合的乘积的和的输出。

10.根据权利要求1所述的方法,其中所述完全连接层生成输出特征图,所述输出特征图包括作为来自输入特征图的数据的固定集合与系数数据的...

【专利技术属性】
技术研发人员:U·艾多纳特G·R·赵A·C·凌
申请(专利权)人:阿尔特拉公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1