加速装置、数据处理系统以及加速装置的操作方法制造方法及图纸

技术编号：32507022 阅读：34 留言：0更新日期：2022-03-02 10:30

本公开涉及一种加速装置，该加速装置包括加速器。加速器通过使用基于批次大小和序列大小中的至少一个来选择的计算方法并且通过根据所选择的计算方法控制第一输入数据和第二输入数据到处理元件阵列的输入路径来处理计算。该计算方法包括第一计算方法和第二计算方法，并且根据第一计算方法基于批次大小将第一输入数据和第二输入数据输入到处理元件阵列中，并且根据第二计算方法基于序列大小将第一输入数据输入到处理元件阵列中。输入数据输入到处理元件阵列中。输入数据输入到处理元件阵列中。

全部详细技术资料下载

【技术实现步骤摘要】
加速装置、数据处理系统以及加速装置的操作方法
[0001]相关申请的交叉引用
[0002]本专利文件要求于2020年8月27日提交的、申请号为10
‑
2020
‑
0108437的韩国申请的优先权和权益，其通过引用整体并入本文作为本专利文件公开的一部分。

[0003]本专利文件中公开的技术和实施方案总体涉及一种半导体装置。

技术介绍

[0004]人工智能(AI)加速器是一种被设计成对诸如人工神经网络的人工智能应用进行加速的硬件加速器或计算机系统。AI加速器可以加快与诸如多层感知器(MLP)、长短期记忆(LSTM)、卷积神经网络(CNN)的人工智能应用相关联的进程，同时减少主机资源的负担。
[0005]长短期记忆(LSTM)是一种在深度学习领域中使用的人工循环神经网络架构，并且可以通过在加速器中计算基于序列信息的输入数据以及当前单元的输出值来执行与LSTM操作相关联的计算。
[0006]由于上述计算的速度提高直接与加速器的性能有关，因此正在讨论包括加快加速器内的进程的新方式的各种技术。

技术实现思路

[0007]本专利文件中公开的技术可以在各个实施例中实施，以提供一种具有提高的计算输入数据的能力的加速装置、数据存储装置、数据处理系统以及加速装置的操作方法。
[0008]在实施例中，一种加速装置可以包括：加速器，与人工神经网络的处理元件阵列通信，并且被配置成通过使用基于批次大小和序列大小中的至少一个而选择的计算方法并且通过根据所选择...

【技术保护点】

【技术特征摘要】
1.一种加速装置，包括：加速器，与人工神经网络的处理元件阵列通信，并且通过使用基于批次大小和序列大小中的至少一个选择的计算方法并通过根据所选择的计算方法控制第一输入数据和第二输入数据到所述处理元件阵列的输入路径来执行计算，所述批次大小对应于所述处理元件阵列同时能够处理的数据的大小，所述序列大小对应于被顺序输入到所述处理元件阵列的数据的长度，其中所述计算方法包括第一计算方法和第二计算方法，并且根据所述第一计算方法基于所述批次大小将所述第一输入数据和所述第二输入数据输入到所述处理元件阵列中，并且根据所述第二计算方法基于所述序列大小将所述第一输入数据输入到所述处理元件阵列中。2.根据权利要求1所述的加速装置，其中所述加速器包括：所述处理元件阵列，包括多个处理元件，并且输出第一计算结果值、第二计算结果值和第三计算结果值，所述第一计算结果值是对所述第一输入数据和与所述第一输入数据的权重值相对应的第三输入数据进行计算的结果，并且所述第二计算结果值是对所述第二输入数据和与所述第二输入数据的权重值相对应的第四输入数据进行计算的结果；IO缓冲块，将所述第一输入数据和所述第二输入数据沿第一方向提供到所述处理元件阵列；权重缓冲块，将所述第三输入数据和所述第四输入数据沿第二方向提供到所述处理元件阵列；以及处理元件控制器，基于所述批次大小与批次参考值之间的比较、所述序列大小与序列参考值之间的比较或这些比较的组合中的至少一个，在所述第一计算方法与所述第二计算方法之间选择一个作为所述计算方法，并且选择将所述第一输入数据和所述第二输入数据输入到所述处理元件阵列的方法。3.根据权利要求2所述的加速装置，其中，在确定所述计算方法是所述第一计算方法时，所述处理元件控制器控制与所述批次大小相对应的所述第一输入数据或所述第二输入数据沿所述第一方向输入到所述处理元件阵列，并且其中，在确定所述计算方法是所述第二计算方法时，所述处理元件控制器控制与所述序列大小相对应的所述第一输入数据沿所述第一方向输入到所述处理元件阵列。4.根据权利要求2所述的加速装置，其中所述加速器进一步包括门缓冲块，对从所述处理元件阵列提供的所述第一计算结果值、所述第二计算结果值和所述第三计算结果值执行加法处理，并且存储相关的数据。5.根据权利要求4所述的加速装置，其中所述门缓冲块包括：多工器，选择包括所述第一计算结果值、所述第二计算结果值和所述第三计算结果值的数据输入；门控制器，控制所述数据输入；门缓冲器，存储从所述处理元件阵列提供的所述第一计算结果值、所述第二计算结果值或第三计算结果值以及对所述第一计算结果值、所述第二计算结果值和所述第三计算结果值进行加法处理的结果中的至少一个；加法器，对所述第一计算结果值、所述第二计算结果值和所述第三计算结果值执行加
法处理；以及门缓冲控制器，控制所述门缓冲块的全部操作。6.根据权利要求5所述的加速装置，其中所述多工器包括：第一多工器，将从所述处理元件阵列提供的所述第一计算结果值、所述第二计算结果值和所述第三计算结果值之中的至少一个或多个选择性地输入到所述加法器；以及第二多工器，将零或从所述门缓冲器反馈回的数据选择性地输入到所述加法器。7.根据权利要求5所述的加速装置，其中所述门缓冲块包括至少一个组，每个组包括所述多工器、所述门控制器、所述加法器和所述门缓冲器，并且其中所述至少一个组的数量与所述处理元件阵列内沿所述第二方向的所述处理元件的数量相对应。8.根据权利要求5所述的加速装置，其中所述门缓冲控制器根据相应序列将通过所述多工器提供的所述第一计算结果值和所述第二计算结果值分开存储在所述门缓冲器中。9.根据权利要求4所述的加速装置，其中所述加速器进一步包括：激励函数单元，对通过执行所述计算而获得的并且从所述门缓冲块提供的数据执行激励函数处理；以及特定函数单元，对通过执行所述激励函数处理而获得的数据执行除所述激励函数处理之外的特定计算，以获得当前单元的状态值和所述当前单元的输出值。10.根据权利要求9所述的加速装置，其中所述加速器进一步包括：状态缓冲块，存储从所述激励函数单元提供的所述当前单元的状态值和所述当前单元的输出值，并且提供所述当前单元的状态值和所述当前单元的输出值；以及数据传送单元，联接到所述IO缓冲块和所述状态缓冲块中的每一个，并且将从主机装置提供的数据传送到所述IO缓冲块，或者将从所述状态缓冲块提供的数据传送到所述主机装置。11.一种数据处理系统，包括：主机装置，基于批次大小与批次参考值之间的比...

【专利技术属性】
技术研发人员：南智勋，
申请(专利权)人：爱思开海力士有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人