【技术实现步骤摘要】
神经网络运算装置和操作其的方法
[0001]本申请要求于2021年2月25日在韩国知识产权局提交的第10
‑
2021
‑
0025611号韩国专利申请和于2021年3月17日在韩国知识产权局提交的第10
‑
2021
‑
0034491号韩国专利申请的权益,所述韩国专利申请的全部公开出于所有目的通过引用包含于此。
[0002]下面的描述涉及神经网络运算装置和操作其的方法。
技术介绍
[0003]可基于计算架构来实现人工神经网络。随着人工神经网络的发展,正在更积极地进行研究以在各种类型的电子系统中使用人工神经网络来分析输入数据并提取有效信息。用于处理人工神经网络的装置可能需要针对复杂的输入数据的大量的计算或运算。因此,期望一种用于使用人工神经网络实时分析大量的输入数据并高效地处理与人工神经网络相关联的运算以提取期望信息的技术。
技术实现思路
[0004]提供本
技术实现思路
来以简化的形式介绍在以下具体实施方式中进一步描述的构思的选择。本
技术实现思路
不意在确认要求权利的主题的关键特征或必要特征,也不意在用于帮助确定要求权利的主题的范围。
[0005]在一个总体方面,一种神经网络运算装置包括:输入特征图缓冲器,被配置为存储输入特征图;权重缓冲器,被配置为存储权重;运算器,包括加法器树单元,加法器树单元被配置为以参考位长为单位在输入特征图与权重之间执行运算;以及控制器,被配置为将输入特征图和权重映射到运算器,以提供混合精度运算和数 ...
【技术保护点】
【技术特征摘要】
1.一种神经网络运算装置,包括:输入特征图缓冲器,被配置为存储输入特征图;权重缓冲器,被配置为存储权重;运算器,包括加法器树单元,加法器树单元被配置为以参考位长为单位在输入特征图与权重之间执行运算;以及控制器,被配置为将输入特征图和权重映射到运算器,以提供混合精度运算和数据并行度中的一者或两者。2.根据权利要求1所述的神经网络运算装置,其中,控制器被配置为:响应于输入特征图的位长是参考位长的一半,将要被映射到运算器的输入特征图的通道的数量加倍,以提供混合精度运算。3.根据权利要求1所述的神经网络运算装置,其中,控制器被配置为:响应于权重的位长是参考位长的一半,以由两个权重形成的组合为单位将权重映射到加法器树单元;以及响应于输入特征图的位长是参考位长的一半,以由两个输入特征图形成的组合为单位将输入特征图映射到加法器树单元。4.根据权利要求3所述的神经网络运算装置,其中,加法器树单元包括:乘法器部,包括乘法器,乘法器被配置为在输入特征图与权重之间执行乘法运算;加法器树,被配置为将乘法器部的输出相加;以及累加器,被配置为对加法器树的输出累加并求和。5.根据权利要求4所述的神经网络运算装置,其中,加法器树单元还包括:第一复用器,被配置为将包括在由两个输入特征图形成的组合中的相应输入特征图复用为各自具有参考位长的第一变换数据和第二变换数据,其中,乘法器部包括:第一乘法器,被配置为在第一变换数据与包括在由两个权重形成的组合中的第一权重之间执行乘法运算;以及第二乘法器,被配置为在第二变换数据与包括在由两个权重形成的组合中的第二权重之间执行乘法运算。6.根据权利要求5所述的神经网络运算装置,其中,加法器树单元还包括:移位器,被配置为对第一乘法器的输出进行移位;以及加法器,被配置为将移位器的输出与第二乘法器的输出相加。7.根据权利要求1所述的神经网络运算装置,其中,控制器被配置为:响应于输入特征图的位长是参考位长的两倍,将输入特征图和权重映射到运算器,使得输出特征图的通道的数量被减半,以提供混合精度运算。8.根据权利要求1所述的神经网络运算装置,其中,控制器被配置为:响应于权重的位长是参考位长的两倍,将两个加法器树单元一起分组为一个组合,并且将权重映射到由所述两个加法器树单元形成的所述一个组合。9.根据权利要求8所述的神经网络运算装置,其中,由所述两个加法器树单元形成的所述一个组合包括:第一加法器树单元;以及
第二加法器树单元,其中,控制器被配置为:将权重的第一部分映射到第一加法器树单元,并且将权重的第二部分映射到第二加法器树单元。10.根据权利要求1所述的神经网络运算装置,其中,控制器被配置为:响应于输入特征图的位长是参考位长的两倍,将两个加法器树单元一起分组为一个组合,并且将输入特征图映射到由所述两个加法器树单元形成的所述一个组合。11.根据权利要求10所述的神经网络运算装置,其中,由所述两个加法器树单元形成的所述一个组合包括:第一加法器树单元;以及第二加法器树单元,其中,控制器被配置为:在第一周期中将输入特征图的第一部分映射到由所述两个加法器树单元形成的所述一个组合,并且在第二周期中将输入特征图的第二部分映射到由所述两个加法器树单元形成的所述一个组合。12.根据权利要求1所述的神经网络运算装置,其中,加法器树单元包括第一加法器树单元,第一加法器树单元被配置为:在第一周期中在输入特征图的第一部分与权重的第一部分之间执行运算,并且在第二周期中在输入特征图的第二部分与权重的第一部分之间执行运算,以及加法器树单元还包括第二加法器树单元,第二加法器树单元被配置为:在第一周期中在输入特征图的第一部分与权重的第二部分之间执行运算,并且在第二周期中在输入特征图的第二部分与权重的第二部分之间执行运算。13.根据权利要求1至12中的任一项所述的神经网络运算装置,其中,加法器树单元包括多个加法器树单元,并且控制器被配置为:以权重并行度大小为单位将所述多个加法器树单元分组为多个加法器树单元组合,并且将相同的权重映射到包括在同一加法器树单元组合中的加法器树单元,以提供数据并行度。14.根据权利要求1至12中的任一项所述的神经网络运算装置,其中,加法器树单元包括多个加法器树单元,并且控制器被配置为:基于参考位长将权重映射到运算器,使得权重并行度大小与所...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。