【技术实现步骤摘要】
数据处理装置、数据处理方法及相关产品
[0001]本披露一般地涉及处理器领域。更具体地,本披露涉及数据处理装置、数据处理方法、芯片和板卡。
技术介绍
[0002]近年来,随着深度学习的迅猛发展,使得计算机视觉、自然语言处理等一系列领域的算法性能都有了跨越式的进展。然而深度学习算法是一种计算密集型和存储密集型的工具,随着信息处理任务的日趋复杂,对算法实时性和准确性要求不断增高,神经网络往往会被设计得越来越深,使得其计算量和存储空间需求越来越大,导致现存的基于深度学习的人工智能技术难以直接应用在硬件资源受限的手机、卫星或嵌入式设备上。
[0003]因此,深度神经网络模型的压缩、加速、优化变得格外重要。大量的研究试着在不影响模型精度的前提下,减少神经网络的计算和存储需求,对深度学习技术在嵌入端、移动端的工程化应用具有十分重要的意义。稀疏化正是模型轻量化方法之一。
[0004]网络参数稀疏化是通过适当的方法减少较大网络中的冗余成分,以降低网络对计算量和存储空间的需求。现有的硬件和/或指令集不能有效地支持稀疏化处理以及与稀疏化处理后相关的操作。
技术实现思路
[0005]为了至少部分地解决
技术介绍
中提到的一个或多个技术问题,本披露的方案提供了一种数据处理装置、数据处理方法、芯片和板卡。
[0006]在第一方面中,本披露公开一种数据处理装置,包括:控制电路,其配置用于解析卷积指令,所述卷积指令包括稀疏标志位,用于指示是否执行结构化稀疏的卷积操作,并且所述卷积指令的至少一个操作数包括至少一个 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理装置,包括:控制电路,其配置用于解析卷积指令,所述卷积指令包括稀疏标志位,用于指示是否执行结构化稀疏的卷积操作,并且所述卷积指令的至少一个操作数包括至少一个描述符,所述描述符指示以下至少一项信息:张量数据的形状信息和张量数据的空间信息;张量接口电路,其配置用于对所述描述符进行解析;存储电路,其配置用于存储卷积前和/或卷积后的信息;以及运算电路,其配置用于基于解析的描述符,根据所述卷积指令执行相应的卷积操作。2.根据权利要求1所述的数据处理装置,其中,所述张量接口电路配置用于根据所述形状信息,确定与所述操作数对应的张量数据在数据存储空间中的数据地址;和/或所述张量接口电路配置用于根据所述空间信息,确定指令之间的依赖关系。3.根据权利要求1
‑
2任一所述的数据处理装置,其中所述张量数据的形状信息包括表示N维张量数据的形状的至少一个形状参数,N为正整数,所述张量数据的形状参数包括以下至少一种:所述张量数据所在的数据存储空间在N个维度方向的至少一个方向上的尺寸、所述张量数据的存储区域在N个维度方向的至少一个方向上的尺寸、所述存储区域在N个维度方向的至少一个方向上的偏移量、处于N个维度方向的对角位置的至少两个顶点相对于数据基准点的位置、所述张量数据的数据描述位置与数据地址之间的映射关系。4.根据权利要求1
‑
2任一所述的数据处理装置,其中所述张量数据的形状信息指示包括多个数据块的N维张量数据的形状的至少一个形状参数,N为正整数,所述形状参数包括以下至少一种:所述张量数据所在的数据存储空间在N个维度方向的至少一个方向上的尺寸、单个数据块的存储区域在N个维度方向的至少一个方向上的尺寸、所述数据块在N个维度方向的至少一个方向上的分块步长、N个维度方向的至少一个方向上的数据块数量、所述数据块在N个维度方向的至少一个方向上的整体步长。5.根据权利要求1
‑
4任一所述的数据处理装置,其中所述运算电路包括结构化稀疏电路和卷积电路,当所述稀疏标志位指示执行结构化稀疏的卷积操作时,所述结构化稀疏电路配置用于对至少一个输入数据执行结构化稀疏处理,并将稀疏化后的输入数据输出给所述卷积电路;并且所述卷积电路配置用于接收待卷积的数据,并对其执行卷积操作,其中所述待卷积的数据至少包括所述稀疏化后的输入数据。6.根据权利要求5所述的数据处理装置,其中所述结构化稀疏电路包括:第一结构化稀疏子电路,配置用于按照指定的稀疏掩码对输入数据执行结构化稀疏处理;和/或第二结构化稀疏子电路,配置用于按照预定的稀疏规则对输入数据执行结构化稀疏处理。7.根据权利要求6所述的数据处理装置,其中所述结构化稀疏电路进一步配置用于执行以下任一:利用第二结构化稀疏子电路对待卷积的第一输入数据和第二输入数据分别执行结构
化稀疏处理,并将稀疏化后的第一输入数据和第二输入数据输出给所述卷积电路以执行卷积操作;或者利用第一结构化稀疏子电路,将已结构化稀疏处理的第一或第二输入数据对应的索引部分作为稀疏掩码,对第二或第一输入数据执行结构化稀疏处理,并将稀疏化后的第一输入数据输出给所述卷积电路,以与所述已结构化稀疏处理的第二输入数据进行卷积操作,其中所述索引部分指示将要执行的结构化稀疏中有效数据元素的位置。8.根据权利要求7所述的数据处理装置,其中:所述已结构化稀疏处理的第一或第二输入数据是预先进行结构化稀疏处理并存储在所述存储电路中的,或者所述已结构化稀疏处理的第一或第二输入数据是在线利用所述第二结构化稀疏子电路进行结构化稀疏处理而生成的。9.根据权利要求7
‑
8任一所述的数据处理装置,其中所述已结构化稀疏处理的第一或第二输入数据为结构体形式,所述结构体包括相互绑定的数据部分和索引部分,所述数据部分包括已结构化稀疏处理后的有效数据元素,所述索引部分用于指示稀疏化后的数据在稀疏化前数据中的位置。10.根据权利要求6
‑
9任一所述的数据处理装置,其中所述结构化稀疏处理包括从每m个数据元素中选择n个数据元素作为有效数据元素,其中m>n。11.根据权利要求6
‑
10任一所述的数据处理装置,其中所述第二结构化稀疏子电路进一步包括:至少一个多级流水运算电路,其包括逐级布置的多个运算器并且配置成执行从m个数据元素中选择n个绝对值较大的数据元素作为有效数据元素的结构化稀疏处理。12.根据权利要求11所述的数据处理装置,其中所述多级流水运算电路包括四个流水级,其中:第一流水级包括m个求绝对值运算器,用于分别对待稀疏化的m个数据元素取绝对值,以生成m个绝对值;第二流水级包括排列组合电路,用于对所述m个绝对值进行排列组合,以生成m组数据,其中每组数据均包括所述m个绝对值并且所述m个绝对值在各组数据中的位置互不相同;第三流水级包括m路比较电路,用于对所述m组数据中的绝对值进行比较并生成比较结果;以及第四流水级包括筛选电路,用于根据所述比较结果选择n个绝对值较大的数据元素作为有效数据元素,以及输出所述有效数据元素及对应的索引,所述索引指示所述有效数据元素在所述m个数据元素中的位置。13.根据权利要求12所述的数据处理装置,其中所述第三流水级中每路比较电路包括m
‑
1个比较器,第i路比较电路中的m
‑
1个比较器用于将第i组数据中的一个绝对值与其他三个绝对值依次比较并生成比较结果,1≤i≤m。14.根据权利要求12
‑
13任一所述的数据处理装置,其中所述筛选电路进一步配置用于,当存在绝对值相同的数据元素时,按照指定的优先级顺序进行选择。15.根据权利要求5
‑
14任一所述的数据处理装置,其中所述运算电路还包括前处理电路,当所述稀疏标志位指示执行结构化稀疏的卷积操作时,所述前处理电路从所述存储电路中读取输入数据,并以第一速率向所述结构化稀疏电
路输出所述输入数据,其中所述第一速率至少部分基于所述卷积电路的处理能力和所述结构化稀疏处理的稀疏比例。16.根据权利要求5
‑
15任一所述的数据处理装置,其中所述输入数据包括神经网络的神经元数据和权值。17.根据权利要求1
‑
16任一所述的数据处理装置,其中所述卷积指令用于神经网络中的结构化稀疏的卷积操作,并且所述结构化稀疏针对所述神经网络中多维数据的至少一个维度执行。18.根据权利要求17所述的数据处理装置,其中:所...
【专利技术属性】
技术研发人员:ꢀ七四专利代理机构,
申请(专利权)人:中科寒武纪科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。