人工智能处理器及使用处理器执行平面旋转指令的方法技术

技术编号:19963879 阅读:35 留言:0更新日期:2019-01-03 12:38
本发明专利技术提供一种人工智能处理器及人工智能处理器执行平面旋转指令方法,所述处理器设置于计算装置内,所述计算装置用于神经网络运算指令,本申请提供的技术方案具有能耗低的优点。

Artificial Intelligence Processor and the Method of Using Processor to Execute Planar Rotation Instruction

The invention provides an artificial intelligence processor and an artificial intelligence processor to execute plane rotation instructions. The processor is arranged in a computing device, which is used for neural network operation instructions. The technical scheme provided in this application has the advantage of low energy consumption.

【技术实现步骤摘要】
人工智能处理器及使用处理器执行平面旋转指令的方法
本专利技术涉及通信
,具体涉及一种人工智能处理器及使用处理器执行平面旋转指令的方法。
技术介绍
现代的通用和专用处理器中,越来越多地引入计算指令(例如向量指令)进行运算。现有处理器在进行计算指令的运算时,开销大,能耗高。
技术实现思路
本专利技术实施例提供了一种人工智能处理器及使用处理器执行平面旋转指令的方法,可减少运算开销,降低的功耗优点。第一方面,本专利技术实施例提供一种人工智能处理器,所述处理器设置于计算装置内,所述计算装置用于执行平面旋转指令,执行所述平面旋转指令具体包括如下步骤:获取平面旋转指令,所述平面旋转指令包括:ROT,x,y,c,s;ROT为指令标识;所述x为向量x的首地址,y为向量y的首地址,C、S为标量;执行所述平面旋转指令得到平面旋转指令的具体结果;所述执行所述平面旋转指令得到平面旋转指令的具体结果具体包括:提取所述平面旋转指令向量x、向量y,标量C、S,依据该向量x、向量y,标量C、S执行平面旋转运算得到平面旋转运算的结果Xi和Yi。第二方面,提供一种人工智能处理器执行平面旋转指令的方法,所述方法应用于计算装置,所述方法包括如下步骤:获取平面旋转指令,所述平面旋转指令包括:ROT,x,y,c,s;ROT为指令标识;x为向量x的首地址,y为向量y的首地址,C、S为标量;执行所述平面旋转指令得到平面旋转指令的具体结果;所述执行所述平面旋转指令得到平面旋转指令的具体结果具体包括:提取所述平面旋转指令向量x、向量y,标量C、S,依据该向量x、向量y,标量C、S执行平面旋转运算得到平面旋转运算的结果Xi和Yi。第三方面,提供一种芯片,所述芯片包括第一方面提供的人工智能处理器。第四方面,提供一种板卡,所述板卡包括第三方面提供的芯片。第五方面,提供一种电子装置,所述电子装置包括第四方面提供的板卡;所述电子装置包括:数据处理装置、机器人、电脑、打印机、扫描仪、平板电脑、智能终端、手机、行车记录仪、导航仪、传感器、摄像头、云端服务器、相机、摄像机、投影仪、手表、耳机、移动存储、可穿戴设备交通工具、家用电器、和/或医疗设备。第六方面,提供一种平面旋转扩展指令的实现方法,所述方法包括如下步骤:计算装置获取平面旋转扩展指令,所述平面旋转扩展指令包括:ROTtype,n,x,incx,y,incy,c,s;ROT为指令标识,type为进行操作的数据类型;所述n为向量的长度,x为向量x的首地址,incx为向量x的元素之间的地址间隔,y为向量y的首地址,incy为向量y的元素之间的地址间隔,C、S为标量;计算装置解析所述平面旋转指令得到第一计算指令以及第二计算指令,依据第一计算指令以及第二计算指令确定计算顺序,按所述计算顺序执行第一计算指令以及第二计算指令得到该扩展计算指令的结果。可选的,所述方法具体包括:提取所述平面旋转扩展指令的向量x的值、向量y的值、C、S的值,依据下述公式计算平面旋转后的结果xi、yi;xi=c*x+s*yyi=c*y-s*x。可选的,所述计算顺序包括:无序计算、正序计算或倒序计算。可选的,所述计算装置依据所述第一计算指令以及第二计算指令确定第一计算指令与第二计算指令的计算顺序,包括:计算装置识别所述第一计算指令的输出数据与所述第二计算指令的输入数据是否相同,如相同,确定所述计算顺序为正序计算;计算装置识别第一计算指令的输入数据与第二计算指令的输出数据是否相同,如相同,确定计算顺序为倒序计算;计算装置识别第一计算指令的输入数据与第二计算指令的输出数据是否关联,如不关联,确定计算顺序为无序计算。可选的,所述扩展计算指令包括:操作码和操作域,所述操作码包括:识别第一计算指令的标识;所述操作域包括:第一计算指令的输入数据地址、第一计算指令的输出数据地址、第二计算指令的标识、第二计算指令的输入数据、数据类型以及数据长度N。可选的,所述扩展指令还包括:第三计算指令以及第三计算指令的输入数据。第七方面,提供一种计算装置,所述计算装置包括:存储介质、寄存器单元、运算单元和标量数据存储单元;其中,存储介质,用于存储向量;所述标量数据存储单元,用于存储标量C、S;所述运算单元,用于获取平面旋转扩展指令,所述平面旋转扩展指令包括:ROTtype,n,x,incx,y,incy,c,s;ROT为指令标识,type为进行操作的数据类型;所述n为向量的长度,x为向量x的首地址,incx为向量x的元素之间的地址间隔,y为向量y的首地址,incy为向量y的元素之间的地址间隔,C、S为标量;解析所述平面旋转指令得到第一计算指令以及第二计算指令,依据第一计算指令以及第二计算指令确定计算顺序,按所述计算顺序执行第一计算指令以及第二计算指令得到该扩展计算指令的结果。可选的,所述运算单元,具体用于提取所述平面旋转扩展指令的向量x的值、向量y的值、C、S的值,依据下述公式计算平面旋转后的结果xi、yi;xi=c*x+s*yyi=c*y-s*x。可选的,所述计算顺序包括:无序计算、正序计算或倒序计算。可选的,所述计算装置,用于识别所述第一计算指令的输出数据与所述第二计算指令的输入数据是否相同,如相同,确定所述计算顺序为正序计算;或识别第一计算指令的输入数据与第二计算指令的输出数据是否相同,如相同,确定计算顺序为倒序计算;或识别第一计算指令的输入数据与第二计算指令的输出数据是否关联,如不关联,确定计算顺序为无序计算。可选的,所述扩展计算指令包括:操作码和操作域,所述操作码包括:识别第一计算指令的标识;所述操作域包括:第一计算指令的输入数据地址、第一计算指令的输出数据地址、第二计算指令的标识、第二计算指令的输入数据、数据类型以及数据长度N。可选的,所述扩展指令还包括:第三计算指令以及第三计算指令的输入数据。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例。图1是本披露实施例提供的计算装置的结构示意图。图1A是本披露实施例提供的矩阵计算单元的结构示意图。图1B是本披露实施例提供的流水级的结构示意图。图1C是本披露实施例披露的一种矩阵计算方法的流程示意图。图1D是本披露实施例提供的正向和反向运算示意图。图1E是本披露实施例提供的指令集的格式示意图。图1F是本披露实施例提供的另一种计算装置的结构示意图。图2A是本披露实施例提供的一种计算装置的示意性框图。图2B是本披露实施例提供的一种扩展计算指令的实现方法的流程示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本披露具体实施方式提供一种矩阵计算方法,该矩阵计算方法在如图1所示的计算装置内完成,如图1所示,该计算装置包括:存储介质201、用于存储矩阵。优选的该存储介质可以是高速暂存存储器,能够支持不同长度的矩阵数据;本披露将必要的计算数据暂存在高速暂存存储器上(ScratchpadMemory),使本运算装置在进行本文档来自技高网...

【技术保护点】
1.一种人工智能处理器,其特征在于,所述人工智能处理器设置于计算装置内,所述计算装置用于执行平面旋转指令,执行所述平面旋转指令具体包括如下步骤:获取平面旋转指令,所述平面旋转指令包括:ROT x,y,c,s;ROT为指令标识;所述x为向量x的首地址,y为向量y的首地址,C、S为标量;执行所述平面旋转指令得到平面旋转指令的具体结果;所述执行所述平面旋转指令得到平面旋转指令的具体结果具体包括:提取所述平面旋转指令向量x、向量y,标量C、S,依据该向量x、向量y,标量C、S执行平面旋转运算得到平面旋转运算的结果Xi和Yi。

【技术特征摘要】
1.一种人工智能处理器,其特征在于,所述人工智能处理器设置于计算装置内,所述计算装置用于执行平面旋转指令,执行所述平面旋转指令具体包括如下步骤:获取平面旋转指令,所述平面旋转指令包括:ROTx,y,c,s;ROT为指令标识;所述x为向量x的首地址,y为向量y的首地址,C、S为标量;执行所述平面旋转指令得到平面旋转指令的具体结果;所述执行所述平面旋转指令得到平面旋转指令的具体结果具体包括:提取所述平面旋转指令向量x、向量y,标量C、S,依据该向量x、向量y,标量C、S执行平面旋转运算得到平面旋转运算的结果Xi和Yi。2.根据权利要求1所述的人工智能处理器,其特征在于,所述平面旋转指令还包括:type,incx,incy,其中,type为进行操作的数据类型,incx为向量x的元素之间的地址间隔,incy为向量y的元素之间的地址间隔;所述提取所述平面旋转指令向量x、向量y具体包括:以步长incx提取平面旋转向量x,以步长incy提取平面旋转向量y。3.根据权利要求1或2所述的人工智能处理器,其特征在于,所述平面旋转指令还包括n,所述n为向量长度,所述提取所述平面旋转指令向量x、向量y具体包括:提取向量长度为n的向量x以及向量y。4.根据权利要求2所述的人工智能处理器,其特征在于,所述数据类型包括实数或复数。5.根据权利要求1所述的人工智能处理器,其特征在于,所述计算装置还包括:存储器,所述存储器用于存储向量或标量。6.根据权利要求5所述的人工智能处理器,其特征在于,所述处理器,具体用于对该向量x和向量y执行第一流水级的计算得到第一结果,将第一结果输入到第二流水级执行第二流水级的计算得到第二结果,将第二结果存储至所述存储器。7.根据权利要求5或6所述人工智能处理器,其特征在于,所述存储器为高速暂存存储器。8.根据权利要求5或6所述人工智能处理器,其特征在于,所述处理器,用于向所述存储器发送读取向量x的读取命令以批量读取方式获取对应的向量x;向所述存储器发送读取向量y的读取命令以批量读取方式获取对应的向量y。9.一种人工智能处理器执行平面旋转指令的方法,其特征在于,所述方法应用于计算装置,所述方法包括如下步骤:获取平面旋转指令,所述平面旋转指令包括:ROT,x,y,c,s;ROT为指令标识;x为向量x的首地址,y为向量y的首地址,C、S为标量;执行所述平面旋转指令得到平面旋转指令的具体结果;所述执...

【专利技术属性】
技术研发人员:陈天石刘少礼王在胡帅
申请(专利权)人:上海寒武纪信息科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1