机器学习处理器及使用处理器执行向量复制指令的方法技术

技术编号:19903011 阅读:36 留言:0更新日期:2018-12-26 02:47
本发明专利技术提供一种机器学习处理器及机器学习处理器执行向量复制指令方法,所述处理器设置于计算装置内,所述计算装置用于神经网络运算指令,本申请提供的技术方案具有能耗低的优点。

【技术实现步骤摘要】
机器学习处理器及使用处理器执行向量复制指令的方法
本专利技术涉及通信
,具体涉及一种机器学习处理器及使用处理器执行向量复制指令的方法。
技术介绍
现代的通用和专用处理器中,越来越多地引入计算指令(例如向量指令)进行运算。现有处理器在进行计算指令的运算时,开销大,能耗高。
技术实现思路
本专利技术实施例提供了一种机器学习处理器及使用处理器执行向量复制指令的方法,可减少运算开销,降低的功耗优点。第一方面,本专利技术实施例提供一种机器学习处理器,所述处理器设置于计算装置内,所述计算装置用于执行向量复制指令,执行所述向量复制指令具体包括如下步骤:获取向量复制指令,所述向量复制指令包括:COPYx,y;COPY为指令标识;所述x为向量x的首地址,y为向量y的首地址;执行所述向量复制指令得到向量复制指令的具体结果;所述执行所述向量复制指令得到向量复制指令的具体结果具体包括:提取所述向量复制指令向量x、将向量x复制到向量y得到向量复制结果。第二方面,提供一种机器学习处理器执行向量复制指令的方法,所述方法应用于计算装置,所述方法包括如下步骤:获取向量复制指令,所述向量复制指令包括:COPYx,y;COPY为指令标识;所述x为向量x的首地址,y为向量y的首地址;执行所述向量复制指令得到向量复制指令的具体结果;所述执行所述向量复制指令得到向量复制指令的具体结果具体包括:提取所述向量复制指令向量x、将向量x复制到向量y得到向量复制结果。第三方面,提供一种芯片,所述芯片包括第一方面提供的机器学习处理器。第四方面,提供一种板卡,所述板卡包括第三方面提供的芯片。第五方面,提供一种电子装置,所述电子装置包括第四方面提供的板卡;所述电子装置包括:数据处理装置、机器人、电脑、打印机、扫描仪、平板电脑、智能终端、手机、行车记录仪、导航仪、传感器、摄像头、云端服务器、相机、摄像机、投影仪、手表、耳机、移动存储、可穿戴设备交通工具、家用电器、和/或医疗设备。第六方面,提供一种向量复制扩展指令的实现方法,所述方法包括如下步骤:计算装置获取向量复制扩展指令,所述向量复制扩展指令包括:COPYtype,n,x,incx,y,incy;COPY为指令标识,type为进行操作的数据类型;所述n为向量的长度,x为向量x的首地址,incx为向量x的元素之间的地址间隔,y为向量y的首地址,incy为向量y的元素之间的地址间隔;计算装置解析所述向量复制指令得到第一计算指令以及第二计算指令,依据第一计算指令以及第二计算指令确定计算顺序,按所述计算顺序执行第一计算指令以及第二计算指令得到该扩展计算指令的结果。可选的,所述方法具体包括:提取所述向量复制扩展指令的向量x的值,将向量x的元素值复制至向量y。可选的,所述计算顺序包括:无序计算、正序计算或倒序计算。可选的,所述计算装置依据所述第一计算指令以及第二计算指令确定第一计算指令与第二计算指令的计算顺序,包括:计算装置识别所述第一计算指令的输出数据与所述第二计算指令的输入数据是否相同,如相同,确定所述计算顺序为正序计算;计算装置识别第一计算指令的输入数据与第二计算指令的输出数据是否相同,如相同,确定计算顺序为倒序计算;计算装置识别第一计算指令的输入数据与第二计算指令的输出数据是否关联,如不关联,确定计算顺序为无序计算。可选的,所述扩展计算指令包括:操作码和操作域,所述操作码包括:识别第一计算指令的标识;所述操作域包括:第一计算指令的输入数据地址、第一计算指令的输出数据地址、第二计算指令的标识、第二计算指令的输入数据、数据类型以及数据长度N。可选的,所述扩展指令还包括:第三计算指令以及第三计算指令的输入数据。第七方面,提供一种计算装置,所述计算装置包括:存储介质、寄存器单元、运算单元和标量数据存储单元;其中,存储介质,用于存储向量;所述运算单元,用于获取向量复制扩展指令,所述向量复制扩展指令包括:COPYtype,n,x,incx,y,incy;COPY为指令标识,type为进行操作的数据类型;所述n为向量的长度,x为向量x的首地址,incx为向量x的元素之间的地址间隔,y为向量y的首地址,incy为向量y的元素之间的地址间隔;计算装置解析所述向量复制指令得到第一计算指令以及第二计算指令,依据第一计算指令以及第二计算指令确定计算顺序,按所述计算顺序执行第一计算指令以及第二计算指令得到该扩展计算指令的结果。可选的,所述方法具体包括:提取所述向量复制扩展指令的向量x的值,将向量x的元素值复制至向量y。可选的,所述计算顺序包括:无序计算、正序计算或倒序计算。可选的,所述计算装置,用于识别所述第一计算指令的输出数据与所述第二计算指令的输入数据是否相同,如相同,确定所述计算顺序为正序计算;或识别第一计算指令的输入数据与第二计算指令的输出数据是否相同,如相同,确定计算顺序为倒序计算;或识别第一计算指令的输入数据与第二计算指令的输出数据是否关联,如不关联,确定计算顺序为无序计算。可选的,所述扩展计算指令包括:操作码和操作域,所述操作码包括:识别第一计算指令的标识;所述操作域包括:第一计算指令的输入数据地址、第一计算指令的输出数据地址、第二计算指令的标识、第二计算指令的输入数据、数据类型以及数据长度N。可选的,所述扩展指令还包括:第三计算指令以及第三计算指令的输入数据。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例。图1是本披露实施例提供的计算装置的结构示意图。图1A是本披露实施例提供的矩阵计算单元的结构示意图。图1B是本披露实施例提供的流水级的结构示意图。图1C是本披露实施例披露的一种矩阵计算方法的流程示意图。图1D是本披露实施例提供的正向和反向运算示意图。图1E是本披露实施例提供的指令集的格式示意图。图1F是本披露实施例提供的另一种计算装置的结构示意图。图2A是本披露实施例提供的一种计算装置的示意性框图。图2B是本披露实施例提供的一种扩展计算指令的实现方法的流程示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本披露具体实施方式提供一种矩阵计算方法,该矩阵计算方法在如图1所示的计算装置内完成,如图1所示,该计算装置包括:存储介质201、用于存储矩阵。优选的该存储介质可以是高速暂存存储器,能够支持不同长度的矩阵数据;本披露将必要的计算数据暂存在高速暂存存储器上(ScratchpadMemory),使本运算装置在进行矩阵运算过程中可以更加灵活有效地支持不同长度的数据。上述存储介质还可以为片外数据库、数据库或其他的能够存储的介质等等。寄存器单元202,用于存储标量数据,其中,该标量数据包括但不限于:矩阵数据在存储介质201的地址以及矩阵与标量运算时的标量。在一种实施方式中,寄存器单元可以是标量寄存器堆,提供运算过程中所需的标量寄存器,标量寄存器不只存放矩阵地址,还存放有标量数据。当涉及到矩阵与标量的运算时,运本文档来自技高网...

【技术保护点】
1.一种机器学习处理器,其特征在于,所述机器学习处理器设置于计算装置内,所述计算装置用于执行向量复制指令,执行所述向量复制指令具体包括如下步骤:获取向量复制指令,所述向量复制指令包括:COPY x,y;COPY为指令标识;所述x为向量x的首地址,y为向量y的首地址;执行所述向量复制指令得到向量复制指令的具体结果;所述执行所述向量复制指令得到向量复制指令的具体结果具体包括:提取所述向量复制指令向量x、将向量x复制到向量y得到向量复制结果。

【技术特征摘要】
1.一种机器学习处理器,其特征在于,所述机器学习处理器设置于计算装置内,所述计算装置用于执行向量复制指令,执行所述向量复制指令具体包括如下步骤:获取向量复制指令,所述向量复制指令包括:COPYx,y;COPY为指令标识;所述x为向量x的首地址,y为向量y的首地址;执行所述向量复制指令得到向量复制指令的具体结果;所述执行所述向量复制指令得到向量复制指令的具体结果具体包括:提取所述向量复制指令向量x、将向量x复制到向量y得到向量复制结果。2.根据权利要求1所述的机器学习处理器,其特征在于,所述向量复制指令还包括:type,incx,其中,type为进行操作的数据类型,incx为向量x的元素之间的地址间隔;所述提取所述向量复制指令向量x具体包括:以步长incx提取向量复制向量x。3.根据权利要求1或2所述的机器学习处理器,其特征在于,所述向量复制指令还包括n,所述n为向量长度;所述提取所述向量复制指令向量x具体包括:提取向量长度为n的向量x。4.根据权利要求2所述的机器学习处理器,其特征在于,所述操作的数据类型为实数或复数。5.根据权利要求1所述的机器学习处理器,其特征在于,所述计算装置还包括:存储器,所述存储器用于存储向量。6.根据权利要求5所述的处理器,其特征在于,所述计算装置还包括:存储器,所述存储器为高速暂存存储器。7.根据权利要求2所述机器学习处理器,其特征在于,所述向量复制指令还包括:incy,incy为向量y的元素之间的地址间隔;所述处理器,具体用于将所述运算的结果按所述incy的步长存入到所述存储器。8.根据权利要求5或6所述的机器学习处理器,其特征在于,所述处理器,用于向所述存储器发送读取向量x的读取命令以批量读取方式获取对应的向量x。9.一种机器学习处理器执行向量复制指令的方法,其特征在于,所述方法应用于计算装置,所述方法包括如下步骤:获取向量复制指令,所述向量复制指令包括:COPYx,y;COPY为指令标识;所述x为向量x的首地址,y为向量y的首地址;执行所述向量复制指令得到向量复制指令的具体...

【专利技术属性】
技术研发人员:陈天石刘少礼王在胡帅
申请(专利权)人:上海寒武纪信息科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1