【技术实现步骤摘要】
一种处理器、可变精度的卷积网络计算方法和计算设备
[0001]本说明书中实施方式关于机器学习
,具体地说,涉及机器学习
下的基于指令集的加速技术,更具体地说,涉及一种处理器、可变精度的卷积网络计算方法和计算设备。
技术介绍
[0002]卷积神经网络(Convolutional Neural Networks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks),是深度学习(Deep Learning)的代表算法之一,在一些情况下,卷积神经网络也可称为卷积网络。卷积神经网络具有表征学习(Representation Learning)能力,能够按其层级结构对输入信息进行平移不变分类(Shift
‑
Invariant Classification),因此也被称为“平移不变人工神经网络(Shift
‑
Invariant Artificial Neural Networks,SIANN)。卷积神经网络在图像识别、语音检测、自然语言处理等研究方向表现出色,取得了高精度的结果。
[0003]然而随着卷积神经网络的发展,卷积神经网络的应用范围不断扩展,有必要提高处理器对不同卷积神经网络计算的适用性,以使处理器可以满足不同应用场景下的神经网络计算需求。
技术实现思路
[0004]本说明书中多个实施方式提供一种处理器、可变精度的卷积网络计算方法和计算设备,以实现提高卷积神经网络的适用性的目的。
[ ...
【技术保护点】
【技术特征摘要】
1.一种处理器,其特征在于,包括:访存单元和卷积网络计算模块;其中,所述访存单元,用于存储待运算数据;所述卷积网络计算模块,用于根据卷积网络指令,从所述访存单元中获取目标精度的待运算数据,并对获取的目标精度的待运算数据进行卷积网络计算,所述卷积网络计算包括卷积、池化和激活计算中的至少一项;所述卷积网络指令包括精度参数,所述目标精度与所述精度参数相对应。2.根据权利要求1所述的处理器,其特征在于,所述卷积网络指令包括计算指令和访存指令,所述访存指令包括所述精度参数;所述卷积网络计算模块具体用于,根据所述访存指令,从所述访存单元中获取目标精度的待运算数据,根据所述计算指令对获取的目标精度的待运算数据进行卷积网络计算。3.根据权利要求2所述的处理器,其特征在于,所述计算指令包括卷积指令、池化指令和激活指令中的至少一项,所述访存指令包括直接向量载入指令和精度载入指令,所述精度载入指令包括所述精度参数;所述卷积网络计算模块包括:向量访存单元、向量寄存器堆和计算单元;其中,所述向量访存单元包括多个第一寄存器,所述向量寄存器堆包括多个第二寄存器和多个与所述第二寄存器一一对应的第三寄存器;所述向量访存单元用于根据所述精度载入指令,从所述访存单元中获取目标精度的待运算数据,并将获取的所述待运算数据和所述待运算数据的目标精度写入所述第一寄存器中;所述向量访存单元还用于根据所述直接向量载入指令,从与所述直接向量载入指令对应的第一寄存器中读取待运算数据的目标精度,并根据读取的目标精度向访存单元请求所述待运算数据,将所述访存单元返回的待运算数据拼接为数据向量存储到所述第二寄存器中,并将所述数据向量中各所述待运算数据的目标精度写入与所述第二寄存器对应的第三寄存器中;所述向量寄存器堆,用于将所述第二寄存器存储的数据向量和所述第三寄存器存储的目标精度传输给所述计算单元;所述计算单元,用于根据所述计算指令和所述数据向量中各所述待运算数据的目标精度,对所述数据向量进行卷积、池化或激活计算。4.根据权利要求3所述的处理器,其特征在于,所述多个第二寄存器划分为第一寄存器组和第二寄存器组,所述第一寄存器组和所述第二寄存器组均包括K个寄存器小组,所述寄存器小组由K个所述第二寄存器构成;K为所述处理器支持的最大窗口大小;所述寄存器小组对应所述处理器支持的最大窗口的一行。5.根据权利要求4所述的处理器,其特征在于,所述访存指令还包括:部分向量载入指令;所述向量访存单元,还用于根据所述部分向量载入指令,从与所述部分向量载入指令对应的第一寄存器中,读取最新进入所述卷积窗口的一列待运算数据和所述待运算数据的目标精度,将读取的一列待运算数据与所述卷积窗口的其他列待运算数据拼接为数据向量存储到所述第二寄存器中,并将所述数据向量中各所述待运算数据的目标精度写入与所述第二寄存器对应的第三寄存器中。6.根据权利要求3所述的处理器,其特征在于,...
【专利技术属性】
技术研发人员:薛盛可,鲁路,李颖敏,
申请(专利权)人:阿里巴巴中国有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。