数据处理方法和装置、芯片和电子设备制造方法及图纸

技术编号:14478430 阅读:70 留言:0更新日期:2017-01-25 11:07
本发明专利技术实施例公开了一种数据处理方法和装置、芯片和电子设备。其中,方法包括:在最大池化层进行反向处理时,获取输出神经元的梯度值及所述输出神经元预设的标识;根据总线上广播的信息与输出神经元预设的标识,获得卷积系数;将输出神经元的梯度值与所述卷积系数进行卷积处理,以获得输出神经元对应的输入神经元的梯度值。本发明专利技术实施例在卷积神经网络的训练过程中,不需要设置单独的电路来进行最大池化层的反向处理,结构简单,减小了整体电路的面积,成本低。

【技术实现步骤摘要】

本专利技术属于数据处理领域,特别是涉及一种数据处理方法和装置、芯片和电子设备
技术介绍
近年来,随着深度学习技术的飞速发展,深度学习技术中的代表性技术——卷积神经网络(ConvolutionalNeuralNetworks,CNN)在图像识别等模式识别领域得到了广泛地应用。最大池化层(MaxPooling)是卷积神经网络中最常见的一种下采样层,它是通过抽取若干在邻域中具有最大得分的特征值作为池化层的保留值,因此最大池化层能够保证网络模型位置与旋转的不变性,减少网络模型参数的数量,并且有利于减少网络模型的过拟合问题。目前,在卷积神经网络的训练过程中,对最大池化层进行反向处理都是采用单独的硬件电路来实现,电路结构非常复杂。
技术实现思路
本专利技术实施例要解决的一个技术问题是:提供一种数据处理方法和装置、芯片和电子设备。根据本专利技术实施例的一个方面,提供一种数据处理方法,包括:在最大池化层进行反向处理时,获取输出神经元的梯度值及所述输出神经元预设的标识;根据总线上广播的信息与输出神经元预设的标识,获得卷积系数;将输出神经元的梯度值与所述卷积系数进行卷积处理,以获得所述输出神经元对应的输入神经元的梯度值。在基于本专利技术上述方法的另一实施例中,所述获得卷积系数包括:检测总线上广播的信息与输出神经元预设的标识是否一致;若总线上广播的信息与输出神经元预设的标识一致,获得第一卷积系数;若总线上广播的信息与输出神经元预设的标识不一致,获得第二卷积系数。在基于本专利技术上述方法的另一实施例中,所述第一卷积系数的取值为1,所述第二卷积系数的取值为0。在基于本专利技术上述方法的另一实施例中,所述预设的标识与所述广播的信息均采用数字表示。在基于本专利技术上述方法的另一实施例中,所述预设的标识具体为在最大池化层进行前向处理时,获得所述输出神经元时设置的、与最大值在池化窗口中的位置相关的数字。在基于本专利技术上述方法的另一实施例中,所述广播的信息具体为与系统时钟相关的数字。在基于本专利技术上述方法的另一实施例中,在最大池化层进行反向处理时,分别在每一个系统时钟,开始执行所述获取输出神经元的梯度值及所述输出神经元预设的标识的操作,直至获得所述输出神经元对应的输入神经元的梯度值所述方法还包括:获得所述输出神经元对应的输入神经元的梯度值后,判断是否完成对所有输出神经元梯度值的累加;若完成对所有输出神经元梯度值的累加,将累加后的数据输出;若未完成对所有输出神经元梯度值的累加,在下一个系统时钟,开始执行所述获取输出神经元的梯度值及所述输出神经元预设的标识的操作。根据本专利技术实施例的另一个方面,提供一种数据处理装置,包括:获取单元,用于在最大池化层进行反向处理时,获取输出神经元的梯度值及所述输出神经元预设的标识;系数产生单元,用于根据总线上广播的信息与输出神经元预设的标识,获得卷积系数;卷积单元,用于将输出神经元的梯度值与所述卷积系数进行卷积处理,以获得所述输出神经元对应的输入神经元的梯度值。在基于本专利技术上述装置的另一实施例中,所述系数产生单元包括:检测模块,用于检测总线上广播的信息与输出神经元预设的标识是否一致;第一系数产生模块,用于根据所述检测模块的检测结果,响应于总线上广播的信息与输出神经元预设的标识一致,获得第一卷积系数;第二系数产生模块,用于根据所述检测模块的检测结果,响应于总线上广播的信息与输出神经元预设的标识不一致,获得第二卷积系数。在基于本专利技术上述装置的另一实施例中,所述第一卷积系数的取值为1,所述第二卷积系数的取值为0。在基于本专利技术上述装置的另一实施例中,所述预设的标识与所述广播的信息均以数字表示。在基于本专利技术上述装置的另一实施例中,所述预设的标识具体为在最大池化层进行前向处理时,获得所述输出神经元时设置的、与最大值在池化窗口中的位置相关的数字。在基于本专利技术上述装置的另一实施例中,所述广播的信息具体为与系统时钟相关的数字。在基于本专利技术上述装置的另一实施例中,在最大池化层进行反向处理时,分别在每一个系统时钟,所述获取单元开始执行所述获取输出神经元的梯度值及所述输出神经元预设的标识的操作,直至所述卷积单元获得所述输出神经元对应的输入神经元的梯度值;所述装置还包括:判断单元,用于获得所述输出神经元对应的输入神经元的梯度值后,判断是否完成对所有输出神经元梯度值的累加;输出单元,用于根据所述判断单元的判断结果,响应于完成对所有输出神经元梯度值的累加,将累加后的数据输出;所述获取单元,用于根据所述判断单元的判断结果,响应于未完成对所有输出神经元梯度值的累加,在下一个系统时钟,开始执行所述获取输出神经元的梯度值及所述输出神经元预设的标识的操作。根据本专利技术实施例的又一个方面,提供一种芯片,包括:上述任意一项所述的数据处理装置。在基于本专利技术上述芯片的另一实施例中,包括:专用集成电路ASIC、现场可编程门阵列FPGA、中央处理单元CPU或图形处理单元GPU。根据本专利技术实施例的再一个方面,提供一种电子设备,包括:上述的芯片。基于本专利技术实施例提供的数据处理方法和装置、芯片和电子设备,在最大池化层进行反向处理时,通过获取输出神经元的梯度值及所述输出神经元预设的标识;根据总线上广播的信息与输出神经元预设的标识,获得卷积系数;将输出神经元的梯度值与所述卷积系数进行卷积处理,获得与所述输出神经元对应的输入神经元的梯度值。本专利技术实施例在卷积神经网络的训练过程中,不需要设置单独的电路来进行最大池化层的反向处理,结构简单,减小了整体电路的面积,成本低。附图说明构成说明书的一部分的附图描述了本专利技术的实施例,并且连同描述一起用于解释本专利技术的原理。参照附图,根据下面的详细描述,可以更加清楚地理解本专利技术,其中:图1为本专利技术数据处理方法一个实施例的流程图。图2为本专利技术数据处理方法另一个实施例的流程图。图3为本专利技术数据处理方法又一个实施例的流程图。图4为本专利技术数据处理装置一个实施例的结构图。图5为本专利技术数据处理装置另一个实施例的结构图。图6为本专利技术数据处理装置又一个实施例的结构图。图7为本专利技术芯片一个实施例的局部结构示意图。具体实施方式现在将参照附图来详细描述本专利技术的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件的相对布置、数字表达式和数值不限制本专利技术的范围。同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本专利技术及其应用或使用的任何限制。对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。图1为本专利技术数据处理方法一个实施例的流程图。如图1所示,该实施例的数据处理方法,包括:102,在最大池化层进行反向处理时,获取输出神经元的梯度值及输出神经元预设的标识。具体实现中,在最大池化层进行前向处理时,获得输出神经元时,根据最大值在池化窗口中的位置,设置输出神经元预设的标识,输出神经元预设的标识反映了在最大池化层进行前向处理时输出神经元是从池化窗口中的什么位置选取的。1本文档来自技高网...
数据处理方法和装置、芯片和电子设备

【技术保护点】
一种数据处理方法,其特征在于,包括:在最大池化层进行反向处理时,获取输出神经元的梯度值及所述输出神经元预设的标识;根据总线上广播的信息与输出神经元预设的标识,获得卷积系数;将输出神经元的梯度值与所述卷积系数进行卷积处理,以获得所述输出神经元对应的输入神经元的梯度值。

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:在最大池化层进行反向处理时,获取输出神经元的梯度值及所述输出神经元预设的标识;根据总线上广播的信息与输出神经元预设的标识,获得卷积系数;将输出神经元的梯度值与所述卷积系数进行卷积处理,以获得所述输出神经元对应的输入神经元的梯度值。2.根据权利要求1所述的方法,其特征在于,所述获得卷积系数包括:检测总线上广播的信息与输出神经元预设的标识是否一致;若总线上广播的信息与输出神经元预设的标识一致,获得第一卷积系数;若总线上广播的信息与输出神经元预设的标识不一致,获得第二卷积系数。3.根据权利要求2所述的方法,其特征在于,所述第一卷积系数的取值为1,所述第二卷积系数的取值为0。4.根据权利要求1至3任意一项所述的方法,其特征在于,所述预设的标识与所述广播的信息均采用数字表示。5.根据权利要求4所述的方法,其特征在于,所述预设的标识具体为在最大池化层进行前向处理时,获得所述输出神经元时设置的、与最大值在池化窗口中的位置相关的数字。6.根据权利要求5所述的方法,其特征在于,所述广播的信息具体为与系统时钟相关的数字。7.根据权利要求6所述的方法,其特征在于,在最大池化层进行反向处理时,分别在每一个系统时钟,开始执行所述获取输出神经元的梯度值及所述输出神经元预设的标识的操作,直至获得所述输出神经元对应的输入神经元的梯度值;所述方法还包括:获得所述输出神经元对应的输入神经元的梯度值后,判断是否完成对所有输出神经元梯度值的累加;若完成对所有输出神经元梯度值的累加,将累加后的数据输出;若未完成对所有输出神经元梯度值的累加,在下一个系统时钟,开始执行所述获取输出神经元的梯度值及所述输出神经元预设的标识的操作。8.一种数据处理装置,其特征在于,包括:获取单元,用于在最大池化层进行反向处理时,获取输出神经元的梯度值及所述输出神经元预设的标识;系数产生单元,用于根据总线上广播的信息与输出神经元预设的标识,获得卷积系数;卷积单元,用于将输出神经元的梯度值与所述卷积系数进行卷积处理,以获得所述输出神经元对应的输入神经元...

【专利技术属性】
技术研发人员:张力
申请(专利权)人:北京比特大陆科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1