深度学习加速方法及器件、芯片、计算设备、存储介质技术

技术编号:31748643 阅读:15 留言:0更新日期:2022-01-05 16:29
本申请实施例公开了一种深度学习加速方法及器件、芯片、计算设备、存储介质,深度学习加速器包括:至少一个数据生成模块;至少一个数据消费模块;邮箱群组,包括多个邮箱模块;数据缓冲群组,包括多个数据缓冲区,邮箱群组中每个邮箱模块,与数据缓冲群组中一个数据缓冲区对应;其中,基于在深度学习加速器上执行的预设神经网络的网络结构确定的管理配置信息,邮箱群组被配置成:邮箱群组中的每个邮箱模块与对应的数据生成模块、数据消费模块和数据缓冲区分别连接;以及,数据缓冲群组中每个数据缓冲区,还与对应同一邮箱模块的数据生成模块和数据消费模块分别连接。和数据消费模块分别连接。和数据消费模块分别连接。

【技术实现步骤摘要】
深度学习加速方法及器件、芯片、计算设备、存储介质


[0001]本申请实施例涉及数据缓存
,尤其涉及一种深度学习加速方法及器件、芯片、计算设备、存储介质。

技术介绍

[0002]随着人工智能网络探索越来越深入,算法网络的结构也变得更加多样化,从算法层面来说,人工智能网络由多个计算节点构成,对于每个计算层,其输入来自于上一个计算层的输出结果,计算层包括卷积,池化,激活,尺寸缩放等运算。
[0003]目前,随着算法网络中各个算法层之间的数据交互更加复杂,基于现有的单一计算层之间的同步机制,构建深度学习加速器,布局较为复杂,配置的灵活性较差且效率较低。

技术实现思路

[0004]本申请实施例提供一种深度学习加速方法及器件、芯片、计算设备、存储介质。
[0005]本申请实施例的技术方案是这样实现的:
[0006]本申请实施例提供了一种深度学习加速器,包括:
[0007]至少一个数据生成模块;
[0008]至少一个数据消费模块;
[0009]邮箱群组,包括多个邮箱模块;
[0010]数据缓冲群组,包括多个数据缓冲区,所述邮箱群组中每个邮箱模块,与所述数据缓冲群组中一个数据缓冲区对应;
[0011]其中,基于在所述深度学习加速器上执行的预设神经网络的网络结构确定的管理配置信息,所述邮箱群组被配置成:
[0012]所述邮箱群组中的每个邮箱模块与对应的数据生成模块、数据消费模块和数据缓冲区分别连接,用于与对应的数据生成模块和数据消费模块,交互对应的数据缓冲区的相关信息;以及
[0013]所述数据缓冲群组中每个数据缓冲区,还与对应同一邮箱模块的数据生成模块和数据消费模块分别连接,支持对应同一邮箱模块的数据生成模块的数据写入操作,以及数据消费模块的数据读取操作。
[0014]在上述深度学习加速器中,还包括:数据总线;
[0015]所述邮箱群组、所述邮箱群组中每个邮箱模块对应的数据生成模块和数据消费模块、以及所述数据缓冲群组之间,均通过所述数据总线连接。
[0016]在上述深度学习加速器中,所述数据缓冲群组中每个数据缓冲区,通过所述数据总线,接收对应同一邮箱模块的数据生成模块传输的数据,并进行存储;
[0017]所述数据缓冲群组中每个数据缓冲区,通过所述数据总线,为对应同一邮箱模块的数据消费模块提供可读取的数据。
[0018]在上述深度学习加速器中,还包括:数据辅线;
[0019]所述邮箱群组、以及所述邮箱群组中,每个邮箱模块对应的数据生成模块和数据消费模块,分别与所述数据辅线连接。
[0020]在上述深度学习加速器中,所述邮箱群组中每个邮箱模块,通过所述数据总线,接收对应的数据生成模块发送的针对对应的数据缓冲区的写入通知信号,并响应于所述写入通知信号,通过所述数据辅线,将对应的数据缓冲区的数据占用状态信息发送至对应的数据生成模块。
[0021]在上述深度学习加速器中,所述邮箱群组中每个邮箱模块,通过所述数据总线,接收对应的数据消费模块发送的针对对应的数据缓冲区的读取通知信号,并响应于所述读取通知信号,通过所述数据辅线,将对应的数据缓冲区的存储数据量发送至对应的数据消费模块。
[0022]本申请实施例提供了一种深度学习加速方法,应用于深度学习加速器,所述深度学习加速器包括至少一个数据生成模块、至少一个数据消费模块、邮箱群组和数据缓冲群组,所述邮箱群组包括多个邮箱模块,所述数据缓冲群组包括多个数据缓冲区,所述邮箱群组中每个邮箱模块与所述数据缓冲群组中一个数据缓冲区对应,所述方法包括:
[0023]基于在所述深度学习加速器上执行的预设神经网络的网络结构确定的管理配置信息,将所述邮箱群组配置成:
[0024]所述邮箱群组中的每个邮箱模块与对应的数据生成模块、数据消费模块和数据缓冲区分别连接,用于与对应的数据生成模块和数据消费模块,交互对应的数据缓冲区的相关信息;以及
[0025]所述数据缓冲群组中每个数据缓冲区,还与对应同一邮箱模块的数据生成模块和数据消费模块分别连接,支持对应同一邮箱模块的数据生成模块的数据写入操作,以及数据消费模块的数据读取操作。
[0026]本申请实施例提供了一种芯片,包括上述深度学习加速器。
[0027]本申请实施例提供了一种计算设备,包括:处理器、存储器和通信总线;
[0028]所述通信总线,用于实现所述处理器与所述存储器之间的通信连接;
[0029]所述处理器,用于执行所述存储器中存储的一个或多个程序,以实现上述深度学习加速方法。
[0030]本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述深度学习加速方法。
[0031]本申请实施例提供了一种深度学习加速器,包括:至少一个数据生成模块;至少一个数据消费模块;邮箱群组,包括多个邮箱模块;数据缓冲群组,包括多个数据缓冲区,邮箱群组中每个邮箱模块,与数据缓冲群组中一个数据缓冲区对应;其中,基于在深度学习加速器上执行的预设神经网络的网络结构确定的管理配置信息,邮箱群组被配置成:邮箱群组中的每个邮箱模块与对应的数据生成模块、数据消费模块和数据缓冲区分别连接,用于与对应的数据生成模块和数据消费模块,交互对应的数据缓冲区的相关信息;以及,数据缓冲群组中每个数据缓冲区,还与对应同一邮箱模块的数据生成模块和数据消费模块分别连接,支持对应同一邮箱模块的数据生成模块的数据写入操作,以及数据消费模块的数据读取操作。本申请实施例提供的深度学习加速器,其中的模块对应关系及数量等信息,可以由
设定的管理配置信息确定,布局简单,器件数量较少,配置的灵活性和效率较高。
附图说明
[0032]图1为本申请实施例提供的一种深度学习加速器的结构示意图;
[0033]图2为本申请实施例提供的一种示例性的模块连接示意图;
[0034]图3为本申请实施例提供的一种示例性的硬件连接示意图;
[0035]图4为本申请实施例提供的一种深度学习加速方法的流程示意图;
[0036]图5为本申请实施例提供的一种芯片的结构示意图;
[0037]图6为本申请实施例提供的一种计算设备的结构示意图。
具体实施方式
[0038]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[0039]图1为本申请实施例提供的一种深度学习加速器的结构示意图。如图1所示,在本申请的实施例中,深度学习加速器1包括:
[0040]至少一个数据生成模块10;
[0041]至少一个数据消费模块11;
[0042]邮箱群组12,包括多个邮箱模块120;
[0043]数据缓冲群组13,包括多个数据缓冲区130,邮箱群组12中每个邮箱模块120,与数据缓冲群组13中一个本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种深度学习加速器,其特征在于,包括:至少一个数据生成模块;至少一个数据消费模块;邮箱群组,包括多个邮箱模块;数据缓冲群组,包括多个数据缓冲区,所述邮箱群组中每个邮箱模块,与所述数据缓冲群组中一个数据缓冲区对应;其中,基于在所述深度学习加速器上执行的预设神经网络的网络结构确定的管理配置信息,所述邮箱群组被配置成:所述邮箱群组中的每个邮箱模块与对应的数据生成模块、数据消费模块和数据缓冲区分别连接,用于与对应的数据生成模块和数据消费模块,交互对应的数据缓冲区的相关信息;以及所述数据缓冲群组中每个数据缓冲区,还与对应同一邮箱模块的数据生成模块和数据消费模块分别连接,支持对应同一邮箱模块的数据生成模块的数据写入操作,以及数据消费模块的数据读取操作。2.根据权利要求1所述的深度学习加速器,其特征在于,还包括:数据总线;所述邮箱群组、所述邮箱群组中每个邮箱模块对应的数据生成模块和数据消费模块、以及所述数据缓冲群组之间,均通过所述数据总线连接。3.根据权利要求2所述的深度学习加速器,其特征在于,所述数据缓冲群组中每个数据缓冲区,通过所述数据总线,接收对应同一邮箱模块的数据生成模块传输的数据,并进行存储;所述数据缓冲群组中每个数据缓冲区,通过所述数据总线,为对应同一邮箱模块的数据消费模块提供可读取的数据。4.根据权利要求2所述的深度学习加速器,其特征在于,还包括:数据辅线;所述邮箱群组、以及所述邮箱群组中,每个邮箱模块对应的数据生成模块和数据消费模块,分别与所述数据辅线连接。5.根据权利要求4所述的深度学习加速器,其特征在于,所述邮箱群组中每个邮箱模块,通过所述数据总线,接收对应的数据生成模块发送的针对对应的数据缓冲区的写入通知信号,并响应于所述写入通知信号,通过所述数据辅线,将对应的数据缓冲区的...

【专利技术属性】
技术研发人员:孙炜祝叶华
申请(专利权)人:OPPO广东移动通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1