存内计算芯片及系统技术方案

技术编号:38222641 阅读:8 留言:0更新日期:2023-07-25 17:54
本发明专利技术公开了一种存内计算芯片及系统,该存内计算芯片包括总线接口模块、缓存模块、数字控制模块、输入模块、数据处理模块和输出模块;总线接口模块接收外部数据,并将接收到的外部数据分类发送至缓存模块和输入模块;外部数据包括各类参数、控制信息和图片数据;缓存模块接收并缓存总线接口模块传送的各类参数和控制信息;以及将各类参数按需传送至数据处理模块;数字控制模块读取缓存模块中缓存的控制信息,并基于控制信息配置数据处理模块;输入模块接收并缓存总线接口模块传送的图片数据;数据处理模块在数字控制模块的控制下,基于缓存模块传送的各类参数对输入模块缓存的图片数据进行处理;输出模块将经数据处理模块处理后的图片数据输出。处理后的图片数据输出。处理后的图片数据输出。

【技术实现步骤摘要】
存内计算芯片及系统


[0001]本专利技术涉及人工智能
,尤其是涉及一种存内计算芯片及系统。

技术介绍

[0002]随着社会的发展,人工智能在多个领域中有了广泛的应用,而实现人工智能所需要用到的神经网络与深度学习算法,其较高的存储密度和计算密度对于传统的冯
·
诺依曼架构处理器来说,会使其产生功耗墙和存储墙等问题。存内计算通过将数据的存储与计算合二为一,极大程度上减小了在计算过程中因数据传输而产生的功耗,同时也减少了因数据搬移而浪费的时间,为即时性强、计算数据量大的人工智能神经网络的硬件实现提供了良好的解决办法。

技术实现思路

[0003]本专利技术旨在至少解决现有技术中存在的技术问题之一。
[0004]为此,本专利技术提出了一种存内计算芯片及系统,能够用较小的资源消耗量与时钟周期,完成人工智能目标分类任务的图像特征提取。
[0005]根据本申请的第一方面实施例,提供了一种存内计算芯片,包括:总线接口模块、缓存模块、数字控制模块、输入模块、数据处理模块和输出模块;所述总线接口模块,用于接收外部数据,并将接收到的所述外部数据分类发送至所述缓存模块和所述输入模块;所述外部数据包括各类参数、控制信息和图片数据;所述缓存模块,用于接收并缓存所述总线接口模块传送的各类参数和控制信息;以及将各类参数按需传送至所述数据处理模块;所述数字控制模块,用于读取所述缓存模块中缓存的控制信息,并基于控制信息配置所述数据处理模块;所述输入模块,用于接收并缓存所述总线接口模块传送的图片数据;所述数据处理模块,用于在所述数字控制模块的控制下,基于所述缓存模块传送的各类参数对所述输入模块缓存的图片数据进行处理;所述输出模块,用于将经所述数据处理模块处理后的图片数据输出。
[0006]根据本申请的一些实施例,所述缓存模块包括第一参数缓存单元和第二参数缓存单元;所述各类参数包括权重参数、还原优化参数、批归一化参数、残差相加参数和激活函数参数;所述第一参数缓存单元用于接收并缓存所述权重参数;所述第二参数缓存单元用于接收并缓存所述还原优化参数、批归一化参数、残差相加参数和激活函数参数和所述控制信息;以及将所述还原优化参数、批归一化参数、残差相加参数和激活函数参数按需传送至所述数据处理模块。
[0007]根据本申请的一些实施例,所述数据处理模块包括预处理子模块、卷积子模块和后处理子模块;所述预处理子模块,用于对所述输入模块缓存的图片数据在卷积前进行预处理;所述卷积子模块,用于对预处理后的图片数据进行卷积以获得卷积结果数据;所述后
处理子模块,用于对所述卷积结果数据进行后处理。
[0008]根据本申请的一些实施例,所述预处理子模块包括多路预处理单元,多路所述预处理单元并联连接;所述预处理单元包括数据填补子单元、数据整理子单元和数据拆分子单元;所述数据填补子单元,用于对所述输入模块缓存的图片数据在卷积前进行最外圈的补零操作;所述数据整理子单元,用于对补零操作后的图片数据按照预定规格的卷积核进行整理;所述数据拆分子单元,用于将整理后的图片数据进行拆分以适配所述卷积子模块的运算;以及,向所述卷积子模块发送卷积信号。
[0009]根据本申请的一些实施例,所述数据填补子单元内设置有一个FIFO缓存器,所述数据整理子单元内设置有多个所述FIFO缓存器,所述数据填补子单元中的所述FIFO缓存器和所述数据整理子单元中的多个所述FIFO缓存器配合完成卷积所需的多行图片数据的遍历。
[0010]根据本申请的一些实施例,所述后处理子模块包括模数转换单元和多路后处理单元,多路所述后处理单元并联连接;所述模数转换单元,用于对所述卷积结果数据进行模数转换;所述后处理单元,用于对模数转换后的卷积结果数据进行后处理。
[0011]根据本申请的一些实施例,所述后处理单元包括数据还原子单元、批归一化子单元、残差相加子单元和映射子单元;所述数据还原子单元,用于对转换后的所述卷积结果数据进行按位还原和修饰;所述批归一化子单元,用于对还原和修饰后的所述卷积结果数据进行一次函数操作;所述残差相加子单元,用于接收并缓存所述数据整理子单元传送的整理后的图片数据;以及,将缓存的整理后的图片数据与经过所述批归一化子单元处理后的所述卷积结果数据按正确顺序相加;所述映射子单元,用于对经残差相加子单元处理后的数据进行映射。
[0012]根据本申请的一些实施例,所述残差相加子单元还用于对所述数据整理子单元传送的整理后的图片数据进行降采样。
[0013]根据本申请的一些实施例,所述输入模块和所述输出模块均设置了总线接口数据传输模式和握手数据传输模式。
[0014]根据本申请的第一方面实施例提供的存内计算芯片,至少具有如下有益效果:总线接口模块接收外部数据,并将接收到的外部数据分类发送至缓存模块和输入模块;外部数据包括各类参数、控制信息和图片数据;缓存模块接收并缓存总线接口模块传送的各类参数和控制信息并将各类参数按需传送至数据处理模块;数字控制模块读取缓存模块中缓存的控制信息,并基于控制信息配置数据处理模块;输入模块接收并缓存总线接口模块传送的图片数据;数据处理模块在数字控制模块的控制下,基于缓存模块传送的各类参数对输入模块缓存的图片数据进行处理;输出模块将经数据处理模块处理后的图片数据输出。上述技术方案将芯片的内部数字模块化,每个数字模块的功能具有高度针对性,使得该存内计算芯片能够用较小的资源消耗量与时钟周期,来实现ResNet系列神经网络算法的运算;将能够完成ResNet系列神经网络算法的一个卷积层的全部逻辑电路封装到一块芯片内,可配置运行ResNet系列神经网络算法的任意一层,具有较高的灵活性,方便工业生产。
[0015]根据本申请的第二方面实施例,提供了一种存内计算系统,包括多个如上述所述的存内计算芯片;每个所述存内计算芯片的各类参数和控制信息通过各个所述存内计算芯片上的总线接口模块从外部接收;首个所述存内计算芯片的输入模块执行总线接口数据传
输模式,从外部获取图像数据;每两个所述存内计算芯片间的数据交互以握手数据传输模式通过各自的输入模块和输出模块来实现;末尾所述存内计算芯片的输出模块执行总线接口数据传输模式,将最终数据输出。
[0016]根据本申请的第二方面实施例提供的存内计算系统,至少具有如下有益效果:每两个芯片间采用“握手”方式通信,一方面避免了数据的不必要搬运和因较繁琐传输协议而造成的不必要的时间浪费,可以进一步加快图片数据的传输效率,进而满足神经网络运算所需的快捷性和时效性;另一方面避免了在芯片内对结果数据进行缓存,避免因数据缓存而额外占用芯片的内部空间,有利于减小芯片的面积。
[0017]本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在说明书以及附图中所特别指出的结构来实现和获得。
附图说明
[0018]本专利技术的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种存内计算芯片,其特征在于,包括:总线接口模块(10)、缓存模块(20)、数字控制模块(30)、输入模块(40)、数据处理模块(50)和输出模块(60);所述总线接口模块(10),用于接收外部数据,并将接收到的所述外部数据分类发送至所述缓存模块(20)和所述输入模块(40);所述外部数据包括各类参数、控制信息和图片数据;所述缓存模块(20),用于接收并缓存所述总线接口模块(10)传送的各类参数和控制信息;以及将各类参数按需传送至所述数据处理模块(50);所述数字控制模块(30),用于读取所述缓存模块(20)中缓存的控制信息,并基于控制信息配置所述数据处理模块(50);所述输入模块(40),用于接收并缓存所述总线接口模块(10)传送的图片数据;所述数据处理模块(50),用于在所述数字控制模块(30)的控制下,基于所述缓存模块(20)传送的各类参数对所述输入模块(40)缓存的图片数据进行处理;所述输出模块(60),用于将经所述数据处理模块(50)处理后的图片数据输出。2.根据权利要求1所述的存内计算芯片,其特征在于,所述缓存模块(20)包括第一参数缓存单元(21)和第二参数缓存单元(22);所述各类参数包括权重参数、还原优化参数、批归一化参数、残差相加参数和激活函数参数;所述第一参数缓存单元(21)用于接收并缓存所述权重参数;所述第二参数缓存单元(22)用于接收并缓存所述还原优化参数、批归一化参数、残差相加参数和激活函数参数和所述控制信息;以及将所述还原优化参数、批归一化参数、残差相加参数和激活函数参数按需传送至所述数据处理模块(50)。3.根据权利要求1所述的存内计算芯片,其特征在于,所述数据处理模块(50)包括预处理子模块(51)、卷积子模块(52)和后处理子模块(53);所述预处理子模块(51),用于对所述输入模块(40)缓存的图片数据在卷积前进行预处理;所述卷积子模块(52),用于对预处理后的图片数据进行卷积以获得卷积结果数据;所述后处理子模块(53),用于对所述卷积结果数据进行后处理。4.根据权利要求3所述的存内计算芯片,其特征在于,所述预处理子模块(51)包括多路预处理单元(511),多路所述预处理单元(511)并联连接;所述预处理单元(511)包括数据填补子单元(5111)、数据整理子单元(5112)和数据拆分子单元(5113);所述数据填补子单元(5111),用于对所述输入模块(40)缓存的图片数据在卷积前进行最外圈的补零操作;所述数据整理子单元(5112),用于对补零操作后的图片数据按照预定规格的...

【专利技术属性】
技术研发人员:任二祥刘向东卢北辰刘哲宇乔飞
申请(专利权)人:每刻深思智能科技北京有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1