一种加速神经网络模型预测过程的处理器系统技术方案

技术编号：23051175 阅读：86 留言：0更新日期：2020-01-07 14:56

本发明专利技术提供一种加速神经网络模型预测过程的处理器系统，涉及神经网络算法领域和计算机硬件领域领域，所述神经网络模型预测过程包括卷积层、循环层和全连接层，所述处理器系统包括一第一处理单元和一三维非易失性存储器；所述三维非易失性存储器内部集成有一第二处理单元；所述第一处理单元用于处理保存在所述存储单元中的所述神经网络模型执行所述卷积层和所述循环层的命令时的相应数据；所述第二处理单元用于处理保存在所述三维非易失性存储器的存储阵列中的所述神经网络模型执行所述全连接层的命令时的相应数据。本发明专利技术有效提升神经网络模型预测过程的运行速度，充分利用了各处理器性能，避免系统资源浪费的同时降低能耗。

A processor system for accelerating the prediction process of neural network model

全部详细技术资料下载

【技术实现步骤摘要】
一种加速神经网络模型预测过程的处理器系统
本专利技术涉及神经网络算法领域和计算机硬件领域，尤其涉及一种加速神经网络模型预测过程的处理器系统。
技术介绍
神经网络目前被广泛应用于视频处理、图像处理、语音识别和优化计算等领域，神经网络由于自身结构中的可并行性和良好的性能，受到了广泛的关注，也在潜移默化地影响着人们的生活。神经网络运算过程中需要大量的数据，数据的存储和传输已经成为神经网络运算过程的技术壁垒。如何使得神经网络在运算过程中，庞大的数据的传输和存储能够高效地运行，减小神经网络运算过程中的内存限制，成为目前所要解决的一项关键的问题。深度神经网络的计算过程主要包括训练过程和预测过程两部分，但由于其具有计算密集性和数据密集性的特点，当面对大规模数据时，往往存在计算资源需求大、计算时间过长、功耗较大等微调。训练过程采用离线方式即可满足一般应用的需求，而预测过程需要在线进行，对实时性要求更高，因此加速其预测过程更具有实践意义和应用市场。并行化是加速神经网络的预测过程的主要技术手段，但如果数据访问能力不能进一步提高，就形成了瓶颈，导致片上并行部件利用率不高，造成了现有资源的浪费。
技术实现思路
针对现有技术中存在的问题，本专利技术提供一种加速神经网络模型预测过程的处理器系统，所述神经网络模型预测过程包括卷积层、循环层和全连接层，所述处理器系统包括一第一处理单元和一三维非易失性存储器；所述三维非易失性存储器内部集成有一第二处理单元；所述第一处理单元连接一存储单元，用于处理保存在所述存储单元中的所述神...

【技术保护点】
1.一种加速神经网络模型预测过程的处理器系统，所述神经网络模型预测过程包括卷积层、循环层和全连接层，其特征在于，所述处理器系统包括一第一处理单元和一三维非易失性存储器；/n所述三维非易失性存储器内部集成有一第二处理单元；/n所述第一处理单元连接一存储单元，用于处理保存在所述存储单元中的所述神经网络模型执行所述卷积层和所述循环层的命令时的相应数据；/n所述第二处理单元用于处理保存在所述三维非易失性存储器的存储阵列中的所述神经网络模型执行所述全连接层的命令时的相应数据。/n

【技术特征摘要】
1.一种加速神经网络模型预测过程的处理器系统，所述神经网络模型预测过程包括卷积层、循环层和全连接层，其特征在于，所述处理器系统包括一第一处理单元和一三维非易失性存储器；
所述三维非易失性存储器内部集成有一第二处理单元；
所述第一处理单元连接一存储单元，用于处理保存在所述存储单元中的所述神经网络模型执行所述卷积层和所述循环层的命令时的相应数据；
所述第二处理单元用于处理保存在所述三维非易失性存储器的存储阵列中的所述神经网络模型执行所述全连接层的命令时的相应数据。

2.根据权利要求1所述的处理器系统，其特征在于，所述第一处理单元具有直接访问所述存储单元的权限，以及
所述第二处理单元具有直接访问所述三维非易失性存储器的所述存储阵列的权限。

3.根据权利要求2所述的处理器系统，其特征在于，所述存储单元包括内存，和/或三维非易失性存储器。

4.根据权利要求2所述的处理器系...

【专利技术属性】
技术研发人员：景蔚亮，陈邦明，
申请(专利权)人：上海新储集成电路有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人