一种在NPU中减少资源占用的方法、系统、设备及存储介质技术方案

技术编号:37594280 阅读:15 留言:0更新日期:2023-05-18 11:38
本发明专利技术涉及深度学习技术领域,尤其涉及一种在NPU中减少资源占用的方法、系统、设备及存储介质,其方法包括获取待处理信息,对待处理信息进行预处理和初步特征提取,生成与所述初步特征对应的特征矩阵;并按预设的计算顺序进行排序,得到含有特定排列顺序的排序矩阵组;对排序矩阵组的所有特征矩阵进行筛选,生成基础矩阵组后发送至神经网络处理器的缓存单元内;对排序矩阵组的所有特征矩阵进行定位,生成只含有每个特征矩阵位置信息的定位信息,将定位信息发送至神经网络处理器进行解析,根据解析后的定位信息从缓存单元调取基础矩阵组中相应的特征矩阵进行关联计算。本发明专利技术能够减小计算资源的占用,提高了计算的速度。提高了计算的速度。提高了计算的速度。

【技术实现步骤摘要】
一种在NPU中减少资源占用的方法、系统、设备及存储介质


[0001]本专利技术涉及深度学习
,尤其涉及一种在NPU中减少资源占用的方法、系统、设备及存储介质。

技术介绍

[0002]深度学习模型中费时的算子往往是卷积操作,而卷积的本质是矩阵的乘加计算,所以通过NPU(嵌入式神经网络处理器)加速矩阵的乘加运算就能达到加速深度学习训练与推理的目标;但对于NPU,特别是针对图像卷积来说,其主要是加速的卷积这一操作,而卷积在进行过程中由于对计算资源占用较多,使得计算速度较慢,由此需要一种在NPU中减少计算资源占用的方法及系统。

技术实现思路

[0003]本专利技术的目的在于提出一种在NPU中减少资源占用的方法、系统、设备及存储介质,能够减小计算资源的占用,提高了计算的速度。
[0004]为达此目的,本专利技术采用以下技术方案:一种在NPU中减少资源占用的方法,包括以下步骤:S1、获取待处理信息,对待处理信息进行预处理,其中所述待处理信息包括图像或视频信息;S2、对预处理后的信息进行初步特征提取,生成与所述初步特征对应的特征矩阵;S3、将所有特征矩阵按预设的计算顺序进行排序,得到含有特定排列顺序的排序矩阵组;S4、对排序矩阵组的所有特征矩阵进行筛选,生成基础矩阵组,将基础矩阵组发送至神经网络处理器的缓存单元内;S5、对排序矩阵组的所有特征矩阵进行定位,生成只含有每个特征矩阵位置信息的定位信息,将定位信息发送至神经网络处理器;S6、神经网络处理器对定位信息进行解析,根据解析后的定位信息从缓存单元调取基础矩阵组中相应的特征矩阵进行关联计算。
[0005]优选的,在S1中,所述对待处理信息进行预处理,具体包括以下步骤:S11、判断待处理信息为图像或视频信息,如果待处理信息为图像信息,则执行S12,如果待处理信息为视频信息,则执行S13;S12、将图像信息的格式转换为RMVB格式;S13、对视频信息进行关键帧提取,获取关键帧图像,再将关键帧图像的格式转换为RMVB格式。
[0006]优选的,在S2中,所述对预处理后的信息进行初步特征提取,生成与所述初步特征对应的特征矩阵,具体包括以下步骤:S21、将预处理后得到的图像进行颜色通道分离,分离为红色通道图像、绿色通道
图像和蓝色通道图像;S22、将分离后的图像通过HOG图像特征提取算法进行初步特征提取,获得带有初步特征的图像;S23、将带有初步特征的图像导入预设的特征转换模型,生成与所述初步特征对应的特征矩阵。
[0007]优选的,在S22中,所述HOG图像特征提取算法具体包括以下步骤:S221、将分离后的图像进行灰度化、Gamma矫正、重叠快归一化和分割处理;S222、对分割后的图像计算每个像素点的梯度方向和梯度幅值,再根据每个像素点的梯度方向和梯度幅值计算并形成方向梯度直方图;S223、利用梯度算子的核,对方向梯度直方图进行卷积,提取出HOG特征,再将提取出的HOG特征首位相连,组成初步特征。
[0008]优选的,在S4中,所述对排序矩阵组的所有特征矩阵进行筛选,具体包括以下步骤:将相同的特征矩阵保留其中一个,生成一个特征矩阵相互之间均不相同的基础矩阵组,且该所述基础矩阵组包含所述排序矩阵组内所有特征矩阵的种类。
[0009]优选的,在S5中,所述定位信息包括用于分隔不同特征矩阵的分隔符号。
[0010]优选的,在S6中,神经网络处理器对定位信息进行解析,根据解析后的定位信息从缓存单元调取基础矩阵组中相应的特征矩阵进行关联计算,具体包括以下步骤:S61、神经网络处理器根据定位信息中的分隔符号,将定位信息分离成图像或视频中不同特征对应的多个特征定位信息;S62、根据所有特征定位信息的顺序,分别从缓存单元调取特征矩阵进行计算。
[0011]一种在NPU中减少计算资源占用的系统,实现如上述所述的一种在NPU中减少计算资源占用的方法,所述系统包括:读取模块,用于获取待处理信息,对待处理信息进行预处理,其中所述待处理信息包括图像或视频信息;初始提取模块,用于将预处理后的信息发送至中央处理器进行初步特征提取,生成与所述初步特征对应的特征矩阵;排序模块,用于将所有特征矩阵按预设的计算顺序进行排序,得到含有特定排列顺序的排序矩阵组;矩阵提取模块,用于对排序矩阵组的所有特征矩阵进行筛选,生成基础矩阵组,将基础矩阵组发送至神经网络处理器的缓存单元内;定位信息转换模块,用于对排序矩阵组的所有特征矩阵进行定位,生成只含有每个特征矩阵位置信息的定位信息,将定位信息发送至神经网络处理器的计算模块;计算模块,用于对定位信息进行解析,根据解析后的定位信息从缓存单元调取相应的特征矩阵进行计算。
[0012]一种设备,包括至少一个处理器、至少一个存储器和数据总线,所述处理器包括中央处理器和神经网络处理器;其中:所述中央处理器、所述神经网络处理器与所述存储器通过所述数据总线完成相互间的通信;所述存储器存储有被所述处理器执行的程序指令,所述至少一个处理器调用所述程序指令以执行如上述所述的一种在NPU中减少计算资源占用
的方法。
[0013]一种存储介质,其上存储有计算机程序,所述计算机程序被至少一个处理器执行时实现如上述所述的一种在NPU中减少计算资源占用的方法。
[0014]上述技术方案中的一个技术方案具有以下有益效果:针对NPU中计算资源占用的问题,本设计采用设置缓存单位对需要进行计算的矩阵进行储存,并采用相同的矩阵保留一个的方式,使得占用的储存较少,并通过对需要计算的矩阵进行排序的方式,在计算的过程中直接从缓存单元实时调用的方式,减小计算资源的占用,提高了计算的速度。
附图说明
[0015]图1是本专利技术在一种在NPU中减少计算资源占用的方法的流程示意图;图2是本专利技术在一种在NPU中减少计算资源占用的系统的结构示意图;图3为本专利技术中一种电子设备的结构示意图。
[0016]附图中:1、读取模块;2、初始提取模块;3、排序模块;4、矩阵提取模块;5、定位信息转换模块;6、计算模块;7、中央处理器;8、神经网络处理器;9、存储器;10、数据总线。
具体实施方式
[0017]下面结合附图并通过具体实施方式来进一步说明本专利技术的技术方案。
[0018]实施例1
[0019]请参阅图1,为本申请实施例提供的一种在NPU中减少计算资源占用的方法,针对NPU中计算资源占用的问题,本设计采用设置缓存单元对需要进行计算的矩阵进行储存,并采用相同的矩阵保留一个的方式,使得占用的储存较少,并通过对需要计算的矩阵进行排序的方式,在计算的过程中直接从缓存单元实时调用的方式,减小计算资源的占用,提高了计算的速度。具体包括以下步骤:具体的,对于图像和适配的获取,可以设置客户端或前端页面让使用者对待处理的图像或视频信息进行输入。
[0020]S1、获取待处理信息,对待处理信息进行预处理,其中所述待处理信息包括图像或视频信息;S11、判断待处理信息为图像或视频信息,如果待处理信息为图像信息,则执行S12,如果待处理本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种在NPU中减少计算资源占用的方法,其特征在于,包括以下步骤:S1、获取待处理信息,对待处理信息进行预处理,其中所述待处理信息包括图像或视频信息;S2、对预处理后的信息进行初步特征提取,生成与所述初步特征对应的特征矩阵;S3、将所有特征矩阵按预设的计算顺序进行排序,得到含有特定排列顺序的排序矩阵组;S4、对排序矩阵组的所有特征矩阵进行筛选,生成基础矩阵组,将基础矩阵组发送至神经网络处理器的缓存单元内;S5、对排序矩阵组的所有特征矩阵进行定位,生成只含有每个特征矩阵位置信息的定位信息,将定位信息发送至神经网络处理器;S6、神经网络处理器对定位信息进行解析,根据解析后的定位信息从缓存单元调取基础矩阵组中相应的特征矩阵进行关联计算。2.根据权利要求1所述的一种在NPU中减少计算资源占用的方法,其特征在于,在S1中,所述对待处理信息进行预处理,具体包括以下步骤:S11、判断待处理信息为图像或视频信息,如果待处理信息为图像信息,则执行S12,如果待处理信息为视频信息,则执行S13;S12、将图像信息的格式转换为RMVB格式;S13、对视频信息进行关键帧提取,获取关键帧图像,再将关键帧图像的格式转换为RMVB格式。3.根据权利要求2所述的一种在NPU中减少计算资源占用的方法,其特征在于, 在S2中,所述对预处理后的信息进行初步特征提取,生成与所述初步特征对应的特征矩阵,具体包括以下步骤:S21、将预处理后得到的图像进行颜色通道分离,分离为红色通道图像、绿色通道图像和蓝色通道图像;S22、将分离后的图像通过HOG图像特征提取算法进行初步特征提取,获得带有初步特征的图像;S23、将带有初步特征的图像导入预设的特征转换模型,生成与所述初步特征对应的特征矩阵。4.根据权利要求3所述的一种在NPU中减少计算资源占用的方法,其特征在于,在S22中,所述HOG图像特征提取算法具体包括以下步骤:S221、将分离后的图像进行灰度化、Gamma矫正、重叠快归一化和分割处理;S222、对分割后的图像计算每个像素点的梯度方向和梯度幅值,再根据每个像素点的梯度方向和梯度幅值计算并形成方向梯度直方图;S223、利用梯度算子的核,对方向梯度直方图进行卷积,提取出HOG特征,再将提取出的HOG特征首位相连,组成初步特征。5.根据权利要求4所述的一种在NPU中减少计算资源占用的方法,其特征在于,在S4中,所述对排序矩阵组的所有特征矩阵进行筛选,具体...

【专利技术属性】
技术研发人员:黄茂芹
申请(专利权)人:广东赛昉科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1