卷积运算的处理方法、电子设备、移动终端及存储介质技术

技术编号：30040620 阅读：30 留言：0更新日期：2021-09-15 10:39

本申请公开了一种卷积运算的处理方法、电子设备、移动终端及存储介质，该处理方法包括：获取待处理的卷积运算以及配置数据库；将卷积运算转换为矩阵乘法，矩阵乘法对应一卷积尺寸；若确定配置数据库中无卷积尺寸对应的配置参数，则根据卷积尺寸以及硬件参数定义一参数搜索空间；根据参数搜索空间中的配置参数生成多个运算代码，并利用多个运算代码对矩阵乘法进行计算，以得到多个运算结果；将多个运算结果中满足预设条件的一个运算结果对应的运算代码的配置参数，存储至配置数据库。通过上述方式，本申请能够对矩阵乘法进行重构优化，从而以性能较好的矩阵乘法对卷积运算进行提升。而以性能较好的矩阵乘法对卷积运算进行提升。而以性能较好的矩阵乘法对卷积运算进行提升。

全部详细技术资料下载

【技术实现步骤摘要】
卷积运算的处理方法、电子设备、移动终端及存储介质

[0001]本申请涉及可重构
，特别是涉及一种卷积运算的处理方法、电子设备、移动终端及存储介质。

技术介绍

[0002]近年来，大量的深度学习(DL)应用程序已经从专业的科学领域逐渐扩散到了消费者市场，具体的应用包括实时游戏机器人，自动驾驶汽车导航，VR社交平台以及使用数百万个摄像头的交通监控。在许多情况下，通常利用GPU群集、TPU群集进行训练的模型在边缘设备上部署使用，以提供实时的人工智能服务。
[0003]卷积计算是人工智能服务中常用卷积神经网络(CNN)中主要的运算部分，它在许多网络模型的运算占比达到了99％以上。卷积计算可以通过转换成矩阵乘法，所以许多应用程序使用了BLAS(基本线性代数子例程)，手工编写的矩阵运算例程，甚至是扩展矩阵运算例程作为卷积计算的实现。
[0004]目前，卷积神经网络中生成的矩阵大多是长条形矩阵，而那些性能很好的BLAS计算库，基本都是针对正方形矩阵运算进行优化的，基于优化策略不一致，所以它们通常无法在这些长条形矩阵的计算上提供最佳的性能，矩阵乘法的性能也就无法得以较好的提升。

技术实现思路

[0005]本申请实施例的第一方面提供了卷积运算的处理方法，该处理方法包括：获取待处理的卷积运算以及配置数据库；将卷积运算转换为矩阵乘法，矩阵乘法对应一卷积尺寸；若确定配置数据库中无卷积尺寸对应的配置参数，则根据卷积尺寸以及硬件参数定义一参数搜索空间；根据参数搜索空间中的配置参数生成多个运算代码，并利用多个...

【技术保护点】

【技术特征摘要】
1.一种卷积运算的处理方法，其特征在于，所述方法包括：获取待处理的卷积运算以及配置数据库；将所述卷积运算转换为矩阵乘法，所述矩阵乘法对应一卷积尺寸；若确定所述配置数据库中无所述卷积尺寸对应的配置参数，则根据所述卷积尺寸以及硬件参数定义一参数搜索空间；根据所述参数搜索空间中的配置参数生成多个运算代码，并利用所述多个运算代码对所述矩阵乘法进行计算，以得到多个运算结果；将所述多个运算结果中满足预设条件的一个运算结果对应的运算代码的配置参数，存储至所述配置数据库。2.根据权利要求1所述的处理方法，其特征在于，所述若确定所述配置数据库中无所述卷积尺寸对应的配置参数，则根据所述卷积尺寸以及硬件参数定义一参数搜索空间，包括：判断所述配置数据库中是否有所述卷积尺寸对应的配置参数；若所述配置数据库中有所述卷积尺寸对应的配置参数，则按照所述配置参数生成运算代码并进行计算得到运算结果；若所述配置数据库中无所述卷积尺寸对应的配置参数，则根据所述卷积尺寸以及所述硬件参数定义所述配置参数对应的一参数搜索空间。3.根据权利要求2所述的处理方法，其特征在于，所述卷积尺寸对应的所述配置参数至少包括第一矩阵的行数、第一矩阵的列数、第一矩阵的缓存块的行数、第一矩阵的缓存块的列数、第二矩阵的列数、第二矩阵的缓存块的列数、寄存器块的行数、寄存器块的列数、第一矩阵的预取值、第二矩阵的预取值以及搜索空间标签；其中，所述第一矩阵的缓存块的行数的取值范围为[8，max(M，1024)]，所述M为所述第一矩阵的行数，所述第一矩阵的缓存块的列数的取值范围为[8，max(K，1024)]，所述K为所述第一矩阵的列数，所述第二矩阵的缓存块的列数的取值范围为[8，max(N，1024)]，所述N为所述第二矩阵的行数，所述寄存器块的行数的取值范围为4或8，所述寄存器块的列数为8、12或16，第一矩阵的预取值以及第二矩阵的预取值至少包括0、32、64、128、256或512之一，所述搜索空间标签取值至少包括0、1、2或3。4.根据权利要求3所述的处理方法，其特征在于，所述若所述配置数据库中无所述卷积尺寸对应的配置参数，则根据所述卷积尺寸以及所述硬件参数定义所述配置参数对应的一参数搜索空...

【专利技术属性】
技术研发人员：庄晨，孟金涛，魏彦杰，
申请(专利权)人：中国科学院深圳先进技术研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人