本发明专利技术实施例公开了一种yolo目标检测模型压缩方法、系统及存储介质,首先对搭建并训练好的yolo目标检测模型每层的输出值进行量化得到yolo目标检测模型每层的输出值的缩放尺度因子和偏置因子,再将yolo目标检测模型的BN层和卷积层进行融合,然后对融合后的yolo目标检测模型的模型参数进行量化得到权重和偏置的缩放尺度因子和偏置因子,根据yolo目标检测模型每层的输出值的缩放尺度因子和偏置因子,以及权重和偏置的缩放尺度因子和偏置因子,对融合后的yolo目标检测模型的模型参数进行量化,得到融合后的yolo目标检测模型的整体量化因子,最后根据整体量化因子,搭建yolo的int8型目标检测模型,得到通过int8参数进行前向推理的yolo目标检测模型。向推理的yolo目标检测模型。向推理的yolo目标检测模型。
【技术实现步骤摘要】
一种yolo目标检测模型压缩方法、系统及存储介质
[0001]本专利技术实施例涉及数据处理
,具体涉及一种yolo目标检测模型压缩方法、系统及存储介质。
技术介绍
[0002]在yolo目标检测模型的边缘计算中,边缘设备的计算能力通常较低,并且计算会受限于边缘设备的内存和电量消耗。此外,为了降低将yolo目标检测模型传输给边缘设备的通信量以及网络连接需求,需要将yolo目标检测模型量化使其尺寸更小、推断更快、耗电量更低。由于yolo目标检测模型的计算量以及计算复杂度较大,现有的yolo目标检测模型通常在云端进行计算,并且以浮点型运算为主。然而该方法对将yolo目标检测模型传输给边缘设备的通信量以及网络连接需求较高,使得在很多工程应用场景中有较大的局限性。
技术实现思路
[0003]为此,本专利技术实施例提供一种yolo目标检测模型压缩方法、系统及存储介质,以解决上述
技术介绍
中出现的至少一个问题。
[0004]为了实现上述目的,第一方面,本专利技术实施例提供了一种yolo目标检测模型压缩方法,包括如下步骤:
[0005]利用深度学习框架搭建yolo目标检测模型;
[0006]对yolo目标检测模型进行训练,并保存训练后的yolo目标检测模型的模型参数;
[0007]利用模型参数,量化yolo目标检测模型每层的输出值,得到yolo目标检测模型每层的输出值的缩放尺度因子和偏置因子;
[0008]导出模型参数,并将yolo目标检测模型的BN层和卷积层进行融合,得到融合后的yolo目标检测模型;
[0009]对融合后的yolo目标检测模型的模型参数进行量化,得到权重和偏置的缩放尺度因子和偏置因子;
[0010]根据yolo目标检测模型每层的输出值的缩放尺度因子和偏置因子,以及权重和偏置的缩放尺度因子和偏置因子,对融合后的yolo目标检测模型的模型参数进行量化,得到融合后的yolo目标检测模型的整体量化因子;
[0011]根据整体量化因子,搭建yolo的int8型目标检测模型,得到通过int8参数进行前向推理的yolo目标检测模型。
[0012]进一步地,利用深度学习框架搭建yolo目标检测模型包括:
[0013]计算数据集的均值和标准差,并对数据集进行归一化处理,得到预处理后的数据集;
[0014]写出文件读取函数,并利用文件读取函数读取yolo目标检测模型各层的数据参数;
[0015]利用深度学习框架搭建yolo目标检测模型的yolo层;
[0016]定义yolo层的模块函数;
[0017]利用数据参数和模块函数,搭建yolo目标检测模型。
[0018]进一步地,对yolo目标检测模型进行训练包括:
[0019]利用数据集对yolo目标检测模型进行N次训练,其中N为整数,且N≥100;
[0020]对第N次训练后的yolo目标检测模型的平均精度进行测试;
[0021]若第N次训练后的yolo目标检测模型的平均精度大于或等于标准精度,则停止训练。
[0022]进一步地,在停止训练之后还包括:
[0023]根据yolo目标检测模型的类型,选择对应的保存格式保存第N次训练后的yolo目标检测模型的模型参数。
[0024]进一步地,对yolo目标检测模型进行训练后得到的模型参数为浮点型,yolo的int8型目标检测模型的模型参数为int型。
[0025]进一步地,根据整体量化因子,搭建yolo的int8型目标检测模型,得到通过int8参数进行前向推理的yolo目标检测模型包括:
[0026]将yolo目标检测模型的浮点型卷积运算转换成int型卷积运算,使浮点型矩阵转换成int型矩阵;
[0027]将yolo目标检测模型中的卷积操作通过int型矩阵进行卷积运算;
[0028]通过将整体量化因子和int型矩阵卷积运算后的输出进行相乘,并做截断,使yolo目标检测模型中的运算均为int型运算,得到int型输出值;
[0029]利用整体量化因子将浮点运算转换为整数运算。
[0030]第二方面,本专利技术实施例提供了一种yolo目标检测模型压缩系统,系统包括:处理器和存储器;
[0031]存储器用于存储一个或多个程序指令;
[0032]处理器,用于运行一个或多个程序指令,用以执行如上一种yolo目标检测模型压缩方法中任一方法步骤。
[0033]第三方面,本专利技术实施例提供了一种计算机存储介质,计算机存储介质中包含一个或多个程序指令,一个或多个程序指令用于被一种yolo目标检测模型压缩系统执行如上一种yolo目标检测模型压缩方法中任一方法步骤。
[0034]本专利技术实施例具有如下优点:
[0035]本专利技术实施例提供的yolo目标检测模型压缩方法首先对搭建并训练好的yolo目标检测模型每层的输出值进行量化得到yolo目标检测模型每层的输出值的缩放尺度因子和偏置因子,再将yolo目标检测模型的BN层和卷积层进行融合,然后对融合后的yolo目标检测模型的模型参数进行量化得到权重和偏置的缩放尺度因子和偏置因子,根据yolo目标检测模型每层的输出值的缩放尺度因子和偏置因子,以及权重和偏置的缩放尺度因子和偏置因子,对融合后的yolo目标检测模型的模型参数进行量化,得到融合后的yolo目标检测模型的整体量化因子,最后根据整体量化因子,搭建yolo的int8型目标检测模型,得到通过int8参数进行前向推理的yolo目标检测模型,从而不需要对yolo目标检测模型进行重新训练,并且不会导致yolo目标检测模型的精度损失,同时还有效地简化了yolo目标检测模型的的结构,节约了运算资源和对计算设备的内存占用,提高了计算设备的计算速度。
附图说明
[0036]为了更清楚地说明本专利技术的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
[0037]本说明书所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本专利技术可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本专利技术所能产生的功效及所能达成的目的下,均应仍落在本专利技术所揭示的
技术实现思路
得能涵盖的范围内。
[0038]图1为本专利技术实施例提供的一种yolo目标检测模型压缩方法流程示意图;
[0039]图2为本专利技术实施例提供的yolov3
‑
tiny目标检测模型的BN层和卷积层的融合过程示意图;
[0040]图3为本专利技术实施例提供的利用深度学习框架搭建yolo目标检测模型的流程示意图;
[0041]图4为本专利技术实施例提供的对yolo目标检测模型进行训练的流程本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种yolo目标检测模型压缩方法,其特征在于,包括如下步骤:利用深度学习框架搭建yolo目标检测模型;对所述yolo目标检测模型进行训练,并保存训练后的yolo目标检测模型的模型参数;利用所述模型参数,量化所述yolo目标检测模型每层的输出值,得到所述yolo目标检测模型每层的输出值的缩放尺度因子和偏置因子;导出所述模型参数,并将所述yolo目标检测模型的BN层和卷积层进行融合,得到融合后的yolo目标检测模型;对所述融合后的yolo目标检测模型的模型参数进行量化,得到权重和偏置的缩放尺度因子和偏置因子;根据所述yolo目标检测模型每层的输出值的缩放尺度因子和偏置因子,以及所述权重和偏置的缩放尺度因子和偏置因子,对所述融合后的yolo目标检测模型的模型参数进行量化,得到所述融合后的yolo目标检测模型的整体量化因子;根据所述整体量化因子,搭建yolo的int8型目标检测模型,得到通过int8参数进行前向推理的yolo目标检测模型。2.根据权利要求1所述的yolo目标检测模型压缩方法,其特征在于,所述利用深度学习框架搭建yolo目标检测模型包括:计算数据集的均值和标准差,并对所述数据集进行归一化处理,得到预处理后的数据集;写出文件读取函数,并利用所述文件读取函数读取yolo目标检测模型各层的数据参数;利用所述深度学习框架搭建所述yolo目标检测模型的yolo层;定义所述yolo层的模块函数;利用所述数据参数和所述模块函数,搭建所述yolo目标检测模型。3.根据权利要求2所述的yolo目标检测模型压缩方法,其特征在于,所述对所述yolo目标检测模型进行训练包括:利用所述数据集对所述yolo目标检测模型进行N次训练,其中N为整数,且N≥100;对第N次训练后的yolo目标检...
【专利技术属性】
技术研发人员:李卫东,刘平涛,罗博文,张招,
申请(专利权)人:武汉莱克斯瑞科技发展有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。