一种基于神经网络架构搜索构建二值神经网络的方法技术

技术编号：38414825 阅读：12 留言：0更新日期：2023-08-07 11:18

本发明专利技术公开了一种基于神经网络架构搜索构建二值神经网络的方法，属于物体识别技术领域。该方法首先给出一个在图像识别任务上对二值神经网络友好的神经网络搜索空间模板，并提出一个通道数非递减策略来裁剪搜索空间；之后，基于该搜索空间生成对应二值神经网络超网，该超网包含众多候选二值子网，任一子网可以通过权重继承的方式从超网中获取对应参数；之后，提出了二值教师策略、二值转换模块和权重归一化模块三大部件，以优化二值神经网络超网的训练、增强搜索所得最终二值神经网络在图像识别等任务上的精度；最后，利用任意搜索算法，在二值神经网络超网上获取对应限制下的最优二值神经网络。本发明专利技术可以满足多种部署环境下的图像识别需求。下的图像识别需求。下的图像识别需求。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于神经网络架构搜索构建二值神经网络的方法

[0001]本专利技术属于物体识别
，涉及计算机视觉及深度学习技术，尤其涉及一种基于神经网络架构搜索构建二值神经网络的方法。

技术介绍

[0002]二值神经网络(Binary Neural Network，BNN)的权重参数和激活参数均为1比特，与常规的全精度网络相比，二值神经网络的卷积计算通过异或非操作(XNOR)和位计数操作(Bit
‑
Count)实现，并可以在CPU或嵌入式设备中较常规矩阵乘法取得至少58倍的加速。受益于快速的推理速度，二值神经网络已广泛应用于各类计算机视觉任务当中，包括图像分类、目标检测、实例分割等等，并已成为一种新型的图像识别网络范式。
[0003]然而，由于在构建用于图像识别任务的二值神经网络时需要较强的专家知识(如在神经网络中额外引入Bi
‑
Real模块等)，同时其训练策略也与常规神经网络的方案显著不同(如需要两阶段训练等)，这导致手工构建二值神经网络依赖于大量的人力和计算资源投入。虽然有研究者尝试将朴素的神经网络架构搜索引入到构建二值神经网络的流程中，但是受限于搜索空间小、搜索策略简单等因素，无法取得突破性的效果。综合来看，现有的构建二值神经网络的方法应用到图像识别任务中门槛较高，存在对人力的极大依赖、对资源的极大需求、不够灵活等瓶颈，无法快速、自动化地构建高效的二值神经网络，以用于图像识别的各个任务。

技术实现思路

[0004]为了克服上述现有技术的不足，本专利技术提供一...

【技术保护点】

【技术特征摘要】
1.一种基于神经网络架构搜索构建二值神经网络的方法，包括如下步骤：1)给出一个在图像识别任务上对二值神经网络友好的神经网络搜索空间模板；2)利用通道数非递减策略裁剪神经网络搜索空间；假设A为裁剪前的搜索空间，a∈A表示搜索空间中的某一个子网，L
a
为该子网的总层数，表示该子网在第i层的特征通道数目，则最终裁剪后的搜索空间表示为3)基于搜索空间生成对应二值神经网络超网，该超网包含众多候选二值子网，任一子网通过权重继承的方式从二值神经网络超网中获取对应参数；4)利用二值教师策略、二值转换模块、权重归一化模块三大部件，训练上述二值神经网络超网；5)利用任意搜索算法，在二值神经网络超网上获取对应限制下的最优二值神经网络。2.如权利要求1所述的基于神经网络架构搜索构建二值神经网络的方法，其特征在于，步骤3)中Depth、Channel width、Kernel size三种候选操作将为每一层选择最大值；Groups的候选操作将为每一层选择最小值。3.如权利要求1所述的基于神经网络架构搜索构建二值神经网络的方法，其特征在于，步骤4)中二值教师策略具体包括：在训练阶段，在每一次迭代选择四个二值子网进行训练，分别最大子网、最小子网和两个随机子网，在最大子网中，选择保留其权重为全精度，同时，利用最大子网的输出信息作为监督信号，来监督训练剩余三个子网，整体损失函数表示为：其中L
CE
和L
KL
分别表示交叉熵损失和KL散度损失，Y是真实值标签，是最大子网的预测值，y
s
和是最小子网和第i个随机子网的预测值。4.如权利要求1所述的基于神经网络架构搜索构建二值神经网络的方法，其特征在于，步骤4)中二值转换模块，用于实现共享权重二值化，即在支持最大子网的全精度权重的同时...

【专利技术属性】
技术研发人员：王勇涛，林稚皓，褚孝杰，
申请(专利权)人：北京大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人