【技术实现步骤摘要】
【国外来华专利技术】网络结构搜索的方法及装置、计算机存储介质和计算机程序产品
本申请涉及机器学习领域,特别涉及一种网络结构搜索的方法及装置、计算机存储介质和计算机程序产品。
技术介绍
相关技术中,机器学习算法尤其深度学习算法近年来得到快速发展与广泛应用。随着应用场景和模型结构变得越来越复杂,在应用场景中得到最优模型的难度越来越大,其中,可以使用基于权值分享的高效网络结构搜索(EfficientNeuralArchitectureSearchviaParameterSharing,ENAS)来提高网络结构搜索(NeuralArchitectureSearch,NAS)的效率。然而,通过ENAS搜索到的网络结构经常出现较大的偏见(bias),即,通过ENAS搜索到的网络结构总会倾向于卷积核尺寸(kernelsize)较大的操作。这导致搜索到的模型参数较大,不易调试训练。另外,控制器带有偏见就意味着控制器收敛到的局部最优解,无法充分探索(explore)搜索空间。这样的控制器不具有较高的可信度,不能保证搜索到的模型就是全局最优。
技术实现思路
本申请的实施方式提供一种网络结构搜索的方法及装置、计算机存储介质和计算机程序产品。本申请实施方式的网络结构搜索的方法包括:定义搜索空间步骤:确定待进行网络结构搜索的神经网络模型的搜索空间,所述搜索空间定义了所述卷积神经网络中每两个节点之间的操作层上的多种操作;预训练步骤:根据第一网络结构以所述第一网络结构的预设参数训练所述搜索空间的总图以得到具 ...
【技术保护点】
1.一种网络结构搜索的方法,其特征在于,包括:/n定义搜索空间步骤:确定待进行网络结构搜索的神经网络模型的搜索空间,所述搜索空间定义了所述神经网络模型中每两个节点之间的操作层上的多种操作;/n预训练步骤:根据第一网络结构以所述第一网络结构的预设参数训练所述搜索空间的总图以得到具有预训练参数的所述总图,所述总图由所述操作构成;/n训练步骤:根据所述第一网络结构训练具有所述预训练参数的所述总图和根据所述第一网络结构的反馈量更新所述第一网络结构。/n
【技术特征摘要】
【国外来华专利技术】1.一种网络结构搜索的方法,其特征在于,包括:
定义搜索空间步骤:确定待进行网络结构搜索的神经网络模型的搜索空间,所述搜索空间定义了所述神经网络模型中每两个节点之间的操作层上的多种操作;
预训练步骤:根据第一网络结构以所述第一网络结构的预设参数训练所述搜索空间的总图以得到具有预训练参数的所述总图,所述总图由所述操作构成;
训练步骤:根据所述第一网络结构训练具有所述预训练参数的所述总图和根据所述第一网络结构的反馈量更新所述第一网络结构。
2.根据权利要求1所述的网络结构搜索的方法,其特征在于,所述预训练步骤,包括:
根据所述第一网络结构以所述第一网络结构的预设参数在所述搜索空间的每个所述操作层采样一个所述操作以得到所述总图的一个子图;
利用训练集的一批训练数据训练所述总图的子图以得到具有所述预训练参数的所述总图。
3.根据权利要求1所述的网络结构搜索的方法,其特征在于,所述训练步骤包括:
训练总图步骤:根据所述第一网络结构训练具有所述预训练参数的所述总图;
训练第一网络结构步骤:确定所述反馈量并根据所述反馈量更新所述第一网络结构。
4.根据权利要求3所述的网络结构搜索的方法,其特征在于,所述训练总图步骤和所述训练第一网络结构步骤迭代进行。
5.根据权利要求3所述的网络结构搜索的方法,其特征在于,所述训练总图步骤包括:
根据所述第一网络结构在所述搜索空间的每个所述操作层采样一个所述操作以得到具有所述预训练参数的所述总图的一个子图;
利用训练集的一批训练数据训练所述子图。
6.根据权利要求3所述的网络结构搜索的方法,其特征在于,所述训练第一网络结构步骤循环预设次数,根据所述反馈量更新所述第一网络结构,包括:
利用每次循环确定的所述反馈量更新所述第一网络结构,每次循环确定的所述反馈量的数量为预设数量。
7.根据权利要求6所述的网络结构搜索的方法,其特征在于,确定所述反馈量,包括:
根据所述第一网络结构在所述搜索空间的每个所述操作层采样一个所述操作以得到第二网络结构;
利用测试集的一批测试数据预测所述第二网络结构以确定所述反馈量。
8.根据权利要求6所述的网络结构搜索方法,其特征在于,所述第一网络结构是根据长短期记忆网络模型来构建,根据所述反馈量更新所述第一网络结构,通过以下条件式实现:
其中,Rk为第k个所述反馈量,θc为所述长短期记忆网络模型的参数,at为在第t个所述操作层采样到的所述操作,P(at|a(t-1):1;θc)为采样到所述操作的概率,m为所述反馈量的总数,T为所述第一网络结构预测的超参数的数量。
9.一种网络结构搜索的装置,其特征在于,包括处理器和存储器,所述存储器存储有一个或多个程序,在所述程序被处理器执行的情况下,使得所述处理器用于执行:
定义搜索空间...
【专利技术属性】
技术研发人员:蒋阳,庞磊,胡湛,
申请(专利权)人:深圳市大疆创新科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。