【技术实现步骤摘要】
神经网络搜索的方法和装置
本申请涉及人工智能领域,并且更具体地,涉及一种神经网络搜索的方法和装置。
技术介绍
近年来,神经网络快速发展,在一些领域深度神经网络已经优于人类。但在实际应用中,由于应用场景、数据集、部署设备及指标要求等不同,往往需要经验丰富的专家花费大量的时间和精力才能构建出满足应用环境的神经网络。为了提高建立神经网络的效率,业界提出利用神经网络结构搜索(neuralarchitecturesearch,NAS)来设计神经网络,以得到满足应用环境的神经网络。神经网络结构搜索能够应用特定数据集自动搜索满足特定约束条件的达成特定目标的神经网络,即使用者不需要场景经验和深度学习的知识技能,就可以完成采用深度神经网络建模的过程。当前,神经网络结构搜索面临着搜索空间维度高、搜索时间长等问题,导致建立神经网络的效率较低。提高建立神经网络的效率,是亟需解决的技术问题。
技术实现思路
本申请提供一种神经网络搜索的方法和装置,可以提高建立神经网络的效率。第一方面,提供了一种神经网络搜索的方法,该方法应用于计算系统,该系统包括多个智能体,包括:确定多个候选神经网络,多个候选神经网络具有相同的网络结构,多个智能体中的第一智能体用于处理多个候选神经网络中每个候选神经网络中的同一个部分,第一智能体为多个智能体中的一个;分别将每个候选神经网络中的第一智能体处理的那部分神经网络的上下文作为所述第一智能体的输入,得到对应于多个候选神经网络的多个新的候选神经网络,新的候选神经网络包括第一智能体处 ...
【技术保护点】
1.一种神经网络搜索的方法,所述方法应用于计算系统,所述系统包括多个智能体,其特征在于,包括:/n确定多个候选神经网络,所述多个候选神经网络具有相同的网络结构,所述多个智能体中的第一智能体用于处理所述多个候选神经网络中每个候选神经网络中的同一个部分,所述第一智能体为所述多个智能体中的一个;/n分别将所述每个候选神经网络中的所述第一智能体处理的那部分神经网络的上下文作为所述第一智能体的输入,得到对应于所述多个候选神经网络的多个新的候选神经网络,所述新的候选神经网络包括所述第一智能体处理后的所述部分网络结构与所述输入,其中,所述第一智能体处理的那部分神经网络的上下文为一个候选神经网络中除所述第一智能处理的那部分之外剩余的候选神经网络;/n根据所述多个新的候选神经网络确定目标神经网络。/n
【技术特征摘要】
1.一种神经网络搜索的方法,所述方法应用于计算系统,所述系统包括多个智能体,其特征在于,包括:
确定多个候选神经网络,所述多个候选神经网络具有相同的网络结构,所述多个智能体中的第一智能体用于处理所述多个候选神经网络中每个候选神经网络中的同一个部分,所述第一智能体为所述多个智能体中的一个;
分别将所述每个候选神经网络中的所述第一智能体处理的那部分神经网络的上下文作为所述第一智能体的输入,得到对应于所述多个候选神经网络的多个新的候选神经网络,所述新的候选神经网络包括所述第一智能体处理后的所述部分网络结构与所述输入,其中,所述第一智能体处理的那部分神经网络的上下文为一个候选神经网络中除所述第一智能处理的那部分之外剩余的候选神经网络;
根据所述多个新的候选神经网络确定目标神经网络。
2.根据权利要求1所述的方法,其特征在于,所述第一智能体负责的神经网络的部分网络结构为所述神经网络的一个节点的一个指令。
3.根据权利要求1或2所述的方法,其特征在于,所述选择所述多个智能体中的第一智能体,包括:
根据所述多个智能体中每个智能体对应的概率值,选择所述第一智能体。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述每个候选神经网络包括正常单元和衰减单元,所述正常单元对应的智能体的概率值高于所述衰减单元对应的智能体的概率值,其中,所述正常单元与所述衰减单元包括多个节点。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述多个候选神经网络包括k个第一候选神经网络,或者,所述多个候选神经网络包括k个第一候选神经网络和k个第二候选神经网络,k为正整数;
其中,所述第一候选神经网络的第一指令是随机初始化的或者上一次训练智能体的结果确定的,所述第二候选神经网络的第二指令是对所述第一指令扰动后得到的,
其中,所述第一指令和所述第二指令均由第二智能体负责,所述第二智能体是所述多个智能体中除了所述第一智能体之外的其他智能体。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述确定多个候选神经网络,包括:
根据公共网络结构池,确定所述多个候选神经网络,其中,所述公共网络结构池根据上一次训练智能体的训练结果更新。
7.一种图像处理方法,其特征在于,包括:
获取待处理图像;
根据神经网络对所述待处理图像进行分类,以得到所述待处理图像的分类结果;
其中,所述神经网络是根据计算机系统中的多个智能体确定的,所述神经网络的确定包括:
确定多个候选神经网络,所述多个候选神经网络具有相同的网络结构,所述多个智能体中的第一智能体用于处理所述多个候选神经网络中每个候选神经网络中的同一个部分,所述第一智能体为所述多个智能体中的一个;
分别将所述每个候选神经网络中的所述第一智能体处理的那部分神经网络的上下文作为所述第一智能体的输入,得到对应于所述多个候选神经网络的多个新的候选神经网络,所述新的候选神经网络包括所述第一智能体处理后的所述部分网络结构与所述输入,其中,所述第一智能体处理的那部分神经网络的上下文为一个候选神经网络中除所述第一智能处理的那部分之外剩余的候选神经网络;
根据所述多个新的候选神经网络确定目标神经网络。
8.根据权利要求7所述的方法,其特征在于,所述第一智能体负责的神经网络的部分网络结构为所述神经网络的一个节点的一个指令。
9.根据权利要求7或8所述的方法,其特征在于,所述选择所述多个智能体中的第一智能体,包括:
根据所述多个智能体中每个智能体对应的概率值,选择所述第一智能体。
10.根据权利要求7至9任一项所述的方法,其特征在于,所述每个候选神经网络包括正常单元和衰减单元,所述正常单元对应的智能体的概率值高于所述衰减单元对应的智能体的概率值,其中,所述正常单元与所述衰减单元包括多个节点。
11.根据权利要求7至10任一项所述的方法,其特征在于,所述多个候选神经网络包括k个第一候选神经网络,或者,所述多个候选神经网络包括k个第一候选神经网络和k个第二候选神经网络,k为正整数;
其中,所述第一候选神经网络的第一指令是随机初始化的或者上一次训练智能体的结果确定的,所述第二候选神经网络的第二指令是对所述第一指令扰动后得到的,
其中,所述第一指令和所述第二指令均由第二智能体负责,所述第二智能体是所述多个智能体中除了所述第一智能体之外的其他智能体。
12.根据权利要求7至11任一项所述的方法,其特征在于,所述确定多个候选神经网络,包括:
根据公共网络结构池,确定所述多个候选神经网络,其中,所述公共网络结构池根据上一次训练智能体的训练结果更新。
13.一种神经网络搜索的装置,所述装置应用于计算...
【专利技术属性】
技术研发人员:许晨阳,张国川,罗兰,王琪瑞,于璠,
申请(专利权)人:华为技术有限公司,浙江大学,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。