神经网络搜索的方法和装置制造方法及图纸

技术编号:29404162 阅读:13 留言:0更新日期:2021-07-23 22:42
本申请涉及人工智能领域,提供一种神经网络的搜索方法和装置,该方法应用于计算系统,该系统包括多个智能体,该方法包括:确定多个候选神经网络,多个智能体中的第一智能体用于处理所述多个候选神经网络中每个候选神经网络中的同一个部分;分别将所述每个候选神经网络中的所述第一智能体处理的那部分神经网络的上下文作为所述第一智能体的输入,得到对应于所述多个候选神经网络的多个新的候选神经网络;根据所述多个新的候选神经网络确定目标神经网络。从而可以提高建立神经网络的效率。

【技术实现步骤摘要】
神经网络搜索的方法和装置
本申请涉及人工智能领域,并且更具体地,涉及一种神经网络搜索的方法和装置。
技术介绍
近年来,神经网络快速发展,在一些领域深度神经网络已经优于人类。但在实际应用中,由于应用场景、数据集、部署设备及指标要求等不同,往往需要经验丰富的专家花费大量的时间和精力才能构建出满足应用环境的神经网络。为了提高建立神经网络的效率,业界提出利用神经网络结构搜索(neuralarchitecturesearch,NAS)来设计神经网络,以得到满足应用环境的神经网络。神经网络结构搜索能够应用特定数据集自动搜索满足特定约束条件的达成特定目标的神经网络,即使用者不需要场景经验和深度学习的知识技能,就可以完成采用深度神经网络建模的过程。当前,神经网络结构搜索面临着搜索空间维度高、搜索时间长等问题,导致建立神经网络的效率较低。提高建立神经网络的效率,是亟需解决的技术问题。
技术实现思路
本申请提供一种神经网络搜索的方法和装置,可以提高建立神经网络的效率。第一方面,提供了一种神经网络搜索的方法,该方法应用于计算系统,该系统包括多个智能体,包括:确定多个候选神经网络,多个候选神经网络具有相同的网络结构,多个智能体中的第一智能体用于处理多个候选神经网络中每个候选神经网络中的同一个部分,第一智能体为多个智能体中的一个;分别将每个候选神经网络中的第一智能体处理的那部分神经网络的上下文作为所述第一智能体的输入,得到对应于多个候选神经网络的多个新的候选神经网络,新的候选神经网络包括第一智能体处理后的部分网络结构与输入,其中,第一智能体处理的那部分神经网络的上下文为一个候选神经网络中除第一智能处理的那部分之外剩余的候选神经网络;根据多个新的候选神经网络确定目标神经网络。在现有ENAS中,采用单智能体策略梯度模型进行网络结构序列预测,从而对每一候选的网络结构进行训练,从中选出满足需求的神经网络。导致搜索空间大,难以学习到最优路径,此外,需要大量的网络结构样本。在本申请实施例中,采用多智能体生成神经网络,其中,每个智能体负责每个候选神经网络中同一部分网络结构的生成与学习,例如对于多个七层的卷积神经网络结构,一个智能体只负责多个七层卷积神经网络结构的第二层网络结构是生成和学习,因此,可以减小每个智能体的搜索空间,有利于学习到最优路径,从而可以提高建立神经网络的效率。换句话说,在本申请实施例中,通过采用多智能体分别负责网络不同部分的生成,相对于现有ENAS,改进了网络生成的序列结构。改进了网络生成的序列结构,可以理解为,解耦了现有的网络结构搜索方案中网络结构生成的时序。因此,本申请实施例可以提高网络结构采样的效率,可以整体上提高神经网络结构搜索的效率。结合第一方面,在第一方面的某些实现方式中,第一智能体负责的神经网络的部分网络结构为所述神经网络的一个节点的一个指令。在本申请实施例中,采用多智能体生成神经网络,其中,每个智能体负责部分网络结构的生成与学习,每次生成网络结构时,只有一个智能体产生动作,即每次训练时,只有一个智能体参与生成网络结构,使得一个智能体的输入可以不依赖其他智能体的输出,从而可以使得多智能体并行采样的效率得到充分发挥。换句话说,在本申请实施例中,通过使得一个智能体的输入可以不依赖其他智能体的输出,优化了智能体策略更新机制。结合第一方面,在第一方面的某些实现方式中,选择多个智能体中的第一智能体,包括:根据每个智能体对应的概率值,选择第一智能体。结合第一方面,在第一方面的某些实现方式中,每个候选神经网络包括正常单元和衰减单元,正常单元对应的智能体的概率值高于衰减单元对应的智能体的概率值。其中,智能体的概率值即为智能体被选择的概率。在某些情况下的智能体理应得到更多次数的训练,例如,在一个图像分类的神经网络中,正常单元的重复次数远大于衰减单元的重复次数,因此正常单元中的智能体理应比衰减单元中的智能体得到更多训练。本申请实施例中通过设定正常单元对应的智能体的概率值高于衰减单元对应的智能体的概率值,可以使每个智能体都得到最够充分的训练。结合第一方面,在第一方面的某些实现方式中,多个候选神经网络包括k个第一候选神经网络,或者,多个候选神经网络包括k个第一候选神经网络和k个第二候选神经网络,k为正整数;其中,第一候选神经网络的第一指令是随机初始化的或者上一次训练智能体的结果确定的,负责第二指令的第二智能体是多个智能体中除了第一智能体之外的其他智能体;第二候选神经网络的第二指令是对第一指令扰动后得到的,其中,第一指令和第二指令均由第二智能体负责。在智能体的每一次训练中,通过对k个第一候选神经网络中的第二智能体负责的第一指令进行扰动从而生成k个第二候选神经网络,可以避免第一智能体的训练结果只是在k个第一候选神经网络结构中达到最优,避免智能体的训练陷入僵化。结合第一方面,在第一方面的某些实现方式中,确定多个候选神经网络,包括:根据公共网络结构池,确定多个候选神经网络,其中,公共网络结构池根据上一次训练智能体的结果确定。根据上一次训练智能体的结果更新公共结构池,可以使得公共结构池中的候选神经网络的被训练过的智能体都是最优指令,并保留其中评估结果好的候选神经网络,使得下一次的智能体训练是在当前最优的候选神经网络的基础上进行的,保证智能体的训练朝着整体网络最优的方向。第二方面,提供了一种图像处理方法,包括:获取待处理图像;根据神经网络对待处理图像进行分类,以得到待处理图像的分类结果;其中,神经网络是根据计算机系统中的多个智能体确定的,所述神经网络的确定包括:确定多个候选神经网络,多个候选神经网络具有相同的网络结构,多个智能体中的第一智能体用于处理多个候选神经网络中每个候选神经网络中的同一个部分,第一智能体为所述多个智能体中的一个;分别将每个候选神经网络中的第一智能体处理的那部分神经网络的上下文作为所述第一智能体的输入,得到对应于多个候选神经网络的多个新的候选神经网络,新的候选神经网络包括第一智能体处理后的部分网络结构与输入,其中,第一智能体处理的那部分神经网络的上下文为一个候选神经网络中除第一智能处理的那部分之外剩余的候选神经网络;根据多个新的候选神经网络确定目标神经网络。通过本申请实施例提供的神经网络搜索的方法搜索出的神经网络可以直接用于图像分类处理,上述神经网络是根据第一方面和第一方面中的任意一种实现方式得到的神经网络。结合第二方面,在第二方面的某些实现方式中,第一智能体负责的神经网络的部分网络结构为神经网络的一个节点的一个指令。结合第二方面,在第二方面的某些实现方式中,选择多个智能体中的第一智能体,包括:根据多个智能体中每个智能体对应的概率值,选择第一智能体。结合第二方面,在第二方面的某些实现方式中,每个候选神经网络包括正常单元和衰减单元,正常单元对应的智能体的概率值高于衰减单元对应的智能体的概率值,其中,正常单元与衰减单元包括多个节点。结合第二方面,在第二方面的某些实现方式中,多个候选神本文档来自技高网...

【技术保护点】
1.一种神经网络搜索的方法,所述方法应用于计算系统,所述系统包括多个智能体,其特征在于,包括:/n确定多个候选神经网络,所述多个候选神经网络具有相同的网络结构,所述多个智能体中的第一智能体用于处理所述多个候选神经网络中每个候选神经网络中的同一个部分,所述第一智能体为所述多个智能体中的一个;/n分别将所述每个候选神经网络中的所述第一智能体处理的那部分神经网络的上下文作为所述第一智能体的输入,得到对应于所述多个候选神经网络的多个新的候选神经网络,所述新的候选神经网络包括所述第一智能体处理后的所述部分网络结构与所述输入,其中,所述第一智能体处理的那部分神经网络的上下文为一个候选神经网络中除所述第一智能处理的那部分之外剩余的候选神经网络;/n根据所述多个新的候选神经网络确定目标神经网络。/n

【技术特征摘要】
1.一种神经网络搜索的方法,所述方法应用于计算系统,所述系统包括多个智能体,其特征在于,包括:
确定多个候选神经网络,所述多个候选神经网络具有相同的网络结构,所述多个智能体中的第一智能体用于处理所述多个候选神经网络中每个候选神经网络中的同一个部分,所述第一智能体为所述多个智能体中的一个;
分别将所述每个候选神经网络中的所述第一智能体处理的那部分神经网络的上下文作为所述第一智能体的输入,得到对应于所述多个候选神经网络的多个新的候选神经网络,所述新的候选神经网络包括所述第一智能体处理后的所述部分网络结构与所述输入,其中,所述第一智能体处理的那部分神经网络的上下文为一个候选神经网络中除所述第一智能处理的那部分之外剩余的候选神经网络;
根据所述多个新的候选神经网络确定目标神经网络。


2.根据权利要求1所述的方法,其特征在于,所述第一智能体负责的神经网络的部分网络结构为所述神经网络的一个节点的一个指令。


3.根据权利要求1或2所述的方法,其特征在于,所述选择所述多个智能体中的第一智能体,包括:
根据所述多个智能体中每个智能体对应的概率值,选择所述第一智能体。


4.根据权利要求1至3任一项所述的方法,其特征在于,所述每个候选神经网络包括正常单元和衰减单元,所述正常单元对应的智能体的概率值高于所述衰减单元对应的智能体的概率值,其中,所述正常单元与所述衰减单元包括多个节点。


5.根据权利要求1至4任一项所述的方法,其特征在于,所述多个候选神经网络包括k个第一候选神经网络,或者,所述多个候选神经网络包括k个第一候选神经网络和k个第二候选神经网络,k为正整数;
其中,所述第一候选神经网络的第一指令是随机初始化的或者上一次训练智能体的结果确定的,所述第二候选神经网络的第二指令是对所述第一指令扰动后得到的,
其中,所述第一指令和所述第二指令均由第二智能体负责,所述第二智能体是所述多个智能体中除了所述第一智能体之外的其他智能体。


6.根据权利要求1至5任一项所述的方法,其特征在于,所述确定多个候选神经网络,包括:
根据公共网络结构池,确定所述多个候选神经网络,其中,所述公共网络结构池根据上一次训练智能体的训练结果更新。


7.一种图像处理方法,其特征在于,包括:
获取待处理图像;
根据神经网络对所述待处理图像进行分类,以得到所述待处理图像的分类结果;
其中,所述神经网络是根据计算机系统中的多个智能体确定的,所述神经网络的确定包括:
确定多个候选神经网络,所述多个候选神经网络具有相同的网络结构,所述多个智能体中的第一智能体用于处理所述多个候选神经网络中每个候选神经网络中的同一个部分,所述第一智能体为所述多个智能体中的一个;
分别将所述每个候选神经网络中的所述第一智能体处理的那部分神经网络的上下文作为所述第一智能体的输入,得到对应于所述多个候选神经网络的多个新的候选神经网络,所述新的候选神经网络包括所述第一智能体处理后的所述部分网络结构与所述输入,其中,所述第一智能体处理的那部分神经网络的上下文为一个候选神经网络中除所述第一智能处理的那部分之外剩余的候选神经网络;
根据所述多个新的候选神经网络确定目标神经网络。


8.根据权利要求7所述的方法,其特征在于,所述第一智能体负责的神经网络的部分网络结构为所述神经网络的一个节点的一个指令。


9.根据权利要求7或8所述的方法,其特征在于,所述选择所述多个智能体中的第一智能体,包括:
根据所述多个智能体中每个智能体对应的概率值,选择所述第一智能体。


10.根据权利要求7至9任一项所述的方法,其特征在于,所述每个候选神经网络包括正常单元和衰减单元,所述正常单元对应的智能体的概率值高于所述衰减单元对应的智能体的概率值,其中,所述正常单元与所述衰减单元包括多个节点。


11.根据权利要求7至10任一项所述的方法,其特征在于,所述多个候选神经网络包括k个第一候选神经网络,或者,所述多个候选神经网络包括k个第一候选神经网络和k个第二候选神经网络,k为正整数;
其中,所述第一候选神经网络的第一指令是随机初始化的或者上一次训练智能体的结果确定的,所述第二候选神经网络的第二指令是对所述第一指令扰动后得到的,
其中,所述第一指令和所述第二指令均由第二智能体负责,所述第二智能体是所述多个智能体中除了所述第一智能体之外的其他智能体。


12.根据权利要求7至11任一项所述的方法,其特征在于,所述确定多个候选神经网络,包括:
根据公共网络结构池,确定所述多个候选神经网络,其中,所述公共网络结构池根据上一次训练智能体的训练结果更新。


13.一种神经网络搜索的装置,所述装置应用于计算...

【专利技术属性】
技术研发人员:许晨阳张国川罗兰王琪瑞于璠
申请(专利权)人:华为技术有限公司浙江大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1