当前位置: 首页 > 专利查询>之江实验室专利>正文

一种模型构建方法、装置、存储介质及电子设备制造方法及图纸

技术编号:38346258 阅读:12 留言:0更新日期:2023-08-02 09:26
本说明书公开了一种模型构建方法、装置、存储介质及电子设备,可以对需要进行测试的各候选模型架构进行筛选,以筛选出通过代理模型预测出的性能参数的准确率较低的部分候选模型架构,来通过部署测试模型的方式获得该候选模型架构的真实性能参数,而针对剩余的候选模型架构,可以直接通过代理模型来获取出性能参数,并且可以通过主动学习的方法,在线对代理模型进行训练,从而可以在保证候选模型架构的性能评估准确率的同时,提升自动化构建深度学习模型的效率。习模型的效率。习模型的效率。

【技术实现步骤摘要】
一种模型构建方法、装置、存储介质及电子设备


[0001]本说明书涉及人工智能
,尤其涉及一种模型构建方法、装置、存储介质及电子设备。

技术介绍

[0002]神经架构搜索(Neural Architecture Search,NAS)是自动深度学习(Automatic Deep Learning, AutoDL)的重要组成部分,其用于根据用户输入的数据自动化设计出适用于对该数据进行处理的深度学习模型的网络架构,并可以根据设计出的深度学习模型的网络架构,自动构建并部署出深度学习模型,从而可以实现对用户输入的数据的自动化处理。
[0003]其中,在通过神经架构搜索来自动化设计深度学习模型的网络架构时,通常需要考虑设计出的深度学习模型的网络架构在不同硬件环境中的性能指标参数,来从多个设计出的深度学习模型的网络架构中筛选出最优的一个网络架构,而在获取设计出的深度学习模型的网络架构在不同硬件环境中的性能指标参数时,需要在硬件平台上按照设计出的每个深度学习模型的网络架构部署出相应的模型,从而获取到每个设计出的深度学习模型的网络架构在不同硬件环境中的性能指标参数,进而导致整体流程的耗时较长。
[0004]因此,如何能够提升自动化构建深度学习模型的效率,则是一个亟待解决的问题。

技术实现思路

[0005]本说明书提供一种模型构建方法、装置、存储介质及电子设备,以部分的解决现有技术存在的上述问题。
[0006]本说明书采用下述技术方案:本说明书提供了一种模型构建方法,包括:获取模型构建请求;根据所述模型构建请求,确定各候选模型架构;针对每个候选模型架构,将该候选模型架构输入到预设的代理模型中,通过所述代理模型得到该候选模型架构在指定硬件环境中的性能参数,作为第一性能参数;根据所述第一性能参数,确定每个候选模型架构的权值,并根据所述权值,从各候选模型架构中筛选出待测试模型架构;按照所述待测试模型架构在所述指定硬件环境中部署测试模型,以获取所述待测试模型架构对应的第二性能参数;根据所述待测试模型架构对应的第二性能参数和除所述待测试模型架构之外的其他候选模型架构对应的第一性能参数,从各候选模型架构中筛选出目标模型架构;按照所述目标模型架构构建目标模型,并通过所述目标模型进行任务执行。
[0007]可选地,根据所述模型构建请求,确定各候选模型架构,具体包括:根据所述模型的构建请求,从预设的各原子操作中筛选出用于组成每个候选模型架构的各原子操作,作为每个候选模型架构对应的各目标原子操作,所述原子操作包括:常
规卷积操作、分离式卷积操作、平均池化操作、最大池化操作中的至少一种;根据每个候选模型架构对应的所述各目标原子操作,确定各候选模型架构。
[0008]可选地,根据所述模型的构建请求,从预设的各原子操作中筛选出用于组成每个候选模型架构的各原子操作,具体包括:根据所述模型的构建请求,确定各优化目标;通过预设的优化器,根据每个优化目标,从预设的各原子操作中筛选出用于组成每个候选模型架构的各原子操作。
[0009]可选地,根据所述第一性能参数,确定每个候选模型架构的权值,具体包括:根据所述代理模型的任务类型,从预设的各筛选策略中确定出目标筛选策略,所述任务类型包括:分类任务、回归任务;根据所述目标筛选策略以及所述第一性能参数,确定每个候选模型架构的权值。
[0010]可选地,根据所述目标筛选策略以及所述第一性能参数,确定每个候选模型架构的权值,具体包括:针对每个候选模型架构对应的第一性能参数,根据所述目标筛选策略,确定该候选模型架构对应的第一性能参数的置信度;根据所述置信度,确定每个候选模型架构的权值,所述候选模型架构对应的第一性能参数的置信度越低,所述候选模型架构的权值越高。
[0011]可选地,根据所述目标筛选策略以及所述第一性能参数,确定每个候选模型架构的权值,具体包括:针对每个候选模型架构对应的第一性能参数,根据所述目标筛选策略,确定该候选模型架构对应的第一性能参数的贡献度;根据所述贡献度,确定每个候选模型架构的权值,所述候选模型架构对应的第一性能参数的贡献度越高,所述候选模型架构的权值越高。
[0012]可选地,针对每个候选模型架构,将该候选模型架构输入到预设的代理模型中,得到该候选模型架构在指定硬件环境中的性能参数,作为第一性能参数,具体包括:针对每个候选模型架构,将该候选模型架构输入到预先训练的各代理模型中,得到该候选模型架构在各指定硬件环境中的性能参数,作为各第一性能参数,其中,每个代理模型用于预测该候选模型架构在至少一种指定硬件环境中的性能参数;根据所述第一性能参数,确定每个候选模型架构的权值,并根据所述权值,从各候选模型架构中筛选出待测试模型架构,具体包括:根据所述各第一性能参数,确定每个候选模型架构的权值,并根据所述权值,从各候选模型架构中筛选出待测试模型架构;按照所述待测试模型架构在所述指定硬件环境中部署测试模型,以获取所述待测试模型架构对应的第二性能参数,具体包括:按照所述待测试模型架构在每种指定硬件环境中部署测试模型,以获取所述待测试模型架构在每种硬件环境中对应的第二性能参数;根据所述待测试模型架构对应的第二性能参数和除所述待测试模型架构之外的其他候选模型架构对应的第一性能参数,从各候选模型架构中筛选出目标模型架构,具体包括:
根据所述待测试模型架构对应的各第二性能参数和除所述待测试模型架构之外的其他候选模型架构对应的各第一性能参数,从各候选模型架构中筛选出目标模型架构。
[0013]可选地,所述代理模型包括:特征提取层、各决策层,其中,不同决策层用于确定候选模型架构在指定硬件环境中不同类型的性能参数;将该候选模型架构输入到预设的代理模型中,得到该候选模型架构在指定硬件环境中的性能参数,作为第一性能参数,具体包括:将该候选模型架构输入到预设的代理模型的所述特征提取层中,通过所述特征提取层,得到该候选模型架构的特征表示;通过所述特征提取层将该候选模型架构的特征表示输入到所述代理模型的每个决策层中,以通过每个决策层,得到该候选模型架构在指定硬件环境中的各子第一性能参数;根据所述各子第一性能参数,得到该候选模型架构在指定硬件环境中的第一性能参数。
[0014]可选地,所述方法还包括:以最小化所述代理模型输出的所述待测试模型架构对应的第一性能参数和所述待测试模型架构对应的第二性能参数之间的偏差,对所述代理模型进行训练。
[0015]本说明书提供了一种模型构建装置,包括:获取模块,用于获取模型构建请求;确定模块,用于根据所述模型构建请求,确定各候选模型架构;第一评估模块,用于针对每个候选模型架构,将该候选模型架构输入到预设的代理模型中,得到该候选模型架构在指定硬件环境中的性能参数,作为第一性能参数;筛选模块,用于根据所述第一性能参数,确定每个候选模型架构的权值,并根据所述权值,从各候选模型架构中筛选出待测试模型架构;第二评估模块,用于按照所述待测试模型架构在所述指定硬件环境中部署测试模型,以获取所述待测试模型架构对应的第二性能参数;决本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型构建方法,其特征在于,包括:获取模型构建请求;根据所述模型构建请求,确定各候选模型架构;针对每个候选模型架构,将该候选模型架构输入到预设的代理模型中,通过所述代理模型得到该候选模型架构在指定硬件环境中的性能参数,作为第一性能参数;根据所述第一性能参数,确定每个候选模型架构的权值,并根据所述权值,从各候选模型架构中筛选出待测试模型架构;按照所述待测试模型架构在所述指定硬件环境中部署测试模型,以获取所述待测试模型架构对应的第二性能参数;根据所述待测试模型架构对应的第二性能参数和除所述待测试模型架构之外的其他候选模型架构对应的第一性能参数,从各候选模型架构中筛选出目标模型架构;按照所述目标模型架构构建目标模型,并通过所述目标模型进行任务执行。2.如权利要求1所述的方法,其特征在于,根据所述模型构建请求,确定各候选模型架构,具体包括:根据所述模型的构建请求,从预设的各原子操作中筛选出用于组成每个候选模型架构的各原子操作,作为每个候选模型架构对应的各目标原子操作,所述原子操作包括:常规卷积操作、分离式卷积操作、平均池化操作、最大池化操作中的至少一种;根据每个候选模型架构对应的所述各目标原子操作,确定各候选模型架构。3.如权利要求2所述的方法,其特征在于,根据所述模型的构建请求,从预设的各原子操作中筛选出用于组成每个候选模型架构的各原子操作,具体包括:根据所述模型的构建请求,确定各优化目标;通过预设的优化器,根据每个优化目标,从预设的各原子操作中筛选出用于组成每个候选模型架构的各原子操作。4.如权利要求1所述的方法,其特征在于,根据所述第一性能参数,确定每个候选模型架构的权值,具体包括:根据所述代理模型的任务类型,从预设的各筛选策略中确定出目标筛选策略,所述任务类型包括:分类任务、回归任务;根据所述目标筛选策略以及所述第一性能参数,确定每个候选模型架构的权值。5.如权利要求4所述的方法,其特征在于,根据所述目标筛选策略以及所述第一性能参数,确定每个候选模型架构的权值,具体包括:针对每个候选模型架构对应的第一性能参数,根据所述目标筛选策略,确定该候选模型架构对应的第一性能参数的置信度;根据所述置信度,确定每个候选模型架构的权值,所述候选模型架构对应的第一性能参数的置信度越低,所述候选模型架构的权值越高。6.如权利要求4所述的方法,其特征在于,根据所述目标筛选策略以及所述第一性能参数,确定每个候选模型架构的权值,具体包括:针对每个候选模型架构对应的第一性能参数,根据所述目标筛选策略,确定该候选模型架构对应的第一性能参数的贡献度;根据所述贡献度,确定每个候选模型架构的权值,所述候选模型架构对应的第一性能
参数的贡献度越高,所述候选模型架构的权值越高。7.如权利要求1所述的方法,其特征在于,针对每个候选模型架构,将该候选模型架构输入到预设的代理模型中,得到该候选模型架构在指定硬件环境中的性能参数,作为第一性能参数,具体包括:针对每个候选模型架构,将该候选模型架构输入到预先训练的各代理模型中,得到该候选模型架构在各指定硬件环境中的性能参数,作为各第一性能参数,其中,每个代理模型用于预测该候选模型架构在至少一种指定硬件环境中的性能参数;根据所述第一性能参数,确定每个候选模型架构的权值,并根据所述权值,从各候选模型架构中筛选出待测试模型架构,具体包括:根据所述各第一性能参数,确定每个候选模型架构的权值,并根据所述权值,从各候选模型架构中筛选出待测试模型架构;按照所述待测试模型架构在所述指定硬件环境中部署测试模型,以获取所述待测试模型架构对应的第二性能参数,具体包括:按照所述待测试模型架构在每种指...

【专利技术属性】
技术研发人员:吕波侯瑞峥王鹏程陈自强胡陈枢程稳刘懿曾令仿陈光
申请(专利权)人:之江实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1