模型获取方法、装置、电子设备、存储介质和程序产品制造方法及图纸

技术编号：27880216 阅读：25 留言：0更新日期：2021-03-31 01:14

本公开公开了一种模型获取方法、装置、电子设备、存储介质和程序产品，涉及计算机视觉和深度学习技术领域。具体实现方案为：获取参考模型输出的M个第一软标签，其中，所述M个第一软标签分别与所述参考模型的M个目标连接层一一对应；依据所述M个第一软标签对超网络中的子网络的中间节点的连接参数进行更新，得到目标模型；其中，所述子网络的第i个中间节点是基于第i个目标连接层对应的第一软件标签进行更新，所述第i个中间节点位于所述超网络包括的M个连接层中的第i个连接层。本公开可以提高更新得到的目标模型与超网络之间性能的一致性。

全部详细技术资料下载

【技术实现步骤摘要】
模型获取方法、装置、电子设备、存储介质和程序产品
本公开涉及计算机
，尤其涉及计算机视觉和深度学习技术等人工智能领域。
技术介绍
随着深度学习的不断发展，其在众多领域都取得了巨大的成功，且逐渐向全自动机器学习发展。例如，神经网络结构搜索技术(NeuralArchitectureSearch，NAS)作为全自动机器学习的研究热点之一，通过设计高效的搜索方法，自动获取泛化能力强，硬件要求友好的神经网络，大量的解放了相关研究人员的创造力。传统的NAS方法需要独立采样并评估模型结构的性能，这种方式会造成很大的性能开销。为降低性能开销，基于梯度的超网络训练方法得以研究。其中，超网络可以适用于多种不同的网络结构应用。基于梯度的超网络训练方法，在超网络训练过程中，逐步删除权重最低的连接，随着连接的逐步删除，搜索空间会逐步减少，最终收敛到最优的结构中。
技术实现思路
本公开提供了一种模型获取方法、装置、电子设备、存储介质和程序产品。根据本公开的一方面，提供了一种模型获取方法，包括：获取参考模型输出的M个第一软标签，其中，所述M个第一软标签分别与所述参考模型的M个目标连接层一一对应；依据所述M个第一软标签对超网络中的子网络的中间节点的连接参数进行更新，得到目标模型；其中，所述子网络的第i个中间节点是基于第i个目标连接层对应的第一软件标签进行更新，所述第i个中间节点位于所述超网络包括的M个连接层中的第i个连接层。根据本公开的另一方面，提供了一种模型获取装置，包括：...

【技术保护点】
1.一种模型获取方法，包括：/n获取参考模型输出的M个第一软标签，其中，所述M个第一软标签分别与所述参考模型的M个目标连接层一一对应；/n依据所述M个第一软标签对超网络中的子网络的中间节点的连接参数进行更新，得到目标模型；/n其中，所述子网络的第i个中间节点是基于第i个目标连接层对应的第一软件标签进行更新，所述第i个中间节点位于所述超网络包括的M个连接层中的第i个连接层。/n

【技术特征摘要】
1.一种模型获取方法，包括：
获取参考模型输出的M个第一软标签，其中，所述M个第一软标签分别与所述参考模型的M个目标连接层一一对应；
依据所述M个第一软标签对超网络中的子网络的中间节点的连接参数进行更新，得到目标模型；
其中，所述子网络的第i个中间节点是基于第i个目标连接层对应的第一软件标签进行更新，所述第i个中间节点位于所述超网络包括的M个连接层中的第i个连接层。

2.根据权利要求1所述的方法，其中，所述子网络中的每个中间节点均存在K+1个连接，所述K为大于1的整数，所述依据所述M个第一软标签对超网络中的子网络的中间节点的连接参数进行更新，包括：
对所述子网络进行K轮迭代更新，其中，每轮迭代更新删除每个所述中间节点的一个连接。

3.根据权利要求2所述的方法，其中，所述超网络包括输出节点，所述K轮迭代更新中的第j轮更新，包括：
按照预设顺序分别对所述子网络中的中间节点的连接进行删除，其中，所述预设顺序为按照所述子网络中的中间节点与所述输出节点之间的距离，由小至大进行排序得到的顺序。

4.根据权利要求3所述的方法，其中，所述按照预设顺序分别对所述子网络中的中间节点的连接方式进行删除，包括：
对目标中间节点进行K+1次删除操作，得到K+1个中间超网络，其中，每次删除操作删除所述目标中间节点的一个不同连接，所述目标中间节点为所述子网络中的任意中间节点，且所述目标中间节点位于所述M个连接层中的第y个连接层，y为1至M中任一整数；
确定所述K+1个中间超网络中的第y个连接层输出的K+1个第二软标签；
基于所述K+1个第二软标签与第y个目标连接层所对应的目标第一软标签之间的距离，将所述K+1个中间超网络中的目标超网络确定为更新后的超网络。

5.根据权利要求4所述的方法，其中，所述目标超网络为所述K+1个中间超网络中输出的第二软标签与所述目标第一软标签之间的距离最小的超网络。

6.根据权利要求1所述的方法，其中，所述参考模型包括的连接层的数量为所述M的整数倍，所述M个目标连接层中任意两个目标连接层之间间隔的连接层数相同。

7.一种模型获取装置，包括：
获取模块，用于获取参考模型输出的M个第一软标签，其中，所述M个第一软标签分别与所述参考模型的M个目标连接层一一对应；
更新模块，用于依据所述M个第一软标签对超网络中的子网络的中间节点的连接参...

【专利技术属性】
技术研发人员：希滕，张刚，温圣召，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人