卷积神经网络的优化方法及相关产品技术

技术编号：25449181 阅读：20 留言：0更新日期：2020-08-28 22:34

一种卷积神经网络的优化方法及相关产品，所述方法包括：获得预训练模型M；将预训练模型M在指定领域的数据集D重训练得到初始模型M

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】卷积神经网络的优化方法及相关产品
本专利技术涉及通信以及人工智能
，具体涉及一种卷积神经网络的优化方法及相关产品。
技术介绍
近年来，作为一种机器学习模型，深度卷积神经网络在计算机视觉等领域取得了优异的效果，在部分任务中甚至超过人类的平均水平，如图像分类识别，围棋比赛等。卷积神经网络一般包含多个卷积层，中间穿插着池化层，线性整流层等，网络的顶部一般有一个或多个全连接层，最顶端为用于训练的损失函数层。迁移学习是一种机器学习模型的开发与训练方法，目的是把在领域A中训练完成的模型M，通过重训练等方法以较低的成本迁移到领域B中。迁移学习技术在深度卷积神经网络中的应用很广泛，但是这类网络的训练时间很长，成本很高。
技术实现思路
本专利技术实施例提供了一种卷积神经网络的优化方法及相关产品，可以将训练好的模型进行简单的重训练即可以应用到目标领域中，具有降低成本的优点。第一方面，本专利技术实施例提供一种卷积神经网络的优化方法，所述方法包括如下步骤：获得预训练模型M；将预训练模型M在指定领域的数据集D重训练得到初始模型M0，对初始模型M0进行替换层操作；所述替换层操作包括：基于二分图最大匹配算法确定初始模型M0中标准卷积层e适合被替换成高效卷积层，确定标准卷积层e被替换成高效卷积层的第一中间模型M1效果增益；对第一中间模型M1的参数进行重整化得到第二中间模型M2；对第二中间模型M2进行初始化以及重训练得到第三中间模型M3；计算第三中间模型M3的损失值；<...

【技术保护点】
一种卷积神经网络的优化方法，其特征在于，所述方法包括如下步骤：/n获得预训练模型M；/n将预训练模型M在指定领域的数据集D重训练得到初始模型M

【技术特征摘要】
【国外来华专利技术】一种卷积神经网络的优化方法，其特征在于，所述方法包括如下步骤：
获得预训练模型M；
将预训练模型M在指定领域的数据集D重训练得到初始模型M
0，对初始模型M
0进行替换层操作；

所述替换层操作包括：基于二分图最大匹配算法确定初始模型M
0中标准卷积层e适合被替换成高效卷积层，确定标准卷积层e被替换成高效卷积层的第一中间模型M
1效果增益；对第一中间模型M1的参数进行重整化得到第二中间模型M2；对第二中间模型M2进行初始化以及重训练得到第三中间模型M3；计算第三中间模型M3的损失值；

重复执行替换层操作得到多个第三中间模型M3以及多个损失值；选择损失值最小的第三中间模型M3为输出模型。

根据权利要求1所述的方法，其特征在于，所述基于二分图最大匹配算法确定初始模型M
0中标准卷积层e适合被替换成高效卷积层具体包括：

从初始模型M
0中寻找一个包含Ng个组的组卷积层是的层内连接的重要性变化最小；

所述重要性为每个连接中全部权重的L2范数；

根据权利要求1或2所述的方法，其特征在于，所述损失值包括：

其中，Lw为损失值。

一种卷积神经网络的优化装置，其特征在于，所述装置包括：
获取单元，用于获得预训练模型M；
训练单元，用于将预训练模型M在指定领域的数...

【专利技术属性】
技术研发人员：赵睿哲，
申请(专利权)人：深圳鲲云信息科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人