一种基于ONNX面向Caffe2训练的深度学习模型自动转换方法技术

技术编号：32753090 阅读：35 留言：0更新日期：2022-03-23 18:48

本发明专利技术公开一种基于ONNX面向Caffe2训练的深度学习模型自动转换方法，包括以下步骤：S1、ONNX文件向Caffe2文件的映射，得到Caffe2格式的前向传播网络，S2、根据S1中获得的前向传播网络的信息，自动生成求梯度算子，得到反向传播网络，S3、根据满足生成完整反向传播网络的需要，设计用户配置信息格式，将配置信息融入上步骤的模型定义文件中。本发明专利技术可以自动产生包括正向传播神经网络、反向传播神经网络、运行控制块和辅助算子的模型文件，从而进行训练任务。行训练任务。行训练任务。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于ONNX面向Caffe2训练的深度学习模型自动转换方法

[0001]本专利技术涉及一种基于ONNX面向Caffe2训练的深度学习模型自动转换方法，属于深度学习

技术介绍

[0002]近年来，随着深度学习技术的发展，各种深度学习框架不断涌现，这些框架各有特点，并没有哪一家成为事实上的标准。在每个框架中，各自有其使用的模型定义格式，彼此之间并不兼容，若想从一个框架移植到另一个框架，常常需要重新编程，这就需要了解目标框架的编程模式，移植门槛较高。
[0003]多家深度学习框架厂商联合推出了ONNX，成为事实上的标准。目前，主流框架大多支持将深度学习模型导出为ONNX格式，这为模型移植打下了一个基础。但ONNX模型仅支持推理，不支持训练，从训练的角度看，ONNX模型缺失的信息很多，需要进行扩展和补充。
[0004]ONNX是一个用于表示深度学习模型的标准，可使模型在不同框架之间进行转移，它由三部分组成：可扩展计算图模型的定义、标准数据类型的定义、内置运算符的定义；
[0005]基本格式是Model、Graph、Node三级定义，简略描述如下：
[0006]Model
[0007][0008]Graph
[0009][0010]Node
[0011][0012][0013]Caffe2是2017年发布的一款轻量级和模块化的深度学习框架，它除了提供python的编程接口之外，还提供了直接运行模型定义文件的方式进行训练，它的基本格式为Plan、Net和Ope...

【技术保护点】

【技术特征摘要】
1.一种基于ONNX面向Caffe2训练的深度学习模型自动转换方法，其特征在于，包括以下步骤：S1、ONNX文件向Caffe2文件的映射，得到Caffe2格式的前向传播网络，具体包括：计算图模型映射：Model到Plan的映射、Graph到Net的映射以及Node到Operator的映射；数据类型映射：FLOAT到float的映射、INT到int的映射、STRING到string的映射、Graph到net的映射、FLOATs到floats的映射、INTs到ints的映射、STRINGs到strings的映射以及Graphs到nets的映射；S...

【专利技术属性】
技术研发人员：彭超，刘鑫，刘沙，陈德训，黄则强，高捷，王宜鹏，
申请(专利权)人：无锡江南计算技术研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人