数据训练方法及装置、存储介质、电子装置制造方法及图纸

技术编号：21572703 阅读：30 留言：0更新日期：2019-07-10 15:42

本发明专利技术提供了一种数据训练方法及装置、存储介质、电子装置，其中，该方法包括：确定样本数据和可用的集群资源；将总训练模型拆分为多个子模型；使用集群资源在多个子模型上并行训练样本数据。通过本发明专利技术，解决了相关技术中训练样本数据效率过低的技术问题。

Data training methods and devices, storage media and electronic devices

全部详细技术资料下载

【技术实现步骤摘要】
数据训练方法及装置、存储介质、电子装置
本专利技术涉及人工智能领域，具体而言，涉及一种数据训练方法及装置、存储介质、电子装置。
技术介绍
相关技术中，深度学习模型(DeepLearningModels)的训练需要消耗庞大的计算力，完成一次训练的耗时经常达到数天甚至数月。因此，为了加快深度学习模型的训练，通常采用增加处理设备，优化训练模型来实现，但第一种会加大网络资源的投入量，第二种在短时间内也很难实现。针对相关技术中存在的上述问题，目前尚未发现有效的解决方案。
技术实现思路
本专利技术实施例提供了一种数据训练方法及装置、存储介质、电子装置。根据本专利技术的一个实施例，提供了一种数据训练方法，包括：确定样本数据和可用的集群资源；将总训练模型拆分为多个子模型；使用所述集群资源在所述多个子模型上并行训练所述样本数据。根据本专利技术的另一个实施例，提供了一种数据训练装置，包括：确定模块，用于确定样本数据和可用的集群资源；拆分模块，用于将总训练模型拆分为多个子模型；训练模块，用于使用所述集群资源在所述多个子模型上并行训练所述样本数据。根据本专利技术的又一个实施例，还提供了一种存储介质，所述存储介质中存储有计算机程序，其中，所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。根据本专利技术的又一个实施例，还提供了一种电子装置，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。通过本专利技术，通过将总训练模型拆分为多个子模型，然后在多个子模型上并行训练样本数据，解决了相关技术中训练样本数据效率...

【技术保护点】
1.一种数据训练方法，其特征在于，包括：确定样本数据和可用的集群资源；将总训练模型拆分为多个子模型；使用所述集群资源在所述多个子模型上并行训练所述样本数据。

【技术特征摘要】
1.一种数据训练方法，其特征在于，包括：确定样本数据和可用的集群资源；将总训练模型拆分为多个子模型；使用所述集群资源在所述多个子模型上并行训练所述样本数据。2.根据权利要求1所述的方法，其特征在于，将总训练模型拆分为多个子模型包括以下至少之一：将所述总训练模型拆分为多个第一子模型，其中，所述多个第一子模型并行连接；将所述总训练模型拆分为多个第二子模型，其中，所述多个第二子模型串行连接。3.根据权利要求2所述的方法，其特征在于，将所述总训练模型拆分为多个第一子模型：根据算子的类型将所述总训练模型拆分为多个第一子模型，其中，所述总训练模型由一个或多个所述算子组成。4.根据权利要求3所述的方法，其特征在于，根据算子的类型将所述总训练模型拆分为多个第一子模型包括：获取所述算子的类型，其中，所述算子的类型包括：稠密算子；将所述稠密算子拆分为N个输入为(B/N)×I的子稠密算子，其中，B为第一批维度，所述第一批维度的大小与指示的批尺寸的大小相同，I为所述稠密算子的输入向量的维度，N为大于1的整数，其中，所述第一子模型包括：所述子稠密算子。5.根据权利要求3所述的方法，其特征在于，根据算子的类型将所述总训练模型拆分为多个第一子模型包括：获取所述算子的类型，其中，所述算子的类型包括：稠密算子；将所述稠密算子拆分为N个计算参数为I×(O/N)的子稠密算子，其中，所述子稠密算子与所述稠密算子的输入张量相同，O为所述稠密算子的输出向量的维度，I为所述稠密算子的输入向量的维度，N为大于1的整数，其中，所述第一子模型包括：所述子稠密算子。6.根据权利要求3所述的方法，其特征在于，根据算子的类型将所述总训练模型拆分为多个第一子模型包括：获取所述算子的类型，其中，所述算子的类型包括：卷积算子；将所述卷积算子拆分为N个子卷积算子，其中，所述子卷积算子的输入张量为所述卷积算子的输入张量相同；其中，所述第一子模型包括：所述子卷积算子。7.根据权利要求2所述的方法，其特征在于，将所述总训练模型拆分为多个第二子模型包括：解析所述总训...

【专利技术属性】
技术研发人员：韩炳涛，
申请(专利权)人：中兴通讯股份有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人