深度神经网络模型的训练方法和设备技术

技术编号：12124974 阅读：104 留言：0更新日期：2015-09-25 12:56

本发明专利技术的实施方式提供了一种深度神经网络模型的训练方法。该方法包括：当训练数据的大小发生改变时，针对改变后的训练数据，分别计算所述改变后的训练数据在预设的至少两个候选训练方案中的训练耗时；从预设的至少两个候选训练方案中选取训练耗时最小的训练方案作为所述改变后的训练数据的最佳训练方案；将所述改变后的训练数据在所述最佳训练方案中进行深度神经网络模型训练。本发明专利技术的方法可以解决现有技术中由于固定地采用某一种训练方案不适用于所有大小的训练数据而导致训练速度变慢的问题。此外，本发明专利技术的另一方面提供了一种深度神经网络模型的训练设备。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术的实施方式涉及计算机应用领域，更具体地，本专利技术的实施方式涉及深度神经网络模型的训练方法和设备。
技术介绍
本部分旨在为权利要求书中陈述的本专利技术的实施方式提供背景或上下文。此处的描述可包括可以探宄的概念，但不一定是之前已经想到或者已经探宄的概念。因此，除非在此指出，否则在本部分中描述的内容对于本申请的说明书和权利要求书而言不是现有技术，并且并不因为包括在本部分中就承认是现有技术。目前，除了可以采用单个处理器进行深度神经网络模型的训练之外，为了加快训练速度，还可以采用多个处理器进行模型训练。并且，现有技术也提供了多种采用多个处理器进行模型训练的训练方案，例如，基于数据并行的多处理器方案以及基于数据并行与模型并行混合的多处理器方案等。另外，在模型训练中，为了使最终训练出的模型具有较高的精准度，需要通过迭代处理的方式对模型参数进行多次更新，每一次更新过程即为一次训练过程。例如，在对深度神经网络模型进行训练时，以一次迭代处理过程为例，先将训练数据从深度神经网络模型的首层到末层逐层地进行正向处理，并在正向处理结束后获得误差信息；然后将误差信息从深度神经网络模型的末层到首层逐层地进行反向处理，并在反向处理过程中获得需要进行模型参数更新的层的模型参数修正量；最后根据模型参数修正量对需要进行模型参数更新的层的模型参数进行更新。
技术实现思路
但是，本专利技术人在研宄过程中发现，在现有技术中，当进行模型训练时，会根据上一次迭代处理后模型的精准度适当地调整下一次迭代处理时训练数据的大小。也就是说，在每一次迭代处...
深度神经网络模型的训练方法和设备

【技术保护点】
一种方法，包括：当训练数据的大小发生改变时，针对改变后的训练数据，分别计算所述改变后的训练数据在预设的至少两个候选训练方案中的训练耗时；从预设的至少两个候选训练方案中选取训练耗时最小的训练方案作为所述改变后的训练数据的最佳训练方案；将所述改变后的训练数据在所述最佳训练方案中进行模型训练。

【技术特征摘要】

【专利技术属性】
技术研发人员：陈海波，吴伟，李晓燕，
申请(专利权)人：杭州朗和科技有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人