用于深度神经网络的经预算和经简化的训练的方法和系统技术方案

技术编号：22392513 阅读：35 留言：0更新日期：2019-10-29 07:59

公开了一种用于深度神经网络（DNN）的经预算和经简化的训练的方法和系统。在一个示例中，训练器用于使用从经向下采样的训练图像导出的多个训练子图像来训练DNN。测试器用于使用从经向下采样的测试图像导出的多个测试子图像来测试经训练的DNN。在另一示例中，在具有位于卷积神经网络（CNN）与长‑短时间存储器（LSTM）之间的局部注意力机制的递归深度Q网络（RDQN）中，由CNN从输入图像生成多个特征映射。由局部注意力机制通过选择所生成的特征映射的子集来将硬注意力应用到所生成的多个特征映射。由局部注意力机制通过向所生成的特征映射的所选子集提供权重以获得加权的特征映射，来将软注意力应用到所生成的特征映射的所选子集。将加权的特征映射存储在LSTM中。基于存储在LSTM中的加权的特征映射来针对不同动作计算Q值。

Budget and simplified training methods and systems for deep neural networks

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于深度神经网络的经预算和经简化的训练的方法和系统
本专利技术的实施例属于数据处理领域，包括图像处理、图形处理和机器学习。更具体地，本专利技术的实施例涉及用于深度神经网络（DNN）的经预算的（budgeted）和经简化的训练的方法和系统。
技术介绍
当前并行图形数据处理包括被开发成对图形数据执行特定操作（诸如例如线性内插、曲面细分、光栅化、纹理映射、深度测试等）的系统和方法。传统上，图形处理器使用固定功能计算单元来处理图形数据；然而，最近，已经使图形处理器的部分可编程，使此类处理器能够支持用于处理顶点和片段数据的各种各样的操作。为了进一步增加性能，图形处理器通常实现诸如尝试并行处理遍及图形流水线的不同部分的尽可能多的图形数据的流水线操作的处理技术。具有单指令多线程（SIMT）架构的并行图形处理器被设计成最大化图形流水线中的并行处理的量。在SIMT架构中，并行线程组尝试尽可能经常地一起同步执行程序指令以增加处理效率。用于SIMT架构的软件和硬件的一般概述可以在ShaneCook的CUDAProgramming，第3章，第37-51页（2013）中找到。机器学习已经在解决许多种任务方面取得了成功。在训练和使用机器学习算法（例如，神经网络）时出现的计算本身自然地适用于有效的并行实现。因此，诸如通用图形处理单元（GPGPU）之类的并行处理器已经在深度神经网络的实际实现中起到了重要作用。具有单指令、多线程（SIMT）架构的并行图形处理器被设计成最大化图形流水线中的并行处理的量。在SIMT架构中，并行线程组尝试尽可能经常地一起同步执行程序指令以增加处理效率。并行机器学...

【技术保护点】
1.一种用于深度神经网络（DNN）的方法，包括：将训练图像亚采样成多个训练子图像；随机选择多个子图像；以及利用随机选择的多个训练子图像来训练DNN，以获得训练结果。

【技术特征摘要】
【国外来华专利技术】1.一种用于深度神经网络（DNN）的方法，包括：将训练图像亚采样成多个训练子图像；随机选择多个子图像；以及利用随机选择的多个训练子图像来训练DNN，以获得训练结果。2.如权利要求1所述的方法，进一步包括：将测试图像亚采样成多个测试子图像；随机选择第一测试子图像；以及利用随机选择的第一测试图像来测试经训练的DNN，以获得第一测试结果。3.如权利要求2所述的方法，进一步包括：随机选择第二测试子图像；利用随机选择的第二测试图像来测试经训练的DNN，以获得第二测试结果；以及将所述第一测试结果和所述第二测试结果进行组合，以便选择所述第一测试结果和所述第二测试结果中的一个作为最终结果。4.如权利要求1所述的方法，其中每个训练子图像具有比训练图像更小的分辨率。5.如权利要求2所述的方法，其中每个测试子图像具有比测试图像更小的分辨率。6.一种用于服务器的系统，包括：处理核，其具有深度神经网络（DNN）；I/O控制器中枢，其耦合到所述处理核，并且用于为所述处理核提供网络、数据存储和DNN访问；以及图形处理器，其耦合到所述I/O控制器中枢，并且用于使用从经向下采样的训练图像导出的多个训练子图像来训练DNN，以及使用从经向下采样的测试图像导出的多个测试子图像来测试经训练的DNN。7.如权利要求6所述的系统，其中所述图形处理器用于将测试图像亚采样成多个测试子图像，随机选择第一测试子图像，以及利用随机选择的第一测试图像来测试经训练的DNN，以获得第一测试结果。8.如权利要求7所述的系统，其中所述图形处理器用于随机选择第二测试子图像，利用随机选择的第二测试图像来测试经训练的DNN，以获得第二测试结果，以及将所述第一测试结果和所述第二测试结果进行组合，以便选择所述第一测试结果和所述第二测试结果中的一个作为最终结果。9.如权利要求6所述的系统，其中每个训练子图像具有比训练图像更小的分辨率。10.如权利要求7所述的系统，其中每个测试子图像具有比测试图像更小的分辨率。11.在具有位于卷积神经网络（CNN）与长-短时间存储器（LSTM）之间的局部注意力机制的递归深度Q网络（RD...

【专利技术属性】
技术研发人员：郭怡文，侯宇清，姚安邦，蔡东琪，王立彬，徐琳，胡平，王山东，程文华，陈玉荣，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人