服务器上深度神经网络划分制造技术

技术编号：17310191 阅读：56 留言：0更新日期：2018-02-19 10:04

提供了一种用于在服务器部件上实现深度神经网络的方法，该服务器部件包括主机部件和耦合到主机部件的硬件加速部件，主机部件包括CPU。深度神经网络包括多个层。该方法包括将深度神经网络划分成第一片段和第二片段，第一片段包括多个层的第一子集，第二片段包括多个层的第二子集，配置主机部件来实现第一片段，并配置硬件加速部件来实现第二片段。

Deep neural network partition on server

A method for realizing deep neural network on server components is provided, which includes host components and hardware acceleration components coupled to main components. Host components include CPU. The deep neural network consists of multiple layers. The method includes the depth of the neural network is divided into the first segment and the second segment, the first segment includes a first subset of the plurality of layers, second fragments including second subset of the plurality of layers, configure the host components to achieve the first fragment, and configure the hardware accelerator to achieve second fragments.

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】服务器上深度神经网络划分
技术介绍
计算行业寻求提高软件驱动的计算设备的速度和效率。软件驱动的计算设备采用以传统的时间方式处理机器可读指令的一个或多个中央处理单元(CPU)。硬件加速部件(例如，现场可编程门阵列(FPGA))已用于补充由软件驱动的计算设备执行的处理。
技术实现思路
根据第一方面，提供了一种用于在服务器部件上实现深度神经网络的方法，所述服务器部件包括具有CPU的主机部件和耦合到所述主机部件的硬件加速部件。所述深度神经网络包括多个层。所述方法包括：将所述深度神经网络划分为第一片段和第二片段，所述第一片段包括所述多个层的第一子集，所述第二片段包括所述多个层的第二子集；配置所述主机部件来实现第一片段；并且配置所述硬件加速部件来实现第二片段。根据第二方面，提供了一种服务器部件，被配置为实现包括多个层的深度神经网络。该服务器部件包括具有CPU的主机部件，耦合到主机部件的硬件加速部件，以及控制器部件。控制器部件被配置为将深度神经网络划分为第一片段和第二片段，第一片段包括多个层的第一子集，第二片段包括多个层的第二子集，配置主机部件来实现第一片段，并配置硬件加速部件来实现第二片段。根据第三方面，提供了一种用于在服务器部件上实现深度神经网络的方法，所述服务器部件包括具有CPU的主机部件和耦合到所述主机部件的硬件加速部件，所述深度神经网络包括多个线性层和多个卷积层。该方法包括配置主机部件来实现线性层，并配置硬件加速部件来实现卷积层。上面概括的功能可以表现在各种类型的系统、设备、部件、方法、计算机可读存储介质、数据结构、图形用户界面演示、制品等中。提供本
技术实现思路
是为了以...
服务器上深度神经网络划分

【技术保护点】
一种用于在服务器部件上实现深度神经网络的方法，所述服务器部件包括主机部件和耦合到所述主机部件的硬件加速部件，所述主机部件包括CPU，所述深度神经网络包括多个层，所述方法包括：将所述深度神经网络划分为第一片段和第二片段，所述第一片段包括所述多个层的第一子集，所述第二片段包括所述多个层的第二子集；配置所述主机部件以实现所述第一片段；以及配置所述硬件加速部件以实现所述第二片段。

【技术特征摘要】
【国外来华专利技术】2015.06.29 US 14/754,3841.一种用于在服务器部件上实现深度神经网络的方法，所述服务器部件包括主机部件和耦合到所述主机部件的硬件加速部件，所述主机部件包括CPU，所述深度神经网络包括多个层，所述方法包括：将所述深度神经网络划分为第一片段和第二片段，所述第一片段包括所述多个层的第一子集，所述第二片段包括所述多个层的第二子集；配置所述主机部件以实现所述第一片段；以及配置所述硬件加速部件以实现所述第二片段。2.根据权利要求1所述的方法，其中：所述多个层包括线性层和卷积层；所述第一片段包括所述线性层；并且所述第二片段包括所述卷积层。3.根据权利要求1所述的方法，其中：所述多个层包括线性层和多个卷积层；所述第一片段包括所述线性层；以及所述第二片段包括所述多个卷积层。4.根据权利要求3所述的方法，其中所述多个层还包括非线性函数和池化层，并且所述第二片段包括所述非线性函数和池化层。5.根据权利要求1所述的方法，其中：所述多个层包括具有第一存储器带宽要求的第一层和具有第二存储器带宽要求的第二层；所述第一片段包括所述第一层；并且所述第二片段包括所述第二层。6.根据权利要求1所述的方法，其中所述硬件加速部件包括以下中的一个或多个：现场可编程门阵列设备、大规模并行处理器阵列设备、图形处理单元以及专用集成电路。7.根据权利要求1所述的方法，其中所述...

【专利技术属性】
技术研发人员：E·钟，K·施特劳斯，K·奥恰洛夫，JY·金，O·鲁瓦瑟，
申请(专利权)人：微软技术许可有限责任公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人