一种基于Docker容器的分布式深度学习系统及其搭建方法、工作方法技术方案

技术编号：16755236 阅读：19 留言：0更新日期：2017-12-09 01:54

本发明专利技术涉及一种基于Docker容器的分布式深度学习系统及其搭建方法、工作方法，包括一台服务器主机、第一分布式深度学习平台、第二分布式深度学习平台。本发明专利技术利用Docker的容器化技术，在一台服务器主机上同时搭载多个分布式深度学习系统。本发明专利技术的改进主要体现在三个方面：一是整个系统可以在一台服务器主机上实现，不需要用多主机，节省成本；二是容器通过模板镜像创建，过程简单，不需要重复搭建，避免出现错误浪费时间；三是服务器的CPU能最大化的利用，不再浪费硬件资源。

A distributed deep learning system based on Docker container and its construction methods and working methods

The invention relates to a distributed deep learning system based on Docker container, and the construction method and working method thereof, which includes a server host, the first distributed deep learning platform, and the second distributed deep learning platform. The invention uses the Docker technology to carry multiple distributed depth learning systems on a server host. The improvement of the invention is mainly embodied in three aspects: one is the whole system can be implemented on a server host, do not need to use the multi host, save the cost; two is the container through the template image creation, the process is simple, do not need to repeat construction, avoid bad waste of time; three is the CPU of the server can maximize the use of the hardware resources are no longer waste.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于Docker容器的分布式深度学习系统及其搭建方法、工作方法
本专利技术涉及一种基于Docker容器的分布式深度学习系统及其搭建方法、工作方法，属于云计算虚拟化

技术介绍
从本质上讲，云计算是指用户终端通过远程连接获取存储、计算、数据库等计算资源。虚拟化技术是云计算技术的核心组成之一，是将各种计算及存储资源充分整合和高效利用的关键技术，包括服务器虚拟化和桌面虚拟化。Docker作为新兴的轻量级虚拟化技术，与传统的VM相比，它更轻量，启动速度更快，单台硬件上可同时跑成百上千个容器，所以非常适合在业务高峰期通过启动大量容器进行横向扩展。目前深度学习平台多用单机处理，很少用到分布式的深度学习平台，首先分布式深度学习平台搭建比较复杂，所需要的硬件配置较多。但相较于单机的深度学习平台，分布式深度学习平台能更快的进行运算。目前市面上这些技术普遍存在如下问题：1)利用服务器做单机深度学习平台，CPU计算量足够，但是不能完全利用，造成资源浪费。2)分布式深度学习平台，需要多台主机搭建，每台主机的CPU计算量有限，想要搭建大规模平台所需主机数量大，费用高。3)分布式深度学习平台搭建过程繁琐，采用主机搭建方法，每台主机都需进行相同步骤。但重复相同步骤过程中会出现不同的错误，导致搭建进程缓慢。中国专利文献CN106657248A公开了一种基于Docker容器的网络负载均衡系统及其搭建方法、工作方法。采用Docker容器技术作为本系统的基础技术，利用Docker容器节约硬件资源能在一台服务器主机中创建大量容器的特点，在一台服务器主机上实现整套网络负载均衡系统；利用...
一种基于Docker容器的分布式深度学习系统及其搭建方法、工作方法

【技术保护点】
一种基于Docker容器的分布式深度学习系统，其特征在于，包括一台宿主机及多个Docker容器，宿主机上安装有Hadoop分布式平台、Spark，宿主机上还安装有第一分布式深度学习平台或第二分布式深度学习平台；每个Docker容器上安装有Hadoop分布式平台、Spark，每个Docker容器上还安装有第一分布式深度学习平台或第二分布式深度学习平台。

【技术特征摘要】
1.一种基于Docker容器的分布式深度学习系统，其特征在于，包括一台宿主机及多个Docker容器，宿主机上安装有Hadoop分布式平台、Spark，宿主机上还安装有第一分布式深度学习平台或第二分布式深度学习平台；每个Docker容器上安装有Hadoop分布式平台、Spark，每个Docker容器上还安装有第一分布式深度学习平台或第二分布式深度学习平台。2.根据权利要求1所述一种基于Docker容器的分布式深度学习系统，其特征在于，所述宿主机的型号为DELLPowerEdgeR730，所述第一分布式深度学习平台的型号为CaffeOnSpark，所述第二分布式深度学习平台的型号为TensorFlowOnSpark。3.根据权利要求1或2所述的一种基于Docker容器的分布式深度学习系统的搭建方法，其特征在于，具体步骤包括：(1)准备宿主机，宿主机即服务器主机；(2)在宿主机根目录下建立Docker容器所需的主文件夹，主文件夹包括能够挂载的文件夹，用于保存进行深度学习所需要的训练模型、训练数据集、测试数据集、代码及配置文件；(3)在宿主机中安装Hadoop分布式平台、Spark；测试Hadoop分布式平台、Spark是否安装成功；如果安装成功，则进入步骤(4)，否则，重复执行步骤(3)；(4)在宿主机中安装...

【专利技术属性】
技术研发人员：张舒，吴大雷，张秀真，
申请(专利权)人：济南浚达信息技术有限公司，
类型：发明
国别省市：山东,37

全部详细技术资料下载我是这个专利的主人