The invention relates to a distributed deep learning system based on Docker container, and the construction method and working method thereof, which includes a server host, the first distributed deep learning platform, and the second distributed deep learning platform. The invention uses the Docker technology to carry multiple distributed depth learning systems on a server host. The improvement of the invention is mainly embodied in three aspects: one is the whole system can be implemented on a server host, do not need to use the multi host, save the cost; two is the container through the template image creation, the process is simple, do not need to repeat construction, avoid bad waste of time; three is the CPU of the server can maximize the use of the hardware resources are no longer waste.
【技术实现步骤摘要】
一种基于Docker容器的分布式深度学习系统及其搭建方法、工作方法
本专利技术涉及一种基于Docker容器的分布式深度学习系统及其搭建方法、工作方法,属于云计算虚拟化
技术介绍
从本质上讲,云计算是指用户终端通过远程连接获取存储、计算、数据库等计算资源。虚拟化技术是云计算技术的核心组成之一,是将各种计算及存储资源充分整合和高效利用的关键技术,包括服务器虚拟化和桌面虚拟化。Docker作为新兴的轻量级虚拟化技术,与传统的VM相比,它更轻量,启动速度更快,单台硬件上可同时跑成百上千个容器,所以非常适合在业务高峰期通过启动大量容器进行横向扩展。目前深度学习平台多用单机处理,很少用到分布式的深度学习平台,首先分布式深度学习平台搭建比较复杂,所需要的硬件配置较多。但相较于单机的深度学习平台,分布式深度学习平台能更快的进行运算。目前市面上这些技术普遍存在如下问题:1)利用服务器做单机深度学习平台,CPU计算量足够,但是不能完全利用,造成资源浪费。2)分布式深度学习平台,需要多台主机搭建,每台主机的CPU计算量有限,想要搭建大规模平台所需主机数量大,费用高。3)分布式深度学习平台搭建过程繁琐,采用主机搭建方法,每台主机都需进行相同步骤。但重复相同步骤过程中会出现不同的错误,导致搭建进程缓慢。中国专利文献CN106657248A公开了一种基于Docker容器的网络负载均衡系统及其搭建方法、工作方法。采用Docker容器技术作为本系统的基础技术,利用Docker容器节约硬件资源能在一台服务器主机中创建大量容器的特点,在一台服务器主机上实现整套网络负载均衡系统;利用 ...
【技术保护点】
一种基于Docker容器的分布式深度学习系统,其特征在于,包括一台宿主机及多个Docker容器,宿主机上安装有Hadoop分布式平台、Spark,宿主机上还安装有第一分布式深度学习平台或第二分布式深度学习平台;每个Docker容器上安装有Hadoop分布式平台、Spark,每个Docker容器上还安装有第一分布式深度学习平台或第二分布式深度学习平台。
【技术特征摘要】
1.一种基于Docker容器的分布式深度学习系统,其特征在于,包括一台宿主机及多个Docker容器,宿主机上安装有Hadoop分布式平台、Spark,宿主机上还安装有第一分布式深度学习平台或第二分布式深度学习平台;每个Docker容器上安装有Hadoop分布式平台、Spark,每个Docker容器上还安装有第一分布式深度学习平台或第二分布式深度学习平台。2.根据权利要求1所述一种基于Docker容器的分布式深度学习系统,其特征在于,所述宿主机的型号为DELLPowerEdgeR730,所述第一分布式深度学习平台的型号为CaffeOnSpark,所述第二分布式深度学习平台的型号为TensorFlowOnSpark。3.根据权利要求1或2所述的一种基于Docker容器的分布式深度学习系统的搭建方法,其特征在于,具体步骤包括:(1)准备宿主机,宿主机即服务器主机;(2)在宿主机根目录下建立Docker容器所需的主文件夹,主文件夹包括能够挂载的文件夹,用于保存进行深度学习所需要的训练模型、训练数据集、测试数据集、代码及配置文件;(3)在宿主机中安装Hadoop分布式平台、Spark;测试Hadoop分布式平台、Spark是否安装成功;如果安装成功,则进入步骤(4),否则,重复执行步骤(3);(4)在宿主机中安装...
【专利技术属性】
技术研发人员:张舒,吴大雷,张秀真,
申请(专利权)人:济南浚达信息技术有限公司,
类型:发明
国别省市:山东,37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。