快乐学习
前程无忧、中华英才非你莫属!

Day5-Docker入门教程-数据管理

生产环境中使用Docker的过程中,往往需要对数据进行持久化,或者需要在多个容器之间进行数据共享,这必然涉及容器的数据管理操作。
容器中管理数据主要有两种方式:
·数据卷(Data Volumes):容器内数据直接映射到本地主机环境;
·数据卷容器(Data Volume Containers):使用特定容器维护数据卷。
本章将首先介绍如何在容器内创建数据卷,并且把本地的目录或文件挂载到容器内的数据卷中。接下来,会介绍如何使用数据卷容器在容器和主机、容器和容器之间共享数据,并实现数据的备份和恢复。
6.1 数据卷
数据卷是一个可供容器使用的特殊目录,它将主机操作系统目录直接映射进容器,类似于Linux中的mount操作。
数据卷可以提供很多有用的特性,如下所示:
·数据卷可以在容器之间共享和重用,容器间传递数据将变得高效方便;
·对数据卷内数据的修改会立马生效,无论是容器内操作还是本地操作;
·对数据卷的更新不会影响镜像,解耦了应用和数据;
·卷会一直存在,直到没有容器使用,可以安全地卸载它。
 
1.在容器内创建一个数据卷
在用docker run命令的时候,使用-v标记可以在容器内创建一个数据卷。多次重复使用-v标记可以创建多个数据卷。
下面使用training/webapp镜像创建一个web容器,并创建一个数据卷挂载到容器的/webapp目录:
2.挂载一个主机目录作为数据卷
使用-v标记也可以指定挂载一个本地的已有目录到容器中去作为数据卷(推荐方式)。
$ docker run -d -P –name web -v /src/webapp:/opt/webapp training/webapp python app.py
上面的命令加载主机的/src/webapp目录到容器的/opt/webapp目录。
这个功能在进行测试的时候十分方便,比如用户可以将一些程序或数据放到本地目录中,然后在容器内运行和使用。另外,本地目录的路径必须是绝对路径,如果目录不存在Docker,会自动创建。
这样就可以记录在容器输入过的命令历史了。
 
注意
如果直接挂载一个文件到容器,使用文件编辑工具,包括vi或者sed–in-place的时候,可能会造成文件inode的改变,从Docker 1.1.0起,这会导致报错误信息。所以推荐的方式是直接挂载文件所在的目录。

6.2 数据卷容器
 
如果用户需要在多个容器之间共享一些持续更新的数据,最简单的方式是使用数据卷容器。数据卷容器也是一个容器,但是它的目的是专门用来提供数据卷供其他容器挂载。
首先,创建一个数据卷容器dbdata,并在其中创建一个数据卷挂载到/dbdata:
可以多次使用–volumes-from参数来从多个容器挂载多个数据卷。还可以从其他已经挂载了容器卷的容器来挂载数据卷。
 
注意
使用–volumes-from参数所挂载数据卷的容器自身并不需要保持在运行状态。
如果删除了挂载的容器(包括dbdata、db1和db2),数据卷并不会被自动删除。如果要删除一个数据卷,必须在删除最后一个还挂载着它的容器时显式使用docker rm-v命令来指定同时删除关联的容器。
使用数据卷容器可以让用户在容器之间自由地升级和移动数据卷。具体的操作将在下一节中讲解。
 

 
 
6.3 利用数据卷容器来迁移数据
 
可以利用数据卷容器对其中的数据卷进行备份、恢复,以实现数据的迁移。下面介绍这两个操作。
 
1.备份
使用下面的命令来备份dbdata数据卷容器内的数据卷:
这个命令稍微有点复杂,具体分析一下。首先利用ubuntu镜像创建了一个容器worker。
使用–volumes-from dbdata参数来让worker容器挂载dbdata容器的数据卷(即dbdata数据卷);
使用-v$(pwd):/backup参数来挂载本地的当前目录到worker容器的/backup目录。
worker容器启动后,使用了tar cvf/backup/backup.tar/dbdata命令来将/dbdata下内容备份为容器内的/backup/backup.tar,即宿主主机当前目录下的backup.tar。
 
2.恢复
 
如果要将数据恢复到一个容器,可以按照下面的步骤操作。首先创建一个带有数据卷的容器dbdata2:
$ docker run -v /dbdata –name dbdata2 ubuntu /bin/bash
然后创建另一个新的容器,挂载dbdata2的容器,并使用untar解压备份文件到所挂载的容器卷中:

6.4 本章小结
 
数据是最宝贵的资源。Docker在设计上考虑到了这点,为数据管理提供了充分的操作支持。
本章介绍了通过数据卷和数据卷容器对容器内数据进行共享、备份和恢复等操作,通过这些机制,即使容器在运行中出现故障,用户也不必担心数据发生丢失,只需要快速地重新创建容器即可。
在生产环境中,笔者推荐在使用数据卷或数据卷容器之外,定期将主机的本地数据进行备份,或者使用支持容错的存储系统,包括RAID或分布式文件系统如Ceph、GPFS、HDFS等。
来源:Docker技术入门与实战 (第2版)   作者:杨保华 戴王剑 曹亚仑
打赏

未经允许不得转载:同乐学堂 » Day5-Docker入门教程-数据管理

分享到:更多 ()

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

特别的技术,给特别的你!

联系QQ:1071235258QQ群:226134712
error: Sorry,暂时内容不可复制!