docker-compose 可以方便组合多个 docker 容器服务, 但是, 当容器服务之间存在依赖关系时, docker-compose 并不能保证服务的启动顺序.
docker-compose 可以方便组合多个 docker 容器服务, 但是, 当容器服务之间存在依赖关系时, docker-compose 并不能保证服务的启动顺序.

docker-compose 中的 depends_on 配置是容器的启动顺序, 并不是容器中服务的启动顺序.


首先, 我们构造一个示例, 来演示 docker-compose 带来的问题. docker-compose.yml 文件如下:

version: '2'services: web:  image: ubuntu:14.04  depends_on:   - web  command: nc -z database 3306 database:  image: ubuntu:14.04  command: >   /bin/bash -c '   sleep 5;   echo "sleep over";   nc -lk 3306;   '

启动后, 可以发现, 确实是先启动 database, 后启动 web, 但是 database 中的服务是在大约 5 秒后才完成的, 所以导致 web 的启动失败.

$ docker-compose upCreating tmp_database_1 ... doneCreating tmp_database_1 ...Creating tmp_web_1   ... doneAttaching to tmp_database_1, tmp_web_1tmp_web_1 exited with code 1database_1 | sleep over

问题解决方式 1.0

修改 web 的启动脚本, 等待 database 的端口通了之后再启动服务

version: '2'services: web:  image: ubuntu:14.04  depends_on:   - database  command: >   /bin/bash -c '   while ! nc -z database 3306;   do    echo "wait for database";    sleep 1;   done;   echo "database is ready!";   echo "start web service here";   ' database:  image: ubuntu:14.04  command: >   /bin/bash -c '   sleep 5;   echo "sleep over";   nc -lk 3306;   '


$ docker-compose upCreating tmp_database_1 ... doneCreating tmp_database_1 ...Creating tmp_web_1   ... doneAttaching to tmp_database_1, tmp_web_1web_1    | wait for databaseweb_1    | wait for databaseweb_1    | wait for databaseweb_1    | wait for databaseweb_1    | wait for databasedatabase_1 | sleep overweb_1    | database is ready!web_1    | start web service heretmp_web_1 exited with code 0

web 会在 database 启动完成, 端口通了之后才启动.

问题解决方式 2.0

上面的解决方式虽然能够解决问题, 但是在 yaml 中直接插入脚本不好维护, 也容易出错. 如果有多个依赖, 或者多层依赖的时候, 复杂度会直线上升.

所以, 要封装一个 entrypoint.sh 脚本, 可以接受启动命令, 以及需要等待的服务和端口. 脚本内容如下:

#!/bin/bash#set -x#******************************************************************************# @file  : entrypoint.sh# @author : wangyubin# @date  : 2018-08- 1 10:18:43## @brief  : entry point for manage service start order# history : init#******************************************************************************: ${SLEEP_SECOND:=2}wait_for() {  echo Waiting for $1 to listen on $2...  while ! nc -z $1 $2; do echo waiting...; sleep $SLEEP_SECOND; done}declare DEPENDSdeclare CMDwhile getopts "d:c:" argdo  case $arg in    d)      DEPENDS=$OPTARG      ;;    c)      CMD=$OPTARG      ;;    ?)      echo "unkonw argument"      exit 1      ;;  esacdonefor var in ${DEPENDS//,/ }do  host=${var%:*}  port=${var#*:}  wait_for $host $portdoneeval $CMD

这个脚本有 2 个参数, -d 需要等待的服务和端口, -c 等待的服务和端口启动之后, 自己的启动命令

修改 docker-compose.yml, 使用 entrypoint.sh 脚本来控制启动顺序.

version: '2'services: web:  image: ubuntu:14.04  depends_on:   - database  volumes:   - "./entrypoint.sh:/entrypoint.sh"  entrypoint: /entrypoint.sh -d database:3306 -c 'echo "start web service here"'; database:  image: ubuntu:14.04  command: >   /bin/bash -c '   sleep 5;   echo "sleep over";   nc -lk 3306;   '

实际使用中, 也可以将 entrypoint.sh 打包到发布的镜像之中, 不用通过 volumes 配置来加载 entrypoint.sh 脚本.


$ docker-compose upStarting tmp_database_1 ... doneStarting tmp_web_1 ... doneAttaching to tmp_database_1, tmp_web_1web_1    | Waiting for database to listen on 3306...web_1    | waiting...web_1    | waiting...web_1    | waiting...database_1 | sleep overweb_1    | start web service heretmp_web_1 exited with code 0



使用上面的 entrypoint.sh 脚本, 也可以依赖多个服务和端口, -d 参数后面的多个服务和端口用逗号(,)隔开.

version: '2'services: web:  image: ubuntu:14.04  depends_on:   - mysql   - postgresql  volumes:   - "./entrypoint.sh:/entrypoint.sh"  entrypoint: /entrypoint.sh -d mysql:3306,postgresql:5432 -c 'echo "start web service here"'; mysql:  image: ubuntu:14.04  command: >   /bin/bash -c '   sleep 4;   echo "sleep over";   nc -lk 3306;   ' postgresql:  image: ubuntu:14.04  command: >   /bin/bash -c '   sleep 8;   echo "sleep over";   nc -lk 5432;   '



每次尝试连接的等待时间可以通过 环境变量 SLEEP_SECOND 来配置, 默认 2 秒 下面的配置等待时间设置为 4 秒, 就会每隔 4 秒才去尝试 mysql 服务时候可连接.

version: '2'services: web:  image: ubuntu:14.04  environment:   SLEEP_SECOND: 4  depends_on:   - mysql  volumes:   - "./entrypoint.sh:/entrypoint.sh"  entrypoint: /entrypoint.sh -d mysql:3306 'echo "start web service here"'; mysql:  image: ubuntu:14.04  command: >   /bin/bash -c '   sleep 4;   echo "sleep over";   nc -lk 3306;   '
