gitlab ci/cd 自动化部署到阿里云 ecs 的核心是通过在 ecs 上配置 gitlab runner 并编写 .gitlab-ci.yml 文件实现。1. 在 ecs 上使用 docker 安装 gitlab runner,并注册到 gitlab 项目,推荐使用 docker executor 以实现环境隔离;2. 在 gitlab 项目中配置 ci/cd 变量,包括 ssh_private_key(文件类型)、ecs_host 和 ecs_user,确保安全访问;3. 编写 .gitlab-ci.yml 文件定义 stages(如 build、deploy),利用 cache 加速构建,artifacts 传递产物,并在 deploy 阶段通过 ssh 安全连接 ecs 执行部署命令;4. 遵循最佳实践:避免使用 root 用户,采用专用用户和最小权限原则,挂载持久化卷保存 runner 配置,限制并发任务数,结合阿里云监控资源使用;5. .gitlab-ci.yml 支持变量注入、条件执行(only/manual)、错误处理(set -e)和 docker 部署流程(build/push/pull)。该方案实现代码提交后自动测试、构建与部署,提升效率与可靠性,且配置文件纳入版本控制,具备高可追溯性,最终形成安全、可控、可维护的自动化流水线。
用 GitLab CI/CD 将项目部署到阿里云 ECS,本质上就是把原来那些手动复制、粘贴、登录服务器、执行命令的繁琐步骤,通过一套预设的自动化流程彻底解放出来。它把代码的提交、测试、构建到最终上线,变成了一个流水线式的自动过程,大大提升了开发效率和部署的可靠性。
解决方案
要实现 GitLab CI/CD 到阿里云 ECS 的自动化部署,核心在于在 ECS 上安装并配置一个 GitLab Runner,并编写一个
.gitlab-ci.yml
文件来定义部署流程。
-
ECS 实例准备与 GitLab Runner 配置
- 确保你的阿里云 ECS 实例可以被 GitLab 访问(通常是出站网络),并且安装了你项目运行所需的环境(如 Node.JS, python, Docker 等)。
- 在 ECS 实例上安装 GitLab Runner。最推荐的方式是使用 Docker 安装,因为它隔离性好,易于管理。
# 假设你已经安装了 Docker sudo docker run -d --name gitlab-runner --restart always -v /srv/gitlab-runner/config:/etc/gitlab-runner -v /var/run/docker.sock:/var/run/docker.sock gitlab/gitlab-runner:latest
- 注册 Runner 到你的 GitLab 项目。你需要从 GitLab 项目的 “Settings” -> “CI/CD” -> “Runners” 页面获取注册 URL 和 Token。
sudo docker run --rm -it -v /srv/gitlab-runner/config:/etc/gitlab-runner gitlab/gitlab-runner:latest register --url YOUR_GITLAB_URL --token YOUR_REGISTRATION_TOKEN --description "My ECS Runner" --executor "shell" # 或者 "docker" 如果你的项目在容器中运行
选择
shell
executor 意味着 Runner 会直接在 ECS 宿主机上执行命令。如果你的部署流程涉及 Docker 镜像构建和运行,选择
docker
executor 更合适。
-
GitLab 项目配置:SSH Key 与 CI/CD 变量
- SSH Key: 这是部署安全的关键。在 GitLab 项目的 “Settings” -> “CI/CD” -> “Variables” 中添加一个类型为 “File” 的变量,例如
SSH_PRIVATE_KEY
,将你的 ECS 部署用户(例如
root
或一个专门的部署用户)的私钥内容粘贴进去。确保这个私钥对应的公钥已经添加到 ECS 部署用户的
~/.ssh/authorized_keys
文件中。
- ECS 连接信息: 添加其他变量,如
ECS_HOST
(你的 ECS 公网 IP 或域名) 和
ECS_USER
(部署用户,如
root
)。
- SSH Key: 这是部署安全的关键。在 GitLab 项目的 “Settings” -> “CI/CD” -> “Variables” 中添加一个类型为 “File” 的变量,例如
-
编写
.gitlab-ci.yml
文件 在你的项目根目录创建
.gitlab-ci.yml
文件,定义构建、测试和部署的阶段。这是一个简化的 Node.js 项目部署示例:
stages: - build - deploy variables: # 部署到 ECS 的目标路径 DEPLOY_DIR: "/www/your-project" cache: paths: - node_modules/ build_job: stage: build image: node:16-alpine # 使用一个 Node.js 镜像来构建 script: - echo "开始构建项目..." - npm install --registry=https://registry.npmmirror.com # 使用国内镜像加速 - npm run build - echo "项目构建完成。" artifacts: paths: - dist/ # 假设你的构建产物在 dist 目录下 expire_in: 1 day # 缓存一天 deploy_job: stage: deploy # 确保这个 job 只有在 main 分支更新时才运行 only: - main script: - echo "开始部署到 ECS..." # 确保 SSH 私钥文件权限正确 - chmod 600 "$SSH_PRIVATE_KEY" # 使用 ssh-agent 添加私钥,避免每次 SSH 都提示 - eval $(ssh-agent -s) - ssh-add "$SSH_PRIVATE_KEY" # 关闭严格主机密钥检查,避免首次连接提示 - mkdir -p ~/.ssh - echo -e "Host *ntStrictHostKeyChecking nontUserKnownHostsFile=/dev/null" > ~/.ssh/config # 通过 SSH 连接到 ECS 并执行部署命令 - ssh ${ECS_USER}@${ECS_HOST} " mkdir -p ${DEPLOY_DIR} && cd ${DEPLOY_DIR} && # 备份旧版本(可选) # mv current_release old_release || true && # 从 GitLab 仓库拉取最新代码 git pull origin main || git clone https://gitlab.com/your-group/your-project.git . && # 安装依赖(如果需要) npm install --production --registry=https://registry.npmmirror.com && # 重启服务,这里以 PM2 为例 pm2 reload ecosystem.config.js || pm2 start ecosystem.config.js " - echo "部署完成!"
GitLab CI/CD 的核心优势是什么?为什么选择它?
对我而言,GitLab CI/CD 最打动人的地方在于它的“一体化”理念。你想想看,代码仓库、版本控制、问题追踪、CI/CD 流水线,所有这些都在同一个平台里,触手可及。这不像以前,代码在 github,CI/CD 在 jenkins,项目管理在 jira,每次切换上下文都像是在不同房间里找工具,效率低不说,还容易出错。
选择 GitLab CI/CD,我觉得主要有几点:
首先,学习曲线相对平缓。它的
.gitlab-ci.yml
语法直观,基于 YAML,配置起来很顺手,即使是初学者也能很快上手。而且,它提供了大量的模板和示例,很多时候你只需要稍作修改就能满足需求。
其次,强大的集成能力。因为是原生集成,它能无缝访问你的代码、分支、标签,甚至可以直接操作 GitLab 的 API,实现更复杂的自动化流程,比如在部署成功后自动创建发布标签,或者在测试失败时自动创建 Jira 任务(虽然我更喜欢直接在 GitLab Issues 里处理)。
再来,成本效益。对于小型团队或者个人开发者来说,GitLab 提供了非常慷慨的免费套餐,包含了 CI/CD 功能,这无疑降低了自动化部署的门槛。你不需要额外维护一套 Jenkins 或者其他 CI/CD 服务器,节省了时间和金钱。
最后,也是我个人最看重的,是它能把 CI/CD 配置本身也纳入版本控制。
.gitlab-ci.yml
文件就和你的代码一起躺在仓库里,每次管道的变更都有迹可循,可以回溯,可以协作,这对于团队协作和审计来说简直是福音。我记得有一次,线上部署出了问题,我们直接回溯
.gitlab-ci.yml
的历史版本,很快就定位到了是某个部署命令的改动导致的,这种可追溯性是无价的。
在 ECS 上配置 GitLab Runner 的最佳实践
在 ECS 上配置 GitLab Runner,这玩意儿,说起来简单,做起来总有些坑。但只要遵循一些最佳实践,就能让它成为你部署流水线里最坚实的基石。
-
选择合适的 Executor:
- Shell Executor: 这是最简单直接的,Runner 直接在 ECS 宿主机上执行命令。如果你对 ECS 环境有完全的控制权,并且部署过程不需要复杂的隔离,这是个不错的选择。缺点是,不同的项目可能会污染宿主机的环境,比如 Node.js 14 和 Node.js 16 项目同时部署,可能会有版本冲突。
- Docker Executor: 强烈推荐!它会在每次 CI/CD 任务运行时,拉取一个新的 Docker 镜像作为执行环境。这样每个任务都在一个干净、隔离的环境中运行,避免了环境污染和依赖冲突。例如,Node.js 项目用
node:16
镜像,Python 项目用
python:3.9
镜像,互不干扰。这需要你的 ECS 上安装 Docker。
- Docker-in-Docker (dind): 如果你的 CI/CD 流程本身就需要构建 Docker 镜像,那么
dind
是你的不二选择。Runner 会在一个 Docker 容器内运行另一个 Docker 守护进程。配置起来稍微复杂一点,但功能强大。
-
安全性是重中之重:
- 专用用户: 不要用
root
用户运行 GitLab Runner。创建一个专门的系统用户,例如
gitlab-runner
,并限制其权限,只给予必要的目录读写权限,以及执行部署脚本的权限。
- SSH Key 管理: 部署用的 SSH 私钥绝对不能直接写死在
.gitlab-ci.yml
里。利用 GitLab CI/CD 的变量功能,将私钥作为文件类型变量存储。在
.gitlab-ci.yml
中,通过
chmod 600 $SSH_PRIVATE_KEY
临时设置权限,并在任务结束后自动销毁(GitLab Runner 会清理工作目录)。
- 网络安全组: 确保 ECS 的安全组只开放必要的端口(如 22, 80, 443),并且限制 Runner 只能访问它需要访问的服务,例如部署目标服务器。
- 专用用户: 不要用
-
资源管理与监控:
- 限制并发: 在
config.toml
文件中,可以设置 Runner 的
concurrent
属性,限制同时运行的任务数量,防止 Runner 占用过多 ECS 资源导致系统卡顿。
- 日志管理: 定期清理 Runner 的日志文件,或者配置日志轮转,避免日志文件过大。
- 监控: 结合阿里云的监控服务,监控 ECS 实例的 CPU、内存、磁盘 I/O 等指标,确保 Runner 的运行不会对业务造成影响。
- 限制并发: 在
-
持久化配置与备份:
- Runner 的
config.toml
文件非常重要,它包含了 Runner 的注册信息和配置。如果你是用 Docker 运行 Runner,务必将
/etc/gitlab-runner
目录挂载到宿主机的持久化存储卷上(例如
/srv/gitlab-runner/config
),这样即使容器被删除,配置也不会丢失。
- 定期备份
config.toml
文件。
- Runner 的
我曾经犯过一个错误,直接用
root
用户跑 Runner,结果因为一个不小心在
.gitlab-ci.yml
里写了个
rm -rf /
的测试命令(当然是写错了),差点把整个系统删掉。那次经历让我深刻认识到,权限隔离和最小权限原则在自动化运维中有多么重要。
编写
.gitlab-ci.yml
.gitlab-ci.yml
文件:从构建到部署的实践细节
.gitlab-ci.yml
文件是 GitLab CI/CD 的灵魂,它定义了你的自动化流程。编写它就像在给你的项目写一份详细的部署说明书,只不过这份说明书是给机器看的。
-
阶段(Stages)的划分与逻辑流: 一个清晰的
stages
定义是良好 CI/CD 管道的基础。常见的阶段包括:
-
build
: 编译代码,安装依赖,生成可部署的产物(如
dist
目录、Docker 镜像)。
-
test
: 运行单元测试、集成测试、端到端测试。
-
deploy
: 将构建好的产物部署到开发、测试或生产环境。
-
cleanup
: 清理临时文件或资源。 阶段的顺序决定了任务的执行顺序,比如
test
阶段通常在
build
之后,
deploy
在
test
之后。
-
-
变量(Variables)的妙用: 充分利用 GitLab 的 CI/CD 变量功能,可以极大地提高
.gitlab-ci.yml
的灵活性和安全性。
- 预定义变量: GitLab 提供了大量预定义变量(如
CI_COMMIT_BRANCH
,
CI_COMMIT_TAG
,
CI_PROJECT_DIR
等),可以直接在脚本中使用,获取当前构建的上下文信息。
- 自定义变量: 在 GitLab 项目设置中创建自定义变量,用于存储敏感信息(如 API 密钥、数据库密码、SSH 私钥)或环境相关的配置(如部署目标 IP、路径)。这些变量在 Runner 执行时会自动注入到环境变量中,并且在日志中是屏蔽的,非常安全。
- 预定义变量: GitLab 提供了大量预定义变量(如
-
构建(Build)任务:产物与缓存:
- 选择合适的镜像:
image
关键字决定了构建任务运行的环境。比如 Node.js 项目用
node:latest
,Python 项目用
python:3.9-slim
。
- 依赖缓存:
cache
是一个非常实用的功能,可以缓存任务之间共享的文件,比如
node_modules
或 maven 的
.m2
目录。这能显著加快后续构建的速度,因为不需要每次都重新下载依赖。
cache: paths: - node_modules/ # 缓存 Node.js 依赖 key: ${CI_COMMIT_REF_SLUG} # 按分支或标签缓存,避免不同分支互相影响
- 产物(Artifacts):
artifacts
定义了构建完成后需要保留的文件。这些文件会上传到 GitLab,可以在后续阶段下载使用,或者手动下载查看。例如,前端项目的
dist
目录就是典型的构建产物。
- 选择合适的镜像:
-
部署(Deploy)任务:SSH 与远程执行: 这是最核心的部分。
- SSH 密钥注入:
before_script: - chmod 600 "$SSH_PRIVATE_KEY" - eval $(ssh-agent -s) - ssh-add "$SSH_PRIVATE_KEY" - mkdir -p ~/.ssh - echo -e "Host *ntStrictHostKeyChecking nontUserKnownHostsFile=/dev/null" > ~/.ssh/config
这几行代码是标准操作,用于将私钥安全地加载到
ssh-agent
中,并配置 SSH 客户端跳过首次连接时的安全提示。
- 远程命令执行: 通过
ssh user@host "command"
的方式,在 ECS 上执行部署脚本。这可以是拉取最新代码、安装依赖、重启服务、更新 Docker 容器等。
# 假设部署脚本在 ECS 上的 /usr/local/bin/deploy.sh ssh ${ECS_USER}@${ECS_HOST} "/usr/local/bin/deploy.sh ${CI_COMMIT_SHA}" # 或者直接执行一系列命令 ssh ${ECS_USER}@${ECS_HOST} " cd /path/to/project && git pull origin main && npm install --production && pm2 reload my-app "
- Docker 部署流程: 如果你的应用是 Docker 化部署,流程会稍有不同:
- Build Stage:
docker build -t my-app:${CI_COMMIT_SHA} .
- Push Stage:
docker push registry.cn-hangzhou.aliyuncs.com/your-Namespace/my-app:${CI_COMMIT_SHA}
(推送到阿里云容器镜像服务 ACR 或其他仓库)
- Deploy Stage: 通过 SSH 到 ECS,执行
docker pull
拉取最新镜像,然后
docker stop/rm/run
更新容器。
ssh ${ECS_USER}@${ECS_HOST} " docker pull registry.cn-hangzhou.aliyuncs.com/your-namespace/my-app:${CI_COMMIT_SHA} && docker stop my-app || true && docker rm my-app || true && docker run -d --name my-app -p 80:3000 registry.cn-hangzhou.aliyuncs.com/your-namespace/my-app:${CI_COMMIT_SHA} "
- Build Stage:
- SSH 密钥注入:
-
条件执行与错误处理:
-
only
/
except
:
控制任务在特定分支、标签或 mr 上运行时才执行。比如部署到生产环境的deploy_prod
任务通常只在
main
分支合并时才触发。
-
when: manual
:
任务需要手动触发。 -
allow_failure: true
:
即使这个任务失败,整个管道也继续执行。常用于非关键的测试或通知任务。 -
script
中的错误处理:
在脚本中使用set -e
可以确保任何命令失败时脚本立即退出,防止后续命令在错误状态下继续执行。
-
编写
.gitlab-ci.yml
是一个迭代的过程。你可能需要多次尝试和调整才能找到最适合你项目的配置。我个人的经验是,先从一个最简单的部署脚本开始,然后逐步添加缓存、测试、Docker 化等复杂功能。每次改动都提交并观察管道运行结果,这样能更快地定位问题。