引言:从单机到分布式容器架构的演进

在传统Web应用部署中,我们常常面临环境不一致、部署效率低下等问题。我曾经维护过一个需要手动在5台服务器上重复部署的游戏项目,每次发布都如同走钢丝。本文将详细分享如何基于CentOS系统,构建完整的分布式Docker架构,实现GitLab+Jenkins+生产环境的三节点CI/CD流水线,最终成功部署Web游戏项目的全过程。

第一部分:架构设计与环境规划

1.1 分布式节点规划

​三节点架构​​:

​GitLab节点​​:192.168.1.101(4核8G内存,200G存储)

​Jenkins节点​​:192.168.1.102(4核8G内存)

​生产环境节点​​:192.168.1.103(8核16G内存,NVIDIA T4 GPU)

# 各节点基础环境准备(CentOS 7.9)
sudo yum install -y yum-utils device-mapper-persistent-data lvm2
sudo yum-config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.repo
sudo yum install -y docker-ce docker-ce-cli containerd.io
sudo systemctl enable --now docker

1.2 网络拓扑设计

图:三节点Docker Swarm网络拓扑

关键配置:

使用Overlay网络实现跨主机容器通信

为每个服务配置独立的子网

通过Nginx实现服务发现和负载均衡

# 初始化Docker Swarm集群(在生产节点)
docker swarm init --advertise-addr 192.168.1.103# 在其他节点加入集群
docker swarm join --token SWMTKN-1-xxx 192.168.1.103:2377

第二部分:核心组件部署

2.1 GitLab容器化部署(192.168.1.101)

# 创建数据卷目录
mkdir -p /gitlab/{config,logs,data}# 启动GitLab容器
docker run -d \--hostname gitlab.example.com \--publish 8443:443 --publish 8080:80 --publish 8022:22 \--name gitlab \--restart always \--volume /gitlab/config:/etc/gitlab \--volume /gitlab/logs:/var/log/gitlab \--volume /gitlab/data:/var/opt/gitlab \--shm-size 256m \gitlab/gitlab-ce:15.11.8-ce.0

性能调优​​:

修改/gitlab/config/gitlab.rb

unicorn['worker_processes'] = 4
postgresql['shared_buffers'] = "256MB"
sidekiq['concurrency'] = 10

2.2 Jenkins容器化部署(192.168.1.102)

# 自定义Jenkins Dockerfile
FROM jenkins/jenkins:2.414.3-lts-jdk11
USER root
RUN apt-get update && \apt-get install -y docker.io python3-pip && \pip3 install docker-compose
COPY plugins.txt /usr/share/jenkins/ref/plugins.txt
RUN jenkins-plugin-cli -f /usr/share/jenkins/ref/plugins.txt
USER jenkins
# 启动Jenkins容器
docker run -d \--name jenkins \-p 8081:8080 -p 50000:50000 \-v /jenkins_home:/var/jenkins_home \-v /var/run/docker.sock:/var/run/docker.sock \--restart unless-stopped \my-jenkins-image

关键插件​​:

Docker Pipeline

Blue Ocean

GitLab Plugin

SSH Pipeline Steps

第三部分:Web游戏项目容器化

3.1 游戏架构分析

项目采用前后端分离架构:

前端​​:Unity WebGL构建​

后端​​:Node.js游戏服务器

​数据库​​:MongoDB分片集群

​实时通信​​:WebSocket

3.2 多服务Docker Compose编排

version: '3.8'services:game-frontend:image: registry.example.com/game-webgl:${TAG}deploy:replicas: 3update_config:parallelism: 1delay: 10srestart_policy:condition: on-failurenetworks:- game-networkgame-server:image: registry.example.com/game-server:${TAG}environment:- NODE_ENV=production- MONGO_URI=mongodb://mongo1:27017,mongo2:27017,mongo3:27017/game?replicaSet=rs0deploy:replicas: 2networks:- game-networkdepends_on:- mongo1- mongo2- mongo3mongo1:image: mongo:5.0command: mongod --replSet rs0 --bind_ip_allvolumes:- mongo1-data:/data/dbnetworks:- game-network# mongo2和mongo3配置类似...nginx:image: nginx:1.23ports:- "80:80"- "443:443"volumes:- ./nginx.conf:/etc/nginx/nginx.confdepends_on:- game-frontend- game-servernetworks:- game-networknetworks:game-network:driver: overlayvolumes:mongo1-data:mongo2-data:mongo3-data:

3.3 Nginx关键配置

# nginx.conf
upstream game_servers {server game-server:3000;
}server {listen 80;server_name game.example.com;location / {root /usr/share/nginx/html;try_files $uri /index.html;}location /api {proxy_pass http://game_servers;proxy_http_version 1.1;proxy_set_header Upgrade $http_upgrade;proxy_set_header Connection "upgrade";}
}

第四部分:CI/CD流水线实现

4.1 GitLab Runner配置

# 在Jenkins节点注册GitLab Runner
docker run -d --name gitlab-runner \-v /var/run/docker.sock:/var/run/docker.sock \-v /gitlab-runner/config:/etc/gitlab-runner \gitlab/gitlab-runner:v15.11.0docker exec -it gitlab-runner gitlab-runner register

4.2 完整的Jenkinsfile

pipeline {agent {docker {image 'node:18'args '-v $HOME/.npm:/root/.npm'}}environment {DOCKER_REGISTRY = 'registry.example.com'PROJECT = 'web-game'DEPLOY_NODE = '192.168.1.103'SSH_CREDS = credentials('prod-ssh-key')}stages {stage('Checkout') {steps {git branch: 'main', url: 'http://192.168.1.101:8080/game/web-game.git',credentialsId: 'gitlab-cred'}}stage('Build Frontend') {steps {dir('webgl-build') {sh 'npm install'sh 'npm run build'sh 'docker build -t $DOCKER_REGISTRY/$PROJECT-webgl:$BUILD_NUMBER .'}}}stage('Build Server') {steps {dir('server') {sh 'npm install --production'sh 'docker build -t $DOCKER_REGISTRY/$PROJECT-server:$BUILD_NUMBER .'}}}stage('Push Images') {steps {withCredentials([usernamePassword(credentialsId: 'docker-registry',usernameVariable: 'DOCKER_USER',passwordVariable: 'DOCKER_PASS')]) {sh 'echo $DOCKER_PASS | docker login -u $DOCKER_USER --password-stdin $DOCKER_REGISTRY'sh 'docker push $DOCKER_REGISTRY/$PROJECT-webgl:$BUILD_NUMBER'sh 'docker push $DOCKER_REGISTRY/$PROJECT-server:$BUILD_NUMBER'}}}stage('Deploy to Production') {steps {sshagent(['prod-ssh-key']) {sh """ssh -o StrictHostKeyChecking=no ubuntu@$DEPLOY_NODE \"export TAG=$BUILD_NUMBER && \docker stack deploy -c docker-compose.prod.yml game""""}}}}post {failure {slackSend channel: '#game-alerts',message: "构建失败: ${env.JOB_NAME} #${env.BUILD_NUMBER}"}success {slackSend channel: '#game-deploy',message: "新版本已上线: ${env.BUILD_NUMBER}"}}
}

4.3 关键优化点

  1. ​构建缓存​​:复用node_modules目录加速构建

  2. ​安全凭证​​:使用Jenkins Credential管理SSH密钥

  3. ​回滚机制​​:保留最近5个可用镜像版本

  4. ​通知系统​​:集成Slack实现构建状态实时通知

第五部分:监控与运维方案

5.1 分布式监控体系

# docker-compose.monitor.yml
version: '3.8'services:prometheus:image: prom/prometheusports:- "9090:9090"volumes:- ./prometheus.yml:/etc/prometheus/prometheus.ymldeploy:placement:constraints: [node.role == manager]grafana:image: grafana/grafanaports:- "3000:3000"volumes:- grafana-data:/var/lib/grafanadepends_on:- prometheusnode-exporter:image: prom/node-exporterdeploy:mode: globalvolumes:- /proc:/host/proc:ro- /sys:/host/sys:ro- /:/rootfs:rovolumes:grafana-data:

第六部分:踩坑经验与进阶思考

6.1 典型问题解决方案

​问题1​​:跨主机容器网络不通

​现象​​:Swarm集群中容器无法通过服务名互相访问

​解决方案​​:检查防火墙规则:

sudo firewall-cmd --permanent --add-port=2377/tcp
sudo firewall-cmd --permanent --add-port=7946/tcp
sudo firewall-cmd --permanent --add-port=7946/udp
sudo firewall-cmd --permanent --add-port=4789/udp
sudo firewall-cmd --reload

验证Overlay网络状态:

docker network inspect game-network

优化方案​​:调整Runner配置:

[[runners]]name = "game-runner"url = "http://192.168.1.101:8080"executor = "docker"[runners.docker]tls_verify = falseimage = "alpine:3.16"privileged = truedisable_cache = falsevolumes = ["/cache", "/var/run/docker.sock:/var/run/docker.sock"]shm_size = "512m"

增加Runner并发数

6.2 性能优化成果

指标

优化前

优化后

构建时间

23分钟

8分钟

部署时间

15分钟

45秒

镜像大小

1.8GB

420MB

启动时间

30秒

3秒

结语:从实践到生产

这套基于CentOS的分布式Docker架构已经稳定运行6个月,支撑了日均50万PV的游戏服务。关键收获包括:

  1. ​基础设施即代码​​:所有环境配置版本化控制

  2. ​不可变基础设施​​:通过镜像而非修改运行环境来变更应用

  3. ​自动化一切​​:从代码提交到生产部署的全流程自动化

未来规划:

  1. 迁移到Kubernetes实现更高级的编排能力

  2. 引入服务网格(Service Mesh)管理微服务通信

  3. 实现基于Prometheus的自动扩缩容

希望这篇结合实战经验的详细分享,能为你的分布式容器化之路提供参考。欢迎在评论区交流你在CI/CD实践中遇到的挑战和解决方案!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/89313.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/89313.shtml
英文地址,请注明出处:http://en.pswp.cn/bicheng/89313.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

JVM——为什么Java8移除了永久代(PermGen)并引入了元空间(Metaspace)?

Java8移除永久代并引入元空间,主要是为了解决 PermGen 固定大小、容易导致内存溢出、GC 效率低的问题。元空间使用本地内存,具备更灵活的内存分配能力,提升了垃圾收集和内存管理的效率。 PermGen 的局限性 ①固定大小:永久代的内存空间大小在…

3.正则化——新闻分类

影响结果出了最终的目标,还会有许多细节因素 在机器学习中,往往会面临很多过拟合和欠拟合的问题。 欠拟合是训练不到位,过拟合是训练过头,会导致泛化性差正则化是在损失函数中添加一个惩罚项,以简化模型对于惩罚项Pena…

HTML的重要知识

什么是HTMLHTML是Hyper Text Markup Language的缩写,意思是超文本标记语言。标签标题标签:————-h1,h2,h3.....段落标签 :————p换行标签: ————br列表标签:有序列表:——ol无序列表:—…

【C语言网络编程】HTTP 客户端请求(发送请求报文过程)

在 C 语言中,我们可以使用 socket 编程来手动实现一个简单的 HTTP 客户端,像浏览器一样请求网页数据。本文将结合实际代码,重点讲解如何通过 C 语言构造并发送一个 HTTP 请求报文,实现与服务器的基本通信。 文章目标 通过一个简单…

oracle2kingbase的字段长度问题

实验一: oracle中: create table testlen(c1 varchar2(2)); insert into testlen values(山); --成功 insert into testlen values(山西); --失败 ORA-12899: 列 "TESTK"."TESTLEN"."C1" 的值太大 (实际值: 4, 最大值: 2…

单链表的题目,咕咕咕

1.咕 203. 移除链表元素 - 力扣(LeetCode) 给你一个链表的头节点 head 和一个整数 val ,请你删除链表中所有满足 Node.val val 的节点,并返回 新的头节点 struct ListNode* removeElements(struct ListNode* head, int val) …

关于程序=数据结构+算法这句话最近的一些思考

最近看了很多单片机STM32的的相关程序,尤其是设计到ringbuff、buffer_manage、os_memory预计mem_manage等程序中间层的用法,我对这句话有了一些更深的思考,现在记录下来,希望对处于相同阶段的程序一些思想启迪。首先“数据结构”也…

Rust 错误处理

Rust 错误处理 引言 Rust 是一种系统编程语言,以其安全、并发和性能著称。在 Rust 中,错误处理是一个核心概念,它确保了程序在遇到异常情况时能够优雅地处理。本文将深入探讨 Rust 中的错误处理机制,包括错误类型、错误传播、错误…

17. 什么是 webSocket ?

总结 WebSocket 是 HTML5 引入的一种新协议,允许客户端和服务器之间进行双向实时通信。建立在 TCP 协议之上,默认端口是 80(ws) 和 443(wss),没有同源限制,客户端可以与任意服务器通…

从零开始跑通3DGS教程:(五)3DGS训练

写在前面 本文内容 所属《从零开始跑通3DGS教程》系列文章; 本文介绍在docker中训练3dgs的方法 平台/环境 linux, nvidia GPU, docker 转载请注明出处: https://blog.csdn.net/qq_41102371/article/details/146535874 目录 写在前面系列文章准备docker创建环境参考完系列文章…

日记_7.14_实际开发的进步

1、快速定位后端2、会定位前端啦啦啦!3、前端没有意义的块叫div和span。而不是script4、所有 JavaScript 标识符均 区分大小写5、JS中$和_下划线和doller符均被视为字母。6、var、let区别:1 var全局。let局部。2 var可以重新声明格式,let之恩…

AI Agent 开发

Agent开发常用框架: LangChainLlamaIndexVercel AI SDK LangChain:一站式 LLM 应用开发框架一句话总结 LangChain 把「模型调用 外部数据 工具 记忆 流程编排」全部标准化,让你像搭积木一样快速组合出聊天机器人、RAG、Agent 等大模型应用…

【水动力学】04 二维洪水淹没模型Pypims安装

模型介绍 HiPIMS(High-Performance Integrated hydrodynamic Modelling System)使用最先进的数值方案(Godunov型有限体积法)来求解二维浅水方程以进行洪水模拟。为了支持高分辨率洪水模拟,使用CUDA/C 语言在多个GPU上…

ARC 03 从Github Action job 到 runner pod

Github Action job 分配到集群 背景 job 是 Github Action 的基本单位,每个 job 单独分配一个 runner。workflow 由一个或者多个 job 组成。如果用户触发runs-on字段为arc-runner-set的 job,那么 Github Action 服务器将 job 分配给 listener pod。 源码…

ubuntu 22.04 anaconda comfyui安装

背景: 戴尔R740服务器,安装了proxmox操作系统,配置了显卡直通。创建了一个ubuntu 22.04 VM虚拟机实例,并安装了显卡驱动与cuda等相关配置: 接下来准备搭建一套comfyui的环境,前段时间B站,抖音各…

每日面试题04:volatile字段的原理

在之前面试题02ConcurrentHashMap的底层原理中提到了volatile修饰符,在多线程编程的世界里,数据同步是一道绕不开的坎。当多个线程同时操作共享变量时,“看不见对方的修改”或“代码顺序错乱”往往会导致程序行为异常。而 volatile作为 Java …

【云原生网络】Istio基础篇

文章目录概述基础知识技术架构概述数据平面核心组件网络代理Envoy控制平面核心组件xDS协议Pilot组件其他概述参考博客😊点此到文末惊喜↩︎ 概述 基础知识 背景知识 服务网格(Service Mesh):独立于应用程序的基础设施层&#x…

PySpark Standalone 集群

一、PySpark Standalone 集群概述PySpark Standalone 集群是 Apache Spark 的一种部署模式,它不依赖于其他资源管理系统(如 YARN 或 Mesos),而是使用 Spark 自身的集群管理器。这种模式适合快速部署和测试,尤其在开发和…

图像质量评价(Image Quality Assessment,IQA)

文章目录图像质量评价(Image Quality Assessment,IQA)一、评估方式:主观评估 客观评估1.1、主观评估方式1.2、客观评估方式:全参考 半参考 无参考(1)全参考的方法对比(Full-Refer…

【跟我学YOLO】(2)YOLO12 环境配置与基本应用

欢迎关注『跟我学 YOLO』系列 【跟我学YOLO】(1)YOLO12:以注意力为中心的物体检测 【跟我学YOLO】(2)YOLO12 环境配置与基本应用 【跟我学YOLO】(3)YOLO12 用于诊断视网膜病变 【跟我学YOLO】&a…