文章目录

  • **功能概述**
  • **核心参数详解**
  • **配置示例**
    • **1. 基础用法**
    • **2. 使用数据库健康检查**
    • **3. 结合 `depends_on` 控制启动顺序**
  • **高级用法**
    • **1. 自定义健康检查脚本**
    • **2. 多种健康检查类型**
      • - **HTTP 检查**:
      • - **TCP 端口检查**:
      • - **Redis 检查**:
  • **健康状态生命周期**
    • 1. **初始状态**:容器启动后状态为 `starting`。
    • 2. **健康检查成功**:状态变为 `healthy`。
    • 3. **连续失败次数达到 `retries`**:状态变为 `unhealthy`。
    • 4. **健康检查恢复成功**:状态重新变为 `healthy`。
  • **常见问题与解决方案**
    • 1. **容器状态为 `Up` 但服务不可用**:
    • 2. **健康检查脚本依赖外部工具(如 `curl`)**:
    • 3. **健康检查频繁失败导致服务重启**:
  • **总结**

功能概述

healthcheck 是 Docker 提供的一项功能,用于监控容器中服务的实际健康状态,而不仅仅是判断容器进程是否在运行。通过定义健康检查规则,Docker 会周期性地执行指定命令或脚本,根据返回结果判断容器是否处于 healthy(健康)或 unhealthy(不健康)状态。此功能在以下场景中尤为重要:

  • 服务依赖管理:确保依赖的服务(如数据库、Redis 等)完全就绪后再启动其他服务。
  • 故障检测与恢复:及时发现服务异常并触发重启或告警。
  • 自动化部署:在容器化应用中实现更可靠的启动流程。

核心参数详解

docker-compose.yml 文件中,healthcheck 的配置通常包含以下参数:

参数名说明示例
test健康检查命令或脚本,返回值为 0 表示健康,非 0 表示不健康。支持 Shell 命令或数组格式。test: ["CMD-SHELL", "curl -sS http://localhost:80 || exit 1"]
interval健康检查的间隔时间(默认 30s)。interval: 10s
timeout单次检查的超时时间(默认 30s)。超时后视为检查失败。timeout: 5s
retries连续失败多少次后标记容器为 unhealthy(默认 3)。retries: 5
start_period容器启动后等待多久才开始首次检查(默认 0s)。适用于需要较长初始化时间的服务。start_period: 20s

配置示例

1. 基础用法

version: '3.7'
services:web-app:image: my-web-app:latesthealthcheck:test: ["CMD-SHELL", "curl -sS http://localhost:80 || exit 1"]interval: 10stimeout: 5sretries: 3
  • 说明:每 10 秒检查一次 Web 服务是否在 localhost:80 上响应成功(HTTP 200)。
  • 条件:如果连续 3 次检查失败,容器状态变为 unhealthy

2. 使用数据库健康检查

version: '3.7'
services:postgres-database:image: postgres:latestenvironment:POSTGRES_USER: userPOSTGRES_PASSWORD: passwordhealthcheck:test: ["CMD-SHELL", "pg_isready -U user -d postgres"]interval: 10stimeout: 5sretries: 5
  • 说明:使用 PostgreSQL 自带的 pg_isready 工具检查数据库是否可连接。
  • 依赖服务:其他服务可通过 depends_oncondition: service_healthy 依赖此服务。

3. 结合 depends_on 控制启动顺序

version: '3.7'
services:postgres-database:image: postgres:latesthealthcheck:test: ["CMD-SHELL", "pg_isready -U user -d postgres"]interval: 10stimeout: 5sretries: 5app:image: my-app:latestdepends_on:postgres-database:condition: service_healthy
  • 说明
    • depends_oncondition: service_healthy 确保 app 服务仅在 postgres-database 健康后启动。
    • 需要 Docker Compose 版本 3.2 或更高。

高级用法

1. 自定义健康检查脚本

将健康检查逻辑封装到脚本中,例如 healthcheck.sh

#!/bin/bash
# healthcheck.sh
curl -sS http://localhost:80 || exit 1

Dockerfile 中复制并配置:

COPY healthcheck.sh /healthcheck.sh
RUN chmod +x /healthcheck.sh
HEALTHCHECK --interval=5s --timeout=3s CMD /healthcheck.sh

2. 多种健康检查类型

- HTTP 检查

test: ["CMD-SHELL", "curl -f http://localhost:80/health || exit 1"]

- TCP 端口检查

test: ["CMD", "nc", "-z", "localhost", "6379"]

- Redis 检查

test: ["CMD-SHELL", "redis-cli ping | grep -q PONG"]

健康状态生命周期

1. 初始状态:容器启动后状态为 starting

2. 健康检查成功:状态变为 healthy

3. 连续失败次数达到 retries:状态变为 unhealthy

4. 健康检查恢复成功:状态重新变为 healthy


常见问题与解决方案

1. 容器状态为 Up 但服务不可用

  • 原因:Docker 默认仅检查容器进程是否运行,不验证服务是否可用。
  • 解决方案:添加 healthcheck 配置,从应用层面验证服务状态。

2. 健康检查脚本依赖外部工具(如 curl

  • 解决方法
    • 在 Dockerfile 中安装依赖工具(如 apt-get install curl)。
    • 使用轻量级替代方案(如 wgetnc)。

3. 健康检查频繁失败导致服务重启

  • 优化建议
    • 增加 intervalretries 参数值。
    • 调整 start_period 以适应服务初始化时间。

总结

通过 healthcheck 功能,可以显著提升容器化应用的可靠性和自动化能力。合理配置健康检查规则,能够有效解决服务依赖和启动顺序问题,避免因依赖服务未就绪导致的系统故障。结合 depends_oncondition: service_healthy,可以构建更健壮的微服务架构。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/98410.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/98410.shtml
英文地址,请注明出处:http://en.pswp.cn/diannao/98410.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

算法之双指针

在算法设计中,双指针是一种高效优化工具,主要用于线性数据结构(如数组(数组划分和数组分块常用)、链表、字符串),通过控制两个指针的移动轨迹,将原本需要 O (n) 时间复杂度的问题优化…

幂等性、顺序性保障以及消息积压

幂等性 概念 在应用程序中,幂等性就是指对一个系统进行重复调用(相同参数),不论请求多少次,这些请求对系统的影响都是相同的效果. 比如数据库的select操作.不同时间两次查询的结果可能不同,但是这个操作…

算法训练营DAY58 第十一章:图论part08

拓扑排序精讲 卡码网:117. 软件构建(opens new window) 题目描述: 某个大型软件项目的构建系统拥有 N 个文件,文件编号从 0 到 N - 1,在这些文件中,某些文件依赖于其他文件的内容,这意味着如果文件 A 依…

如何在Python中使用正则表达式?

在Python中使用正则表达式主要通过内置的re模块实现。正则表达式用于匹配、查找、替换字符串中的特定模式,是处理文本的强大工具。以下是使用正则表达式的核心方法和示例: 一、基本用法步骤 导入re模块:import re定义正则表达式模式&#xff…

用 Trae 玩转 Bright Data MCP 集成

引言 在自动化与智能体浪潮中,Trae 以“开箱即用、所见即所得”的工具编排体验,成为个人与团队落地 AI 工作流的高效选择。本篇将以 Trae 为主角,展示如何通过最少配置完成与 Bright Data MCP 的对接,并快速构建一个可用、可观测…

大数据Spark(六十三):RDD-Resilient Distributed Dataset

文章目录 RDD-Resilient Distributed Dataset 一、RDD五大特性 二、RDD创建方式 RDD-Resilient Distributed Dataset 在 Apache Spark 编程中,RDD(Resilient Distributed Dataset,弹性分布式数据集)是 Spark Core 中最基本的数…

java,通过SqlSessionFactory实现动态表明的插入和查询(适用于一个版本一个表的场景)

1,测试实体类package org.springblade.sample.test;import com.baomidou.mybatisplus.annotation.TableName; import lombok.Data;/*** Author: 肖扬* CreateTime: 2025-09-05* Description: SqlSessionFactoryTest测试* Version: 1.0*/ Data TableName("session_factory_…

鹧鸪云光储流程系统全新升级:视频指引与分阶段模块使用指南

鹧鸪云光储流程系统近日完成重要更新,全面优化了操作指引体系,为用户带来更高效、直观的使用体验。本次升级重点推出了全套功能操作视频,并明确了不同业务阶段的核心模块使用指南,助力用户快速上手、提升工作效率。全覆盖视频操作…

ChatGPT 协作调优:把 SQL 查询从 5s 优化到 300ms 的全过程

ChatGPT 协作调优:把 SQL 查询从 5s 优化到 300ms 的全过程 🌟 Hello,我是摘星! 🌈 在彩虹般绚烂的技术栈中,我是那个永不停歇的色彩收集者。 🦋 每一个优化都是我培育的花朵,每一个…

复杂计算任务的智能轮询优化实战

目录 复杂计算任务的智能轮询优化实战 一、轮询方法介绍 二、三种轮询优化策略 1、用 setTimeout 替代 setInterval 2、轮询时间指数退避 3、标签页可见性检测(Page Visibility API) 三、封装一个简单易用的智能轮询方法 四、结语 作者&#xff…

Java开发中常用CollectionUtils方式,以及Spring中CollectionUtils常用方法示例

场景 Java开发中常用的CollectionUtils 一、Spring Framework的CollectionUtils 包路径&#xff1a;org.springframework.util.CollectionUtils 核心方法&#xff1a; isEmpty(Collection<?> coll) List<String> list null; boolean empty CollectionUtil…

人工智能学习:Transformer结构(文本嵌入及其位置编码器)

一、输入部分介绍 输入部分包含: 编码器源文本嵌入层及其位置编码器 解码器目标文本嵌入层及其位置编码器 在transformer的encoder和decoder的输入层中,使用了Positional Encoding,使得最终的输入满足: 这里,input_embedding是通过常规embedding层,将每一个词的…

⸢ 肆 ⸥ ⤳ 默认安全建设方案:c-1.增量风险管控

&#x1f44d;点「赞」&#x1f4cc;收「藏」&#x1f440;关「注」&#x1f4ac;评「论」 在金融科技深度融合的背景下&#xff0c;信息安全已从单纯的技术攻防扩展至架构、合规、流程与创新的系统工程。作为一名从业十多年的老兵&#xff0c;将系统阐述数字银行安全体系的建设…

第二课、熟悉Cocos Creator 编辑器界面

本文主要介绍Cocos Creator 编辑器界面中几个常规的面板功能&#xff0c;让新手了解编辑器界面中常规的面板功能&#xff0c;更好的使用Cocos Creator 编辑器。一、编辑器界面常规面板划分Cocos Creater编辑器默认样式如上&#xff0c;主要包含&#xff1a;1、工具栏&#xff0…

Elixir通过Onvif协议控制IP摄像机,扩展ExOnvif的摄像头连续移动功能 ContinuousMove

Elixir 通过Onvif 对IP设备进行控制时&#xff0c;可以使用 ExOnvif 库。ExOnvif官方文档 此文章仅提供了ContinuousMove的控制方式及示例。 Elixir Onvif协议控制IP设备的其他命令&#xff0c;可以参考以下链接 绝对移动 【AbsoluteMove】 调用指定预置位 【GotoPreset】 …

android studio JNI 环境配置实现 java 调用 c/c++

1、在 app 级的 build.gradle 文件配置两个地方 android{ defaultConfig{ // 在 defaultConfig 里配置下面代码 externalNativeBuild { cmake { cppFlags "-frtti -fexceptions"//添加对 c 的异常处理支持 …

静态时序分析详解之时序路径类型

目录 一、概览 二、时序路径 2.1 数据路径 2.2 时钟路径 2.3 时钟门控路径 2.4 异步路径 2.5 关键路径 2.6 False路径 2.7 单周期路径 2.8 多周期路径 2.9 最长路径和最短路径 三、参考资料 一、概览 ​ ​静态时序分析通过模拟最差条件下分析所有的时序路径&am…

SpringBoot埋点功能技术实现方案深度解析:架构设计、性能优化与扩展性实践

SpringBoot埋点功能技术实现方案深度解析&#xff1a;架构设计、性能优化与扩展性实践 1. 原理剖析与技术实现细节 1.1 埋点技术基本原理 埋点&#xff08;Tracking&#xff09;是通过在代码中植入特定逻辑&#xff0c;收集用户行为数据、系统运行状态和业务指标的技术手段。在…

自建prometheus监控腾讯云k8s集群

自建prometheus监控腾讯云k8s集群 使用场景 k8s集群&#xff08;腾讯云容器服务&#xff09; promtheus (外部自建服务) 腾讯云提供了容器内部自建 Prometheus 监控 TKE 集群的文档&#xff0c;参考。 当前的环境promethues建在k8S外的云服务器上&#xff0c;与上面链接文…

2025高教社国赛数学建模C题参考论文(含模型和代码)

2025 年高教社杯大学生数学建模竞赛 C 题参考论文 目录 NIPT 的时点选择与胎儿的异常判定 摘要 1 问题重述 2 问题分析 2.1 问题 1 分析 2.2 问题 2 分析 2.3 问题 3 分析 2.4 问题 4 分析 3 模型假设与符号定义 3.1 模型假设 4. 孕周在 10-25 周内检测有…