news/2025/6/24 11:02:48/文章来源:https://blog.csdn.net/qq_31815507/article/details/148825594

目录

1. 写入操作 (INSERT)

2. 删除操作 (DELETE)

3. 更新操作 (UPDATE)

4. 查询操作 (SELECT)

5. 总结对比表：

6. 参考链接

核心哲学差异：

MySQL： 面向在线事务处理。核心目标是保证数据的强一致性、原子性和低延迟的单行操作（点查、点写），适用于高并发、频繁小数据量修改的业务系统（如用户中心、订单系统）。
ClickHouse： 面向在线分析处理。核心目标是实现海量数据（PB级）的超高速聚合查询和批量导入，牺牲了实时写入和单点修改的效率，追求极高的查询吞吐量。适用于数据仓库、实时分析、日志处理等场景。

详细对比：

1. 写入操作 (`INSERT`)

- ClickHouse:

- - 架构/原理： 基于Log-Structured Merge-Tree思想。数据首先写入内存缓冲区(MemTable)，当缓冲区满或达到阈值时，异步刷写到磁盘形成不可变的数据片段。写入是批量、高吞吐、低频率的操作。INSERT语句本身是异步的（除非使用SYSTEM FLUSH LOGS强制刷写内存表），客户端通常很快返回，但数据真正落盘并可见有一定延迟。
  - 表存储： 数据按分区键（通常按时间）物理存储在磁盘的不同目录中。每个分区内，数据按主键（或ORDER BY键）排序存储。每次INSERT通常会生成一个新的数据片段。ReplicatedMergeTree引擎的表写入会通过ZooKeeper/Keeper协调复制到副本。
  - 特点： 极高写入吞吐量（每秒百万甚至千万行），但单次写入延迟较高（毫秒到秒级），不适合高频、小批量的实时写入。建议大批量（如>1000行/次）写入。

- MySQL (InnoDB):

- - 架构/原理： 基于B+Tree索引结构。写入操作（包括插入、更新、删除）需要修改B+树索引页和数据页。为了保证ACID（特别是持久性D），每次修改都需要写Redo Log。写入通常是实时、低延迟、单行或小批量。
  - 表存储： 数据存储在.ibd文件中，按聚簇索引（通常是主键）组织。数据和主键索引存储在一起。二级索引存储的是主键值。
  - 特点： 低写入延迟（微秒到毫秒级），支持高并发的小事务写入。写入吞吐量受限于磁盘IOPS和锁竞争（行锁、间隙锁等）。

2. 删除操作 (`DELETE`)

- ClickHouse:

- - 架构/原理： DELETE操作极其低效且不推荐。它不是一个即时、原地删除操作。执行DELETE时：

- - - 对于MergeTree系列表，会生成一个特殊的异步删除标记（Mutation），记录要删除的行或分区范围。
    - 后台有专门的线程（或多个线程）在未来的某个时刻（通常是写入压力较小时）扫描数据片段，将标记删除的行物理排除，并重写整个受影响的数据片段。这是一个重量级、资源密集型、高延迟的操作。
    - 在删除标记生效前，查询会自动过滤掉被标记删除的行。

- - 表存储： 删除操作不会立即释放磁盘空间，直到后台合并完成。删除大量数据**首选按分区删除 (ALTER TABLE ... DROP PARTITION/PART) **，这几乎是瞬间完成的，因为它直接删除整个分区目录。
  - 特点： 避免单行或小范围DELETE。分区级删除非常高效。删除操作是异步的，对查询性能有潜在影响（需要过滤标记）。

- MySQL (InnoDB):

- - 架构/原理： 删除操作相对高效。

- - - 如果是通过主键删除，InnoDB会立即在B+树中定位到该行，将其标记为删除（打上删除标记）。
    - 被删除行占用的空间并不会立即回收，而是进入一个空闲链表，可以被后续的插入操作复用（称为行重用）。
    - 真正的空间回收需要等到Purge线程清理undo日志和OPTIMIZE TABLE操作（重建表）。

- - 表存储： 删除操作修改B+树结构和数据页。空间管理在页内和页间进行。
  - 特点： 支持高效的单行删除。删除操作是事务性的（可回滚）。删除大量数据时，DELETE可能较慢（逐行标记），TRUNCATE TABLE（DDL，瞬间清空表）或DROP TABLE + CREATE TABLE更快。

3. 更新操作 (`UPDATE`)

- ClickHouse:

- - 架构/原理： UPDATE操作同样极其低效且不推荐，其实现机制与DELETE类似：

- - - 执行UPDATE也会生成一个异步Mutation标记。
    - 后台线程在合并数据片段时，会读取旧数据，应用更新逻辑，然后重写整个包含修改行的数据片段。这相当于删除旧行 + 插入新行。

- - 表存储： 与DELETE类似，不会立即修改原数据，而是通过标记和重写片段实现。同样首选按分区更新（通过删除旧分区+插入新数据的方式）。或者使用CollapsingMergeTree/VersionedCollapsingMergeTree/ReplacingMergeTree等引擎通过插入新版本数据并在查询时合并的方式来模拟更新（更高效）。
  - 特点： 强烈避免频繁或大范围的UPDATE操作。它是ClickHouse最不擅长的操作类型之一。设计表结构时应考虑“只追加”模式。

- MySQL (InnoDB):

- - 架构/原理： 更新操作是核心能力。

- - - 如果是主键更新且值不变，则直接修改数据页中的行。
    - 如果更新了索引列，则需要修改B+树（可能涉及节点分裂合并）。
    - 如果更新导致行长度变化（如VARCHAR变长），可能需要行迁移（记录移动到新位置，原位置留下指针或标记为删除）。
    - 同样需要写Redo Log保证持久性。

- - 表存储： 直接在原数据页或迁移后的新位置修改行数据。
  - 特点： 高效支持行级更新，是OLTP的核心操作。支持事务性更新。

4. 查询操作 (`SELECT`)

- ClickHouse:

- - 架构/原理：

- - - 列式存储： 这是高速分析查询的基石。查询时只读取所需的列，大大减少了磁盘I/O。
    - 向量化执行引擎： 数据不是逐行处理，而是按列“块”进行处理（通常一次处理几千行），充分利用CPU的SIMD指令集进行并行计算。
    - 稀疏索引： PRIMARY KEY定义的是数据的排序顺序，而非唯一约束（允许重复）。它创建的是稀疏索引（每N行一个索引项，默认8192），主要用于快速定位数据块范围，而不是精确查找单行。ORDER BY键（通常与主键一致）对查询性能至关重要。
    - 数据压缩： 按列压缩效率极高（相同数据类型），进一步减少I/O。
    - MPP架构 (分布式查询)： 在集群环境下，查询可以自动拆分成多个子任务，在多个分片（Shard）上并行执行，结果汇总。

- - 表存储： 数据按列存储在每个数据片段的.bin文件中，有对应的.mrk标记文件（辅助稀疏索引定位数据块）。预排序和列存储使得范围扫描和聚合计算极其高效。
  - 特点： 在聚合查询、多表JOIN（特定场景）、扫描大范围数据、全表扫描方面性能极其强悍（比MySQL快几个数量级）。点查（按主键查单行）效率很低（需要扫描多个数据块），不擅长高并发小查询（资源消耗相对大）。

- MySQL (InnoDB):

- - 架构/原理：

- - - 行式存储： 读取一行需要读取该行所有列的数据（即使查询只用到其中几列）。
    - B+Tree索引： 聚簇索引（主键）存储整行数据，二级索引存储主键值。通过索引可以高效定位单行或小范围行（点查、范围查）。
    - 优化器： 基于成本的优化器选择执行计划（是否使用索引、使用哪个索引、JOIN顺序等）。

- - 表存储： 数据存储在聚簇索引的叶节点。查询通过遍历B+树快速定位记录。
  - 特点： 在点查、小范围查询、基于索引的精确匹配查询方面效率极高，延迟很低。擅长处理高并发的小查询。全表扫描、大范围聚合查询（尤其是GROUP BY、SUM/COUNT等无合适索引时）效率较低，容易成为性能瓶颈。

5. 总结对比表：

操作	ClickHouse (OLAP)	MySQL (InnoDB, OLTP)
写入 (`INSERT`)	高吞吐，批量优先，异步落盘，延迟较高。分区高效。	低延迟，实时，支持高并发小事务写入。
删除 (`DELETE`)	极低效（异步Mutation），避免单行删除。分区删除高效。	高效（行级），事务性，空间可复用。`TRUNCATE`极快。
更新 (`UPDATE`)	极低效（异步Mutation），强烈避免。引擎模拟更新或分区替换更优。	高效（行级），事务性，OLTP核心操作。
查询 (`SELECT`)	聚合、扫描、大范围JOIN极快（列存、向量化、稀疏索引、MPP）。点查效率低，不擅长高并发小查询。	点查、小范围查询极快（B+Tree索引）。大聚合、全表扫描慢。擅长高并发小查询。
设计哲学	分析优先：牺牲实时修改效率，换取海量数据下的极致查询速度。	事务优先：保证ACID，优化单行操作的实时性和并发性。

关键建议：

选型： 需要频繁增删改（特别是单行操作）和高并发点查？选MySQL。需要分析海量历史数据做快速聚合报表？选ClickHouse。两者经常配合使用（MySQL处理业务，ClickHouse做分析）。
ClickHouse最佳实践：

- 写入： 大批量、低频率写入。使用INSERT ... SELECT或clickhouse-client --query ... --input_format...高效导入。
- 删除/更新： 尽量通过设计规避。必须删除时，优先使用ALTER TABLE ... DROP/DETACH PARTITION。考虑使用CollapsingMergeTree等引擎处理更新。
- 查询： 充分利用聚合和预聚合（AggregatingMergeTree, Materialized Views）。谨慎设计ORDER BY键（主键）和分区键。避免高频点查。
- 表结构： 设计为“只追加”模式，分区合理（通常按时间），选择合适的主键顺序。

理解这些底层架构、存储和原理上的差异，是正确使用和优化ClickHouse与MySQL的关键。希望这份详细的对比能帮助你更好地进行技术选型和数据库设计。

6. 参考链接

Handling Updates and Deletes in ClickHouse

clickhouse docs | en/sql-reference/statements/alter/update

clickhouse blog | handling-updates-and-deletes-in-clickhouse

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若转载，请注明出处：http://www.pswp.cn/news/910514.shtml
繁体地址，请注明出处：http://hk.pswp.cn/news/910514.shtml
英文地址，请注明出处：http://en.pswp.cn/news/910514.shtml

如若内容造成侵权/违法违规/事实不符，请联系英文站点网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

低压电工作业中，如何正确选用熔断器的额定电流？

低压电工作业中，如何正确选用熔断器的额定电流？

在低压电工作业中，正确选用熔断器额定电流需综合考虑负载类型、额定电流等因素，具体方法如下： 照明电路：对于白炽灯负载，熔体额定电流可按被保护电路上所有白炽灯工作电流之和的 1.1 倍选取。若是日光灯和高压水银荧…

阅读更多...

MySQL：索引优化实战技巧

MySQL：索引优化实战技巧

目录一、前言二、基础知识回顾三、索引设计优化 1.遵循最左匹配原则，合理设计联合索引顺序 2.利用覆盖索引避免回表查询 3.针对字符串列使用前缀索引 4.合理使用复合索引替代多个单列索引 5.使用前缀索引优化模糊查询的左匹配四、索引使用优化 1.避免在…

阅读更多...

开关电源计算辅助软件SMPSKIT V10.3

开关电源计算辅助软件SMPSKIT V10.3

资料下载地址：开关电源计算辅助软件SMPSKIT V10.3 SMPSKIT ： 内置一些常见IC的计算内置绝大多数磁芯数据内置变压器分层计算器可用户编程功能包含绝大多数拓…

阅读更多...

OpenHarmony应用开发-全量包的使用

OpenHarmony应用开发-全量包的使用

文章目录一、下载full-sdk二、替换本地对应版本的SDK1.查看本地SDK安装目录2.替换对应的SDK版本三、升级APL权限为系统权限（升级后便可使用系统接口）四、重启IDE并重新进行应用签名总结一、下载full-sdk 可以在官方提供的“每日构建”中搜索对应版本…

阅读更多...

sudo安装pip包的影响

sudo安装pip包的影响

使用 sudo 安装的 pip 包和不使用 sudo 安装的 pip 包在 Ubuntu 20.04 上有以下几个主要区别： 1. 安装位置： 使用 sudo: 包会被安装到系统级别的 Python 环境中，通常是 /usr/local/lib/python3.8/dist-packages/ 或 /usr/lib/python3/dist-…

阅读更多...

uniapp 多图上传，加水印功能(全平台通用)

uniapp 多图上传，加水印功能(全平台通用)

多图上传和水印都是比较难得，特别是有的api只支持在小程序用，h5不给用效果图普通的多图上传 // 多图上传 // count：最大数量 export function headerUploads0(count 9, orderNumber , watermarkInfo) {return new Promise((resolve, r…

阅读更多...

【appium】5. Appium WebDriver 支持的常用方法汇总

【appium】5. Appium WebDriver 支持的常用方法汇总

下面是一个完整的 Appium WebDriver 支持的常用方法汇总，并附上典型用法示例。一、元素查找方法/元素操作方法 ✅ 使用 find_element() 和 find_elements() from appium import webdriver from appium.webdriver.common.appiumby import AppiumBy# 单个元素查找 …

阅读更多...

FreeRTOS 介绍、使用方法及应用场景

FreeRTOS 介绍、使用方法及应用场景

一、FreeRTOS 概述 FreeRTOS 是一款广泛应用于嵌入式系统的实时操作系统（RTOS），具有开源、可移植、可裁剪、轻量级等显著特点。它最初由 Richard Barry 开发，如今已成为全球开发者在物联网、工业控制、消费电子等领域的热门选择&a…

阅读更多...

深度解析 Caffeine：高性能 Java 缓存库

深度解析 Caffeine：高性能 Java 缓存库

1. Caffeine 简介 Caffeine 是一个基于 Java 8 的高性能本地缓存库，由 Ben Manes 开发，旨在替代 Google Guava Cache，提供更优的缓存策略、更高的吞吐量和更灵活的配置。核心优势 ✅ 卓越的性能：采用优化的数据结构&#xff0…

阅读更多...

创客匠人赋能创始人 IP 打造：健康行业知识变现案例深度解析

创客匠人赋能创始人 IP 打造：健康行业知识变现案例深度解析

在知识服务行业蓬勃发展的当下，创始人 IP 打造已成为知识变现的核心驱动力。创客匠人近期披露的陪跑案例显示，通过系统化的线上线下联动运营，传统行业从业者可高效实现 IP 价值转化。以亓黄中医科技创始人吴丰言老师为例，其在创客…

阅读更多...

64、最小路径和

64、最小路径和

题目： 解答： 简单dp。定义：dp[i][j]为到达(i,j)所需要的最短路程初始化：dp[0][0]grid[0][0]，同时对第一行和第一列的，第i个就是前i个之和加上自身递归：dp[i][j]min(dp[i-1][j],dp[i][j-1…

阅读更多...

获取连接通义千问大语言模型配置信息的步骤:api_key、api_url

获取连接通义千问大语言模型配置信息的步骤:api_key、api_url

一、注册并开通通义千问API服务 1. 注册阿里云账号访问阿里云官网点击右上角"免费注册"，按指引完成账号注册和实名认证 2. 开通通义千问API服务进入通义千问API产品页点击"立即开通"，按提示完成服务开通（部分服务…

阅读更多...

汽车加气站操作工考试题库含答案【最新】

汽车加气站操作工考试题库含答案【最新】

1.天然气的主要成分是（）。 A. 乙烷 B. 乙烯 C. 甲烷 D. 乙炔答案：C 2.CNG 加气站中，加气机的加气软管应（）进行检查。 A. 每天 B. 每周 C. 每月 D. 每季度答案：A 3.储气罐的安全阀应&#xf…

阅读更多...

显示任何结构的数组对象数据【向上自动滚动】

显示任何结构的数组对象数据【向上自动滚动】

显示任何结构的数组对象数据 <!DOCTYPE html> <html lang"zh-CN"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>地图编辑软件 - 数…

阅读更多...

GPIO模式详解

GPIO模式详解

一、GPIO的八种模式 GPIO支持4种输入模式（浮空输入、上拉输入、下拉输入、模拟输入）和4种输出模式（开漏输出、开漏复用输出、推挽输出、推挽复用输出）。 GPIO_Mode_AIN模拟输入GPIO_Mode_IN_FLOATING浮空输入GPIO_Mode_IPD下拉输…

阅读更多...

django rest_framework 自定义403 Forbidden错误页面

django rest_framework 自定义403 Forbidden错误页面

django本来有是可以很方便自定义HTTP错误页面的，网上资料一大把。核心是在项目的urls代码中增加handler403的定义，比如： handler403 "app.views.your_custom_view" 404，500都是一样的，重新定义handler404…

阅读更多...

Kafka Streams架构深度解析：从并行处理到容错机制的全链路实践

Kafka Streams架构深度解析：从并行处理到容错机制的全链路实践

在流处理技术领域，Kafka Streams以其轻量级架构与Kafka生态的深度整合能力脱颖而出。作为构建在Kafka生产者/消费者库之上的流处理框架，它通过利用Kafka原生的分区、副本与协调机制，实现了数据并行处理、分布式协调与容错能力的无缝集成。本文…

阅读更多...

【嵌入式硬件实例】-555定时器控制舵机/伺服电机

【嵌入式硬件实例】-555定时器控制舵机/伺服电机

555定时器控制舵机/伺服电机文章目录 555定时器控制舵机/伺服电机1、555定时器介绍2、舵机/伺服电机介绍3、硬件准备与接线使用 555 定时器 IC 的伺服电机控制器和测试仪电路是一个简单的电路，可用于生成操作伺服电机所需的控制信号。该电路允许我们通过按下按钮手动驱动/控制…

阅读更多...

国产麒麟安装可视化数据库软件DBeaver（图解)

国产麒麟安装可视化数据库软件DBeaver（图解)

目录编辑DBeaver介绍官网通过强制使用 Ubuntu 模板来修复 add-apt-repository 重新添加 PPA 撤销更改（可选） 官网直接下载 DBeaver CE 下载好后安装软件启动方式一启动方式二启动成功在左侧右击新建连接安装驱动测…

阅读更多...

线程池 JMM 内存模型

线程池 JMM 内存模型

线程池 & JMM 内存模型文章目录线程池 & JMM 内存模型线程池线程池的创建ThreadPoolExecutor 七大参数饱和策略ExecutorService 提交线程任务对象执行的方法：ExecutorService 关闭线程池的方法：线程池最大线程数如何确定？ volatile…

阅读更多...

最新文章