Elasticsearch 通过多种机制确保数据在分布式环境中的一致性，但由于其分布式和近实时（Near Real-Time, NRT）的特性，它提供的是最终一致性（Eventual Consistency），而非强一致性。以下是核心机制和策略：

一、写入一致性控制（Write Consistency）

在写入操作（如索引/更新文档）时，可通过参数 consistency 控制最小副本数要求：

PUT my-index/_doc/1?consistency=quorum
{"field": "value"
}

可选值：

quorum（默认）：多数分片副本可用（公式：int( (primary + number_of_replicas) / 2 ) + 1）。
all：所有分片副本必须可用。
one：仅主分片可用即可。

👉 作用：防止网络分区时数据写入不一致。

二、主分片机制（Primary Shard）

所有写操作仅由主分片处理，再同步到副本分片。
写操作顺序性：主分片按收到请求的顺序执行写入，确保操作序列一致。

三、乐观并发控制（Optimistic Concurrency Control）

使用 _version 或 if_seq_no/if_primary_term 避免并发冲突：

PUT my-index/_doc/1?if_seq_no=5&if_primary_term=1
{"field": "new_value"
}

👉 如果版本号不匹配，操作失败（返回 409 Conflict），由客户端决定重试或合并数据。

四、事务日志（Translog, Write-Ahead Log）

写入操作首先存入内存缓冲区，同时追加到磁盘事务日志（Translog）。
故障恢复：节点重启时，通过重放 Translog 恢复未刷新的数据。
刷新（Refresh）：默认每秒将内存缓冲区数据生成新的 Lucene 段（可搜索，但尚未持久化）。
刷盘（Flush）：定期（或 Translog 达到阈值）将 Lucene 数据持久化到磁盘，并清空 Translog。

📌 关键点：Translog 确保即使宕机，已确认的写入操作不会丢失。

五、副本同步（Replication）

主分片写入成功后，并行将操作转发到副本分片。
同步要求：
- 主分片等待所有副本分片的成功响应（可通过 wait_for_active_shards 参数调整）。
- 若副本失败，主分片通知主节点将副本标记为失效，并在其他节点重建副本。

六、读一致性（Read Consistency）

默认近实时（NRT）：写入后约 1 秒（可调整 refresh_interval）才可被搜索到。
指定刷新：可通过 ?refresh=true 强制立即刷新，但影响性能。
搜索参数控制：
- preference：控制查询路由（如 _local 优先本地分片）。
- wait_for_active_shards：搜索时等待指定数量分片可用。

七、脑裂防护（Split-Brain Protection）

通过配置 discovery.zen.minimum_master_nodes（旧版）或 cluster.initial_master_nodes（新版）避免网络分区时出现多主节点，导致数据分裂。

八、最终一致性的体现场景

场景	表现
写入后立即查询	可能查不到（因未刷新）/ 可能查到主分片但副本未同步
副本分片故障期间写入	数据写入主分片，副本恢复后自动同步
节点宕机恢复	通过 Translog 恢复未持久化数据，副本从主分片重新同步

九、生产环境建议

合理设置副本数：至少 1（允许单节点故障）。
调整刷新间隔：对实时性要求高的场景可缩短 refresh_interval（代价：资源消耗增加）。
关键写入操作：使用 ?refresh=wait_for 或手动刷新。
监控分片状态：通过 GET _cluster/health 关注 active_shards_percent_as_number。

// 创建索引时优化配置示例
PUT my-index
{"settings": {"number_of_replicas": 2,"refresh_interval": "500ms",  // 降低刷新延迟"translog.durability": "request"  // 每次请求后刷写Translog（更强持久化）}
}