文章目录

  • Union-Find
    • 1 基本概念
      • 1.1 `Find(x)` - 查询操作
      • 1.2 `Union(x, y)` - 合并操作
    • 2 并查集的结构和优化
      • 2.1 数据结构设计
      • 2.2 两大优化策略(关键)
        • 2.2.1 路径压缩(Path Compression)
        • 2.2.2 按秩合并(Union by Rank or Size)
    • 3 使用并查集的注意事项
    • 4 典型应用场景
      • 4.1 判断连通性
      • 4.2 等价类/合并集合
      • 4.3 检测环路(图中是否有环)
      • 4.4 岛屿问题/连通区域
      • 4.5 网络连接问题
    • 5 实现模板
    • 6 问题示例:合并等价字符集合(字典序最小)
    • 7 总结

Union-Find

1 基本概念

并查集是一种用于处理集合合并与查询的数据结构,主要用于解决:

  • 判断两个元素是否属于同一个集合
  • 合并两个集合
  • 图的连通性问题(如 Kruskal 最小生成树、岛屿数量、等价类问题)

核心思想:每个元素初始是一个独立的集合(自成一个树的根)。使用两个操作:

  1. find(x):查找元素 x 所在集合的代表元(根)
  2. union(x, y) / unite(x, y):将元素 x 和 y 所在的两个集合合并为一个

1.1 Find(x) - 查询操作

  • 找出元素 x 所在集合的代表元(也叫根节点、父节点)
  • 判断两个元素是否属于同一个集合:只需比较它们的代表元是否相同

1.2 Union(x, y) - 合并操作

  • 将元素 xy 所在的两个集合合并
  • 目的是把两个集合的元素归于同一个集合(也就是连通)

并查集的本质:将多个不相交的集合合并,并在查询时保持高效


2 并查集的结构和优化

2.1 数据结构设计

  • parent[i]:表示第 i 个元素的父节点(初始时每个元素是自己的父亲)

  • 常见扩展字段:

    • rank[i]:节点的秩(可以理解为树的高度或大小,用于优化合并)
    • size[i]:集合的大小(如果你需要追踪每个集合的元素个数)

2.2 两大优化策略(关键)

2.2.1 路径压缩(Path Compression)
  • 优化 find(x) 操作
  • 将 x 到根节点路径上的所有节点直接指向根,降低后续查找的复杂度
  • 时间复杂度近似 O(α(n)),α 是反阿克曼函数,几乎是常数
int find(int x) {if (parent[x] != x)parent[x] = find(parent[x]);return parent[x];
}
  • 每次查询时,将 x 的所有祖先直接挂到根节点,形成扁平结构
  • 减少下次查找路径长度
2.2.2 按秩合并(Union by Rank or Size)
  • 合并时,总是将“较矮”的树合并到“较高”的树,保持整体平衡,防止链式退化
void union(int x, int y) {int px = find(x), py = find(y);if (px == py) return;if (rank[px] < rank[py])parent[px] = py;else if (rank[px] > rank[py])parent[py] = px;else {parent[py] = px;rank[px]++;}
}

3 使用并查集的注意事项

注意事项说明
初始化每个元素一开始是自己的父节点(parent[i] = i
找代表元要用 find()不要直接比较 parent[x] == parent[y],必须比较 find(x) == find(y)
使用路径压缩提高查找效率,避免变成链表结构
合并要检查代表元避免重复合并或死循环
不适合有环结构查询并查集不能表示通用图(除非用于检测是否成环)
不支持高频动态插入删除并查集适合处理固定集合或批量问题,不适合频繁插入删除

4 典型应用场景

并查集广泛应用于以下场景:

4.1 判断连通性

  • 无向图中判断两个点是否连通
  • 例题:LeetCode 547. 省份数量(朋友圈)

4.2 等价类/合并集合

  • 把多个元素按关系合并为“集合组”
  • 例题:LeetCode 1061. 按字典序排列的最小等价字符串

4.3 检测环路(图中是否有环)

  • 并查集用于无向图的成环检测
  • 例题:Kruskal 最小生成树(MST)

4.4 岛屿问题/连通区域

  • 将二维网格中相邻的“陆地”用并查集合并,统计岛屿数
  • 例题:LeetCode 200. 岛屿数量

4.5 网络连接问题

  • 网络中节点是否连通、连接多少次才能连通
  • 例题:LeetCode 1319. 连通网络的操作次数

5 实现模板

class UnionFind {
private:vector<int> parent;vector<int> rank;  // 或者 sizepublic:UnionFind(int n) {parent.resize(n);rank.resize(n, 1);iota(parent.begin(), parent.end(), 0); // parent[i] = i}// 查找根节点,并进行路径压缩int find(int x) {if (parent[x] != x)parent[x] = find(parent[x]); // 路径压缩return parent[x];}// 合并两个集合void unite(int x, int y) {int px = find(x);int py = find(y);if (px == py) return;// 按秩合并if (rank[px] < rank[py]) {parent[px] = py;} else if (rank[px] > rank[py]) {parent[py] = px;} else {parent[py] = px;rank[px]++;}}// 判断两个元素是否在同一个集合bool connected(int x, int y) {return find(x) == find(y);}
};

6 问题示例:合并等价字符集合(字典序最小)

当我们想用并查集维护字符集合时,可以做如下改造:

  • parent[26]:表示字符 ‘a’ 到 ‘z’ 的父节点
  • 合并时总是把字典序较小的字符作为根,这样找出的代表字符就是该等价类的最小字母
class Solution {
public:string smallestEquivalentString(string s1, string s2, string baseStr) {vector<int> parent(26);iota(parent.begin(), parent.end(), 0); // a-z 的并查集// 路径压缩查找function<int(int)> find = [&](int x) {if (parent[x] != x)parent[x] = find(parent[x]);return parent[x];};// 合并两个字符等价类,保留字典序较小的作为代表auto unite = [&](int x, int y) {int px = find(x);int py = find(y);if (px == py) return;if (px < py)parent[py] = px;elseparent[px] = py;};for (int i = 0; i < s1.length(); ++i) {unite(s1[i] - 'a', s2[i] - 'a');}string res;for (char c : baseStr) {res += (char)(find(c - 'a') + 'a');}return res;}
};

7 总结

问题特征是否适合使用并查集
不相交集合合并非常适合(核心用途)
判断两个元素是否属于同一集合非常高效
图的连通性/聚类问题适合
频繁增删元素不适合,建议用更复杂的数据结构
要维护复杂属性(如路径)不适合
操作说明时间复杂度
find(x)查找 x 所在集合的代表元O(α(n))
unite(x,y)合并两个集合O(α(n))
connected(x,y)判断是否在同一集合O(α(n))

由于路径压缩和按秩合并优化,几乎所有操作都是近乎常数时间。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/84373.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/84373.shtml
英文地址,请注明出处:http://en.pswp.cn/pingmian/84373.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 高频 SQL 50 题(基础版)之 【高级字符串函数 / 正则表达式 / 子句】· 上

题目&#xff1a;1667. 修复表中的名字 题解&#xff1a; select user_id, concat(upper(left(name,1)),lower(right(name,length(name)-1))) name from Users order by user_id题目&#xff1a;1527. 患某种疾病的患者 题解&#xff1a; select * from Patients where con…

Linux系统的CentOS7发行版安装MySQL80

文章目录 前言Linux命令行内的”应用商店”安装CentOS的安装软件的yum命令安装MySQL1. 配置yum仓库2. 使用yum安装MySQL3. 安装完成后&#xff0c;启动MySQL并配置开机自启动4. 检查MySQL的运行状态 MySQL的配置1. 获取MySQL的初始密码2. 登录MySQL数据库系统3. 修改root密码4.…

Java + Spring Boot项目枚举(Enum)目录建议

在Java Spring Boot项目中&#xff0c;枚举&#xff08;Enum&#xff09;的定义文件没有固定的强制目录&#xff0c;但通常遵循项目结构和最佳实践来组织代码。以下是常见的推荐位置&#xff1a; 1. 领域模型相关枚举 目录: domain/enums 或 model/enums 场景: 当枚举与业务模…

Vue 模板语句的数据来源

&#x1f9e9; Vue 模板语句的数据来源&#xff1a;全方位解析 Vue 模板&#xff08;<template> 部分&#xff09;中的表达式、指令绑定&#xff08;如 v-bind, v-on&#xff09;和插值&#xff08;{{ }}&#xff09;都在一个特定的作用域内求值。这个作用域由当前 组件…

全新AI驱动Workspace Security 套件发布!Fortinet 电子邮件安全产品矩阵升级

专注推动网络与安全融合的全球性综合网络安全解决方案供应商 Fortinet&#xff08;NASDAQ&#xff1a;FTNT&#xff09;&#xff0c;近日宣布发布新一代企业级邮件安全解决方案FortiMail Workspace Security 安全套件&#xff0c;全面增强旗下数据和生产力安全产品组合&#xf…

二十、【用户管理与权限 - 篇二】前端交互:实现用户管理界面

【用户管理与权限 - 篇二】前端交互:实现用户管理界面 前言准备工作第一部分:更新并确认前端 API 服务第二部分:添加用户管理页面的路由和侧边栏入口第三部分:实现用户列表页面第四部分:实现用户编辑对话框组件第五部分:全面测试总结前言 在上一篇《【用户管理与权限 - …

LeetCode --- 452周赛

题目列表 3566. 等积子集的划分方案 3567. 子矩阵的最小绝对差 3568. 清理教室的最少移动 3569. 分割数组后不同质数的最大数目 一、等积子集的划分方案 由于本题的数据范围不大&#xff0c;我们可以暴力枚举所有可能的划分方式&#xff0c;代码如下 // C class Solution { …

使用Python提取照片元数据:方法与实战指南

## 引言&#xff1a;元数据的重要性 照片元数据&#xff08;Metadata&#xff09;是嵌入在图像文件中的隐藏信息&#xff0c;记录了拍摄设备、时间、地理位置、光圈快门参数等关键数据。这些信息广泛应用于**数字取证**、**照片管理**、**地理标记分析**和**版权验证**等场景。…

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

阿里云ACP云计算备考笔记 (5)——弹性伸缩

目录 第一章 概述 第二章 弹性伸缩简介 1、弹性伸缩 2、垂直伸缩 3、优势 4、应用场景 ① 无规律的业务量波动 ② 有规律的业务量波动 ③ 无明显业务量波动 ④ 混合型业务 ⑤ 消息通知 ⑥ 生命周期挂钩 ⑦ 自定义方式 ⑧ 滚的升级 5、使用限制 第三章 主要定义 …

CANopen转Modbus TCP转换器助生产线智能化升级

在自动化工业控制领域&#xff0c;CANopen和Modbus TCP是两种广泛采用的通信协议。它们各自具有独特的特点和优势&#xff0c;但在某些应用场景中&#xff0c;需要设备能够同时支持这两种通信标准。这就需要一个能够实现开疆智能CANopen转Modbus TCP转换的网关KJ-TCPC-CANP设备…

C++图书管理

图书馆的书籍分类系统使用二进制标签管理&#xff0c;0 代表儿童读物&#xff0c;1 代表青少年书籍。管理员发现当前的书架排列中不允许出现青少年书籍之后连接儿童读物的情况&#xff08;即 10 子串&#xff09;。管理员每次可以交换任意两本书的位置。请计算让书架符合规定所…

汽车免拆诊断案例 | 2010款捷豹XFL车制动警告灯、DSC警告灯异常点亮

故障现象  一辆2010款捷豹XFL车&#xff0c;搭载3.0 L发动机&#xff0c;累计行驶里程约为35万km。车主反映&#xff0c;该车组合仪表上的制动警告灯、动态稳定控制系统&#xff08;DSC&#xff09;警告灯异常点亮&#xff08;图1&#xff09;&#xff0c;且提示“DSC NOT AV…

el-upload组件,上传文件失败,:on-error方法失效

el-upload组件方法失效 问题原因解决 问题 使用el-upload组件上传文件&#xff0c;有这么一个问题上传文件处理报错Excel、Word。org.apache.poi.openxml4j.exceptions.OLE2NotOfficeXmlFileException。 按上述&#xff0c;后端编写完代码&#xff0c;输出正常&#xff0c;但…

可视化图解算法50:最小的K个数

牛客网 面试笔试 TOP101 | LeetCode 面试题 17.14. 最小K个数 1. 题目 描述 给定一个长度为 n 的可能有重复值的数组&#xff0c;找出其中不去重的最小的 k 个数。例如数组元素是4,5,1,6,2,7,3,8这8个数字&#xff0c;则最小的4个数字是1,2,3,4(任意顺序皆可)。 数…

Ragflow配置注意项

在 .env文件中启用v.0.19.0版本&#xff0c;带emabedding models RAGFLOW_IMAGEinfiniflow/ragflow:v0.19.0 RAGFlow image tagImage size (GB)Has embedding models?Stable?v0.19.0≈9✔️Stable releasev0.19.0-slim≈2❌Stable releasenightly≈9✔️Unstable nightly b…

Word VBA快速制作填空题

实例需求&#xff1a;Word文档用于英语单词学习&#xff0c;重点记忆单词标记下划线&#xff0c;其内容如下图所示。 现在文档转换为填空题&#xff08;无论单词字符多少&#xff0c;填空部分统一使用10个空格&#xff09;和参考答案两部分&#xff0c;如下图所示。 示例代码如…

不变性(Immutability)模式

1. 不变性&#xff08;Immutability&#xff09;模式 1.1. 不变性模式的概念 定义&#xff1a;对象一旦被创建&#xff0c;其内部状态就不再发生变化&#xff0c;也即“只读无写”&#xff0c;不会出现并发写的问题&#xff0c;自然线程安全。 适用场景&#xff1a;只读共享…

探秘鸿蒙 HarmonyOS NEXT:鸿蒙定时器,简单倒计时的场景应用

在鸿蒙 ArkTS 开发中&#xff0c;定时器是实现动态效果和定时任务的重要工具。基于鸿蒙 API 12 及以上版本&#xff0c;ArkTS 提供了功能丰富的定时器 API&#xff0c;本文将带你全面了解定时器的使用方法。 一、定时器常用 API 介绍 ArkTS 中的定时器主要分为一次性定时器&a…

安卓基础(语义树)

进化1 package com.example.demotest.unread;import android.accessibilityservice.AccessibilityService; import android.content.res.Resources; import android.graphics.Rect; import android.util.DisplayMetrics; import android.util.Log; import android.view.access…