在做 280. 摆动排序 时,有一版 python 题解,里面直接用了sort() ,又用了一个简单的 for 循环,但整体时间复杂度为 O(n⋅log(n)) ,那么问题就出自这个 sort() ,所以在这分析一下 sort() 的复杂度。

Python 的 list.sort() 用的是 TimSort 算法,而 TimSort 是一个稳定的混合排序算法,结合了归并排序和插入排序的优点。

那么在最坏情况下, sort() 函数的时间复杂度为什么是 O(n⋅log(n)) 呢?

前面提到 sort() 用的就是 TimSort 算法,而 TimSort 本质上是一种归并排序。最坏的情况下,数据完全无序,此时 TimSort 会退化为标准的归并排序。而归并排序的时间复杂度是 O(n⋅log(n))。

先大概总结下归并排序的算法复杂度由来:

  • 分解:将长为 n 的列表递归地分成两半,这会形成一个深度为 log(n) 的递归树。 → 把规模减半,产生 log n 层递归。
  • 合并:每层递归中,均需将两个已排序的子列表合并成一个,这个过程需要遍历所有元素,因此每层的时间复杂度是 O(n)。 → 每层都要做一次线性合并,每层代价 O(n)。

两者相乘,得到总的时间复杂度为 O(n⋅log(n))。

来个例子:
数组 A = [38, 27, 43, 3, 9, 82, 10]1. 分解递归地把数组对半劈开,直到只剩单个元素(天然有序):[38 27 43 3 | 9 82 10][38 27 | 43 3] ......[38] [27] [43] [3] [9] [82] [10]2. 合并自底向上把“已排好序的两段”归并成更长的一段。合并 [38] 与 [27] → [27 38]合并 [43] 与 [3]  → [3 43]合并 [27 38] 与 [3 43] → [3 27 38 43]右侧同理 → [9 10 82]最后把 [3 27 38 43] 与 [9 10 82] 合并 → [3 9 10 27 38 43 82]

现在仔细分析一下,归并排序的核心思想就是 —— 先把左半边排好,再把右半边排好,最后把两个已排好的部分合并。代码如下:

// JAVA
public class MergeSort{public static void sort(int[] array) {if(array == null || array.length == 0){return;}mergerSort(array, 0, array.length - 1);}// 递归private static void mergeSort(int[] array, int left, int right) {if(left < right){int mid = left + (left + right) / 2;// 递归排序左半部分mergeSort(array, left, mid);// 递归排序右半部分mergeSort(array, mid + 1, right);// 合并 2 个已排序的部分(归并)merge(array, left, mid, right);}}// 合并 2 个已排序的部分(将前后两个相邻有序表归并成一个有序表)private static void merge(int[] array, int left, int mid, int right){// 创建临时数组存储合并后的结果,所以空间复杂度为 O(n)// 若用 C,可 malloc 申请,注意格式 ElemType *B = (ElemType *)malloc(n*sizeof(ElemType));int[] temp = new int[right - left +1];int i = left; // 左半部分的起始索引int j = mid + 1; // 右半部分的起始索引int k = 0; // 临时数组的当前索引// 将 2 个部分的元素按顺序复制到临时数组while (i <= mid && j <= right){if (array[i] <= array[j])  temp[k++] = array[i++];  // 可以看出这是一个稳定的排序算法elsetemp[k++] = array[j++];}// 若有剩余部分,都复制到临时数组while(i <= mid) temp[k++] = array[i++]; // 第1个表未检测完while(j <= right) temp[k++] = array[j++]; // 第2个表未检测完// 将排序后的元素从临时数组复制回原数组中for (k = 0; k < temp.length; k++) {array[left + k] = temp[k];}}// 测试归并排序函数public static void main(String[] args) {int[] array = {38, 27, 43, 3, 9, 82, 10};sort(array); // 调用归并排序函数for (int value : array){System.out.print(value + " ");}}
}
# python
def merge_sort(arr):
"""
归并排序函数
arr: 待排序列表
"""if len(arr) > 1:mid = len(arr) // 2  # 除后向下取整,找到中间索引L = arr[:mid]  # 左半部分[0, mid) 不含 midR = arr[mid:]  # 右半部分[mid, len(arr)-1]含 mid	# 递归排序merge_sort(L)merge_sort(R)merge(arr, L, R)  # 合并两个有序子列表def merge(arr, L, R):
"""
合并两个已排序子列表到原数组 arr	
arr: 原始数组(最终有序)
L: 左子列表(已排序)
R: 右子列表(已排序)
"""i = j = k = 0# 逐一比较 left 和 right 中的元素,将较小值放入 arrwhile i < len(L) and j < len(R):if L[i] < R[j]:arr[k] = L[i]i += 1else:arr[k] = R[j]j += 1k += 1# 若有剩余部分,都复制到 arr 中while i < len(L):arr[k] = L[i]i += 1k += 1while j < len(R):arr[k] = R[j]j += 1k += 1if __name__ == "__main__":nums = [38, 27, 43, 3, 9, 82, 10]print("排序前:", nums)merge_sort(nums)print("排序后", nums)
注意:Python 切片 arr[:mid]、arr[mid:] 会创建新的列表对象,而非对原数组做“视图”或指针操作。merge_sort 的每一次递归调用里,都额外复制出两个子列表:L  = arr[:mid]R = arr[mid:]这些临时列表占用的空间总和在最底层达到 O(n),再加上递归栈的 O(log n),整体空间复杂度就是 O(n)。所以,看起来是原地归并(对原始 arr 直接操作),但实际上产生了额外的空间占用。

那么,下面我们来研究一下这个递归栈。

前面说了,归并排序的时间复杂度为 O(n log n),且 最坏 / 平均 / 最好 三种情况都是这个量级。

所以若是内存允许(归并空间O(n),快排空间 O(log n)),只考虑时间复杂度,则与快排(平均 O(n log n),最坏O(n²))相比,首选归并。

长度为 n 的列表,完成归并排序所需的基本操作次数,设为 T(n)。

merge 阶段把两个已排好序的子序列合并成一个,需要逐元素扫描一次,时间复杂度为 O(n)。

所以完成归并,总的基本操作次数为

	T(1) = O(1)T(n) = 2T(n/2) + O(n)   (n >= 2)    2·T(n/2):把 n 个元素分成左右两半,各递归排序一次。

递归树的大致结构如下:

层 0:          n  			 (merge 合并开销 n)	         1 段
层 1:      n/2   n/2 		 (每段合并开销 n/2+n/2 = n)    2 段
层 2:   n/4 n/4 n/4 n/4 	 (合并开销还是 n)				 2² 段
...			  ...
层 k: 	每段长度 n/2^k,共 2^k 段,合并总开销仍是 n   		 2^k 段

树高 h = log₂ n ,每层合并开销都是 n,因此总时间:T(n) = n · log₂ n = O(n log n)

归并排序的切分点固定在中间,与输入数据分布无关;合并阶段总是线性扫描。因此,最坏 / 平均 / 最好情况的时间复杂度完全一致,都是 O(n log n)。

比较次数 ≈ n log₂ n − n + 1(可忽略低阶项)。
额外复制:每次 merge 都线性复制一次,但只影响空间,不影响时间复杂度。

空间上:
每次进 merge_sort(arr),递归栈也就是调用栈里主要保存:

  • 局部变量 mid
  • 两个新列表:left, right(切片生成,长度之和≈n)
  • 返回地址、当前代码行号等解释器内部信息

2 个子列表本身是在堆上分配的,但它们的 引用 存在栈里,所以每递归 1 次,要额外消耗 O(n) 的堆空间;而栈本身只存引用和少量标量 ,因此单个帧的栈空间占用是常数级。


再看递归深度:归并排序每次把区间折半,因此递归深度是 depth_max = ⌊log₂ n⌋ + 1

递归栈空间总量:

  • 栈空间:只存每层的一个常数大小的帧,因此总量是 O(depth_max) = O(log n)
  • 堆空间:由于每层都复制子列表,且同一时刻,最多仅 1 条从根到叶子的路径上,存在各层副本,因此最大同时占用的堆空间是 n + n/2 + n/4 + … ≈ 2n = O(n)

这就是 归并排序 的空间复杂度 O(n) 的来源。

归并排序在任何情况下,时间上都稳定运行在 O(n log n),无退化风险,这也是它被 Python、Java 等语言内置为稳定排序的重要原因。

  1. python 的内置 sort 函数底层基于 Timsort 算法,而 Timsort 算法本质上是一种归并排序,所以时间复杂度为 O(n log n)
  • 最坏情况下, Timsort 算法时间复杂度为 O(n log n)。
  • 最好情况下,即全局有序 or 接近有序时,Timsort 算法只线性扫描一次,无需归并,时间复杂度为 O(n)。
  • 平均情况下,Timsort 算法需要 log n 级别的归并层数,与经典归并和快排持平,时间复杂度为 O(n log n)。


    综上,sort 函数时间复杂度为 O(n log n)。
  1. 首先,归并排序的空间复杂度为 O(n),这个前面有提到。而 Timsort 最好、平均情况下,空间复杂度是 O(log n),最坏情况下是 O(n)。所以 python 的内置 sort 函数空间复杂度与 Timsort 一样,因为在算法分析里通常按最坏情况报,所以其空间复杂度严格来讲是 O(n)。

  在实际使用中,尤其是面试或教科书中,Python 的 list.sort() 被视为原地排序,不额外暴露用户层级的空间使用,因此常简化为 O(1)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/95494.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/95494.shtml
英文地址,请注明出处:http://en.pswp.cn/bicheng/95494.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【光照】Unity中的[经验模型]

【从UnityURP开始探索游戏渲染】专栏-直达 图形学第一定律&#xff1a;“看起来对就对” URP光照模型发展史 ‌2018年‌&#xff1a;URP首次发布&#xff08;原LWRP&#xff09;&#xff0c;继承传统前向渲染的Blinn-Phong简化版‌2019年‌&#xff1a;URP 7.x引入Basic Shade…

uniapp小程序使用自定义底部tabbar,并根据用户类型动态切换tabbar数据

1.注意点 在pages.json中配置tabbar如下字段&#xff1a;custom&#xff1a;true &#xff0c;会自动隐藏原生tabbar&#xff0c;使用自定义的tabbar2.如何自定义呢 可以使用第三方组件库的tabbar组件&#xff0c;然后二次封装下内部封装逻辑&#xff1a; 1.点击切换逻辑 2.根据…

Redis 哨兵 (基于 Docker)

目录 1. 基本概念 2. 安装部署 (基于 Docker) 2.1 使用 docker 获取 redis 镜像 2.2 编排 主从节点 2.3 编排 redis-sentinel 节点 3. 重新选举 4. 选举原理 5. 总结 1. 基本概念 名词 逻辑结构物理结构主节点Reids 主服务一个独立的 redis-server 进程从节点Redis 从…

Python学习-day4

Python 语言的运算符: 算术运算符比较&#xff08;关系&#xff09;运算符赋值运算符逻辑运算符位运算符成员运算符身份运算符运算符优先级 算术运算符 定义变量a 21&#xff0c;变量b 10。运算符描述实例加 - 两个对象相加a b 输出结果 31-减 - 得到负数或是一个数减去另一…

Vite 插件 @vitejs/plugin-legacy 深度解析:旧浏览器兼容指南

&#x1f4d6; 简介 vitejs/plugin-legacy 是 Vite 官方提供的兼容性插件&#xff0c;专门用于为现代浏览器构建的应用程序提供对旧版浏览器的支持。该插件通过自动生成兼容性代码和 polyfill&#xff0c;确保您的应用能够在 IE 11 等旧版浏览器中正常运行。 核心价值 向后兼…

数据质检之springboot通过yarn调用spark作业实现数据质量检测

Spring Boot 应用中通过 YARN 来调用 Spark 作业的来执行数据质检。这是一个非常经典的数据质量检测、数据优化的常用架构,将Web服务/业务处理(Spring Boot)与大数据质检(Spark on YARN)解耦。 核心架构图 首先,通过一张图来理解整个流程的架构: 整个流程的核心在于,…

SQL优化_以MySQL为例

MySQL SQL 优化详细教程与案例 1. 理解SQL执行过程 在优化之前&#xff0c;需要了解MySQL如何处理SQL查询&#xff1a; 客户端发送SQL语句到服务器服务器检查查询缓存&#xff08;MySQL 8.0已移除查询缓存&#xff09;解析器解析SQL&#xff0c;生成解析树预处理器验证权限和表…

探索数据结构中的 “树”:揭开层次关系的奥秘

在计算机科学的广袤森林中&#xff0c;有一种数据结构如同参天大树般支撑着无数应用的根基 —— 它就是 “树”&#xff08;Tree&#xff09;。它不仅仅是一个抽象概念&#xff0c;更是我们理解和组织信息、模拟现实世界层级关系的强大工具。1. 什么是 “树”&#xff1f;从家族…

技术框架之RPC

一、序言&#xff1a;为什么我们需要RPC&#xff1f;在单体应用时代&#xff0c;函数调用是进程内的简单操作。但随着业务规模扩大&#xff0c;系统被拆分为多个独立服务&#xff08;如订单服务、支付服务&#xff09;&#xff0c;服务间通信成为刚需。早期开发者常使用HTTPJSO…

【光照】Unity中的[光照模型]概念辨析

【从UnityURP开始探索游戏渲染】专栏-直达 基础光照模型‌ ‌标准光照模型&#xff08;Standard Lighting Model&#xff09;‌ ‌定义‌&#xff1a;传统光照计算的框架&#xff0c;通常包含漫反射、镜面反射和环境光三部分。‌特点‌&#xff1a;非物理经验模型&#xff0c…

MCU上跑AI—实时目标检测算法探索

MCU上跑实时目标检测算法 前几年一直忙着别的事情没有在技术分享上下功夫, 这段时间稳定下来就想和几个志同道合的朋友做点有意义的事情, 于是乎就使用MCU做了个与AI有识别相关的 “小玩意儿”. 本人负责嵌入式端相关的编码, AI相关的工作由好友 AgeWang 负责. 这儿把一些成果给…

SpringBoot 整合 RabbitMQ 的完美实践

引言: 本文总字数:约 9200 字 预计阅读时间:38 分钟 为什么 RabbitMQ 是消息中间件的优选? 在分布式系统架构中,消息中间件扮演着 "交通枢纽" 的角色,负责协调各个服务之间的通信。目前主流的消息中间件有 RabbitMQ、Kafka 和 RocketMQ,它们各具特色: Kafka…

nestjs 发起请求 axios

1、下载npm i --save nestjs/axios axios2、全局配置import { HttpModule } from nestjs/axios;Global() Module({imports: [HttpModule.registerAsync({inject: [ConfigService],useFactory: async (configService: ConfigService) > {return {timeout: configService.get(…

将 Logits 得分转换为概率,如何计算

场景&#xff1a;动物识别&#xff0c;输入一张28*28的图像&#xff0c;模型输出属于 猫、狗、鸟 哪个类型。需求&#xff1a;假设模型 ​​Logits&#xff08;模型在每个类别的置信度得分&#xff09; 输出为​​&#xff1a;[猫: 3.2, 狗: 1.5, 鸟: -0.8]。计算 ​​Softmax …

【Qt】bug排查笔记——QMetaObject::invokeMethod: No such method

问题如题目所示&#xff1a;QMetaObject::invokeMethod: No such method xxxx&#xff0c;在网上好一顿查&#xff0c;又将查到的资料喂给了 Ai&#xff0c;才最终将问题解决&#xff0c;特此记录下。 一、问题背景 在做公司项目时&#xff0c;使用了插件的方式开发。主程序加载…

Spring Boot手写10万敏感词检查程序

使用Spring Boot手写10万敏感词检查程序 本文将介绍如何使用Spring Boot构建一个高效的敏感词检查系统,能够处理多达10万个敏感词的检测需求。我们将使用DFA(Deterministic Finite Automaton)算法来实现高效匹配,并提供RESTful API接口。 实现步骤 1. 创建Spring Boot项…

零构建的快感!dagger.js 与 React Hooks 实现对比,谁更优雅?

“Add Tags” 技术方案并行对比&#xff1a;React Hooks vs dagger.js&#xff08;含核心 JS 代码&#xff09; 源码&#xff1a; React Hooks&#xff1a;https://codepen.io/prvnbist/pen/jJzROe?editors1010dagger.js&#xff1a;https://codepen.io/dagger8224/pen/ZErjzw…

矩池云中LLaMA- Factory多机多卡训练

LLaMA Factory 是一款开源低代码大模型微调框架&#xff0c;集成了业界最广泛使用的微调技术&#xff0c;支持通过 Web UI 界面零代码微调大模型&#xff0c;目前已经成为开源社区内最受欢迎的微调框架之一。但是在矩池云上如何使用LLaMA-Factory多机多卡训练模型呢&#xff1f…

Nginx的反向代理与正向代理及其location的配置说明

一、Nginx中location匹配优先级Nginx中location匹配优先级location支持各种匹配规则&#xff0c;在多个匹配规则下&#xff0c;Nginx对location的处理是有优先级的&#xff0c;优先级高的规则会优先进行处理&#xff1b;而优先级低的规则可能会最后处理或者不进行处理。注意&am…

神经网络正则化三重奏:Weight Decay, Dropout, 和LayerNorm

正则化是机器学习中防止模型过拟合、提升泛化能力的核心技术。Weight Decay、Dropout和LayerNorm是三种最常用的方法&#xff0c;但它们的工作原理和首要目标截然不同。下面的流程图揭示了它们的核心区别与联系&#xff1a; #mermaid-svg-vymek6mFvvfxcWiM {font-family:"…