归并排序:分治策略的经典实现
算法原理
归并排序采用分治法策略,包含三个关键步骤:
-
分解:递归地将数组分成两半
-
解决:对子数组进行排序
-
合并:将两个有序子数组合并为一个有序数组
C语言实现
#include <stdio.h>
#include <stdlib.h>// 合并两个有序子数组
void merge(int arr[], int left, int mid, int right) {int i, j, k;int n1 = mid - left + 1;int n2 = right - mid;// 创建临时数组int *L = (int*)malloc(n1 * sizeof(int));int *R = (int*)malloc(n2 * sizeof(int));// 拷贝数据到临时数组for (i = 0; i < n1; i++)L[i] = arr[left + i];for (j = 0; j < n2; j++)R[j] = arr[mid + 1 + j];// 合并临时数组i = 0; j = 0; k = left;while (i < n1 && j < n2) {if (L[i] <= R[j]) {arr[k] = L[i];i++;} else {arr[k] = R[j];j++;}k++;}// 拷贝剩余元素while (i < n1) {arr[k] = L[i];i++;k++;}while (j < n2) {arr[k] = R[j];j++;k++;}free(L);free(R);
}// 归并排序主函数
void mergeSort(int arr[], int left, int right) {if (left < right) {int mid = left + (right - left) / 2;mergeSort(arr, left, mid);mergeSort(arr, mid + 1, right);merge(arr, left, mid, right);}
}
性能分析
-
时间复杂度:O(n log n)(所有情况)
-
空间复杂度:O(n)(需要临时数组)
-
稳定性:稳定排序(保持相等元素顺序)
优化方向
-
小数组优化:当子数组较小时(如n<15)改用插入排序
-
原地归并:减少空间使用但增加时间复杂度
-
并行化:利用多线程处理独立子问题
堆排序:基于完全二叉树的高效排序
算法原理
堆排序利用堆数据结构的特性:
-
建堆:将无序数组构建为最大堆
-
排序:反复取出堆顶元素(最大值)并调整堆
C语言实现
#include <stdio.h>// 调整堆
void heapify(int arr[], int n, int i) {int largest = i; // 初始化最大元素为根int left = 2 * i + 1; // 左子节点int right = 2 * i + 2; // 右子节点// 如果左子节点大于根if (left < n && arr[left] > arr[largest])largest = left;// 如果右子节点大于当前最大值if (right < n && arr[right] > arr[largest])largest = right;// 如果最大值不是根节点if (largest != i) {// 交换int temp = arr[i];arr[i] = arr[largest];arr[largest] = temp;// 递归调整受影响的子堆heapify(arr, n, largest);}
}// 堆排序主函数
void heapSort(int arr[], int n) {// 构建最大堆(从最后一个非叶子节点开始)for (int i = n / 2 - 1; i >= 0; i--)heapify(arr, n, i);// 逐个提取元素for (int i = n - 1; i > 0; i--) {// 将当前根移动到数组末尾int temp = arr[0];arr[0] = arr[i];arr[i] = temp;// 在减小的堆上调用heapifyheapify(arr, i, 0);}
}
性能分析
-
时间复杂度:O(n log n)(所有情况)
-
空间复杂度:O(1)(原地排序)
-
稳定性:不稳定排序(可能改变相等元素顺序)
优化方向
-
堆化优化:减少不必要的比较操作
-
多叉堆:使用d叉堆减少树高度
-
并行建堆:利用多线程加速建堆过程
算法对比与选择指南
特性 | 归并排序 | 堆排序 |
---|---|---|
时间复杂度 | O(n log n) | O(n log n) |
空间复杂度 | O(n) | O(1) |
稳定性 | 稳定 | 不稳定 |
适用场景 | 大数据量、外部排序 | 内存受限环境 |
最佳用途 | 需要稳定结果时 | 优先级队列实现 |
实际应用建议
-
选择归并排序:
-
需要稳定排序结果
-
处理大数据集(特别是外部排序)
-
内存充足的情况
-
-
选择堆排序:
-
内存受限环境
-
需要原地排序
-
实现优先级队列
-
-
其他考虑:
-
小规模数据(n<100)可考虑简单排序(如插入排序)
-
现代CPU架构下,归并排序的缓存友好性可能带来实际性能优势
-
总结
归并排序和堆排序都是基于O(n log n)复杂度排序算法,各有其特点和适用场景。
归并排序作为分治策略的经典实现,优势在于稳定性、可预测的性能以及适用于外部排序的特点。它的递归实现简洁优雅,是理解分治思想的绝佳案例。在实际应用中,归并排序是处理大规模数据、特别是无法全部装入内存时的首选算法。
堆排序则充分利用了完全二叉树的性质,实现了原地排序,空间效率极高。它不仅是一种排序算法,更重要的是其堆数据结构在优先级队列等场景中有广泛应用。堆排序特别适合内存受限的环境,或者需要同时维护优先级队列功能的场景。
在实际开发中,选择排序算法需要综合考虑数据结构特征、稳定性要求、内存限制等多方面因素。现代标准库通常会在不同场景下选择最适合的排序算法,甚至采用混合策略以获得最佳性能。