在操作系统中,线程切换相比进程切换更轻量级的关键原因之一是 缓存(Cache)的有效性,尤其是对 CPU 缓存(如 L1/L2/L3)和 TLB(Translation Lookaside Buffer)的影响。以下从缓存角度详细分析这一差异:


1. 地址空间与 TLB 的影响

  • 进程切换
    • 进程拥有独立的虚拟地址空间,切换时需要 切换页表(Page Table),导致 TLB 被刷新或失效。
    • TLB 是缓存虚拟地址到物理地址映射的硬件组件,失效后需要重新加载映射条目,增加内存访问延迟
  • 线程切换
    • 线程共享进程的地址空间,切换时无需切换页表,TLB 条目保持有效
    • 减少因 TLB 失效导致的性能损失,内存访问效率更高

2. CPU 缓存的局部性保留

  • 进程切换
    • 进程间数据隔离,新进程的代码和数据与旧进程的缓存内容(如 L1/L2/L3)无重叠
    • 缓存中旧进程的数据对新进程无用,导致 缓存冷启动(Cache Cold Start),需重新加载数据到缓存,增加延迟。
  • 线程切换
    • 线程共享进程的代码段、数据段和堆内存,切换后新线程访问的代码和数据 可能仍在缓存中(尤其是共享的 L3 缓存)。
    • 缓存命中率更高,减少访问主存的次数,降低延迟

3. 上下文切换的数据量差异

  • 进程切换
    • 需要保存和恢复 完整的上下文,包括寄存器状态、页表指针、文件描述符表、信号处理表等。
    • 上下文数据量大,切换时需 频繁读写内存,对缓存造成压力。
  • 线程切换
    • 仅需保存和恢复 线程独有资源(如栈指针、寄存器状态、线程本地存储)。
    • 共享的资源(如内存、文件描述符)无需切换,数据量更小,对缓存更友好。

4. 缓存一致性协议的影响

  • 多核 CPU 中,不同线程可能运行在不同核心上:
    • 进程切换
      • 若新进程的线程被调度到不同核心,原核心的缓存数据无法复用,需通过缓存一致性协议(如 MESI)同步或重新加载,增加总线流量
    • 线程切换
      • 同一进程的线程共享数据,即使跨核心调度,其他核心的 L3 缓存可能已缓存共享数据,减少数据同步开销

5. 写时复制(Copy-on-Write)的优化

  • 进程创建
    • fork() 使用写时复制技术,父子进程共享内存直到发生写入操作。虽然减少了内存拷贝,但首次写入会触发页复制,可能 污染缓存(新页需要加载到缓存)。
  • 线程创建
    • 线程直接共享进程内存,无写时复制开销,缓存内容保持连贯性

6. 实际性能对比

通过实验可以观察到以下现象:

  1. 缓存局部性优势
    • 线程切换后,若新线程访问的数据与旧线程有重叠(如共享的全局变量),缓存命中率显著高于进程切换。
  2. TLB 未命中率
    • 进程切换后,TLB 未命中率可能骤增(需重新加载页表条目),而线程切换的 TLB 未命中率几乎不变。

总结

线程切换更轻量级的本质在于 缓存和 TLB 的有效性保留

  1. 共享地址空间:避免 TLB 刷新和页表切换,减少内存访问延迟。
  2. 缓存局部性保留:共享数据可能已缓存在 L3 或跨核缓存中,减少冷启动开销。
  3. 上下文数据量小:减少对缓存的污染和内存带宽的占用。

因此,在高并发场景(如 Web 服务器、数据库)中,线程的轻量级切换特性使其更适合作为并发的基本单位,尤其在多核 CPU 和缓存层次结构复杂的现代计算机中,优势更加显著。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/908803.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/908803.shtml
英文地址,请注明出处:http://en.pswp.cn/news/908803.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【论文阅读30】Bi-LSTM(2024)

用于精确实时滑坡检测的双向LSTM模型:以印度梅加拉亚邦毛永格里姆为例的研究 IEEE Internet of Things Journal(简称 IoT‑J)是一份 IEEE 自 2014 年起双月刊发表的国际顶级学术期刊,专注于物联网各领域的研究。 作者&#xff1a…

Java编程之原型模式

原型模式的定义 原型模式(Prototype Pattern)是一种创建型设计模式,通过复制已有对象来创建新对象,而非通过常规的手段的new关键字来实例化。适用于对象创建成本较高或需要动态配置的场景。 例如,在一个游戏开发中&am…

RAG质量评估

当完成了一个RAG系统的开发工作以后,还需要对该系统的性能进行评估。如何对RAG系统的性能进行评估呢?仔细分析RAG系统的产出成果,主要涉及以下几点: (1)检索器组件 检索的相关文档 context, (…

LLMs基础学习(八)强化学习专题(1)

LLMs基础学习(八)强化学习专题(1) 文章目录 LLMs基础学习(八)强化学习专题(1)学习资料资源强化学习是什么强化学习一句话精准定义 强化学习与其他学习类型的对比强化学习 vs 监督学习…

19-Oracle 23 ai Database Sharding-知识准备

小伙伴是不是经常遇见大规模集群和数量的时候,业务就提出要对数据进行sharding。 Oracle 和其他数据库(如 MySQL、PostgreSQL、MongoDB 等) 为什么要进行分片(sharding),分片的原因是什么,实现…

分类与逻辑回归 - 一个完整的guide

线性回归和逻辑回归其实比你想象的更相似 😃 它们都是所谓的参数模型。让我们先看看什么是参数模型,以及它们与非参数模型的区别。 线性回归 vs 逻辑回归 线性回归:用于回归问题的线性参数模型。逻辑回归:用于分类问题的线性参数…

英语写作中“每一个”each individual、every individual、every single的用法

一、Individual :个体,相对于团体,例如: Individual competition (个人比赛),相对于team competition (团体比赛) Individual users (个人用户)…

由于 z(x,y) 的变化导致的影响(那部分被分给了链式项)

✅ 本质问题:为什么链式法则中 ∂ F ∂ x \frac{\partial F}{\partial x} ∂x∂F​ 不考虑 z z ( x , y ) zz(x,y) zz(x,y)? 🔍 一、关键是:偏导数的定义是什么? 我们从最根本的定义开始: ∂ F ( x , y…

python打卡day44@浙大疏锦行

知识点回顾: 预训练的概念常见的分类预训练模型图像预训练模型的发展史预训练的策略预训练代码实战:resnet18 作业: 尝试在cifar10对比如下其他的预训练模型,观察差异,尽可能和他人选择的不同尝试通过ctrl进入resnet的…

十一(3) 类,加深对拷贝构造函数的理解

class ClassName { public: // 拷贝构造函数:参数是同类型对象的引用(通常为 const 引用) ClassName(const ClassName& other) { // 复制 other 的成员变量到当前对象 } }; 参数要求:必须是同类型对象的引用&#xff0…

网页后端开发(基础1--maven)

maven的作用: Maven是一款管理和构建Java项目的工具。 1.依赖管理: 方便快捷的管理项目依赖的资源(jar包) 不用手动下载jar包,只需要中maven中引用,maven会查找本地仓库。若本地仓库没有,会直…

认识电子元器件---高低边驱动

目录 一、基本概念 二、关键参数对比 三、工作原理 (1)高边驱动 (2)低边驱动 四、典型的应用场景 五、如何选择 一、基本概念 可以理解成:高低边驱动是MOS/IGBT的一种应用方式 高低边驱动是电路拓扑概念&#…

JavaScript 标签加载

目录 JavaScript 标签加载script 标签的 async 和 defer 属性,分别代表什么,有什么区别1. 普通 script 标签2. async 属性3. defer 属性4. type"module"5. 各种加载方式的对比6. 使用建议 JavaScript 标签加载 script 标签的 async 和 defer …

C/CPP 结构体、联合体、位段内存计算 指南

C/CPP 结构体、联合体、位段内存计算 指南 在C语言中,结构体、联合体和位段是对数据的高级抽象,它们可以让程序员以更易于理解的方式来操作复杂的数据结构。然而,这些结构在内存中的布局可能并不如它们的语法结构那样直观,特别是当…

ASR(语音识别)语音/字幕标注 通过via(via_subtitle_annotator)

文章目录 1 VIA 官网资料2 语音/字幕标注3 键盘快捷键常规当一个时间片段被选中时图像或视频帧中的空间区域 1 VIA 官网资料 VIA官网:https://www.robots.ox.ac.uk/~vgg/software/via/ VIA官网标注示例:https://www.robots.ox.ac.uk/~vgg/software/via/…

mq安装新版-3.13.7的安装

一、下载包,上传到服务器 https://github.com/rabbitmq/rabbitmq-server/releases/download/v3.13.7/rabbitmq-server-generic-unix-3.13.7.tar.xz 二、 erlang直接安装 rpm -ivh erlang-26.2.4-1.el8.x86_64.rpm不需要配置环境变量,直接就安装了。 erl…

高通平台PCIE EP模式log丢失问题

高通平台PCIE EP模式log丢失问题 1 问题背景2 问题分析2.1 对比USB2.1.1 Logtool优化2.1.2 Device mhi与fs对比2.2 优化方案2.2.1 Diag系统优化2.2.2 Host mhi优化3 最终成果1 问题背景 高通5G模组如SDX55\SDX62\SDX65\SDX72\SDX75等支持pcie ep模式。会通过pcie与host(如MT7…

Python应用输入输出函数

大家好!在 Python 编程中,输入输出函数是与用户进行交互的桥梁。通过输入函数,我们可以获取用户的输入数据;通过输出函数,我们可以向用户展示程序的运行结果。对于初学者来说,掌握基本的输入输出操作是编程入门的重要一…

如何使用 Ansible 在 Ubuntu 24.04 上安装和设置 LNMP

在当今世界,自动化是有效管理和部署 Web 应用程序的关键。Ansible 是一个强大的自动化工具,它是一款开源软件配置、配置管理和应用程序部署工具。本文将指导您使用 Ansible 在 Ubuntu 服务器上安装 LNMP 堆栈(Linux、Nginx、MySQL、PHP)。 先决条件 为了执行本指南中讨论的…

Xela矩阵三轴触觉传感器的工作原理解析与应用场景

Xela矩阵三轴触觉传感器通过先进技术模拟人类触觉感知,帮助设备实现精确的力测量与位移监测。其核心功能基于磁性三维力测量与空间位移测量,能够捕捉多维触觉信息。该传感器的设计不仅提升了触觉感知的精度,还为机器人、医疗设备和制造业的智…