原文:蜗窝科技Linux进程冻结技术

功耗中经常需要用到,但是linux这块了解甚少,看到这个文章还蛮适合我阅读的

1 什么是进程冻结

进程冻结技术(freezing of tasks)是指在系统hibernate或者suspend的时候,将用户进程和部分内核线程置于“可控”的暂停状态。

2 为什么需要冻结技术

假设没有冻结技术,进程可以在任意可调度的点暂停,而且直到cpu_down才会暂停并迁移。这会给系统带来很多问题:

(1)有可能破坏文件系统。在系统创建hibernate image到cpu down之间,如果有进程还在修改文件系统的内容,这将会导致系统恢复之后无法完全恢复文件系统;

(2)有可能导致创建hibernation image失败。创建hibernation image需要足够的内存空间,但是在这期间如果还有进程在申请内存,就可能导致创建失败;

(3)有可能干扰设备的suspend和resume。在cpu down之前,device suspend期间,如果进程还在访问设备,尤其是访问竞争资源,就有可能引起设备suspend异常;

(4)有可能导致进程感知系统休眠。系统休眠的理想状态是所有任务对休眠过程无感知,睡醒之后全部自动恢复工作,但是有些进程,比如某个进程需要所有cpu online才能正常工作,如果进程不冻结,那么在休眠过程中将会工作异常。

3 代码实现框架

冻结的对象是内核中可以被调度执行的实体,包括用户进程、内核线程和work_queue。用户进程默认是可以被冻结的,借用信号处理机制实现;内核线程和work_queue默认是不能被冻结的,少数内核线程和work_queue在创建时指定了freezable标志,这些任务需要对freeze状态进行判断,当系统进入freezing时,主动暂停运行。

0

标记系统freeze状态的有三个重要的全局变量:pm_freezing、system_freezing_cnt和pm_nosig_freezing,如果全为0,表示系统未进入冻结;system_freezing_cnt>0表示系统进入冻结,pm_freezing=true表示冻结用户进程,pm_nosig_freezing=true表示冻结内核线程和workqueue。它们会在freeze_processes和freeze_kernel_threads中置位,在thaw_processes和thaw_kernel_threads中清零。

fake_signal_wake_up函数巧妙的利用了信号处理机制,只设置任务的TIF_SIGPENDING位,但不传递任何信号,然后唤醒任务;这样任务在返回用户态时会进入信号处理流程,检查系统的freeze状态,并做相应处理。

任务主动调用try_to_freeze的代码如下:

/** * @brief 尝试将当前任务(进程)主动置入冻结状态(非安全上下文) * @return bool - true: 冻结成功;false: 未触发冻结条件 * @note 此函数通常在原子上下文或中断禁用场景调用,需确保无锁竞争风险 */static inline bool try_to_freeze_unsafe(void){    // 检查当前进程是否满足冻结条件(通过freezing(current)快速判断)    if (likely(!freezing(current)))         return false; // 系统未启用冻结或当前进程无需冻结    // 调用核心冻结逻辑,参数false表示非强制冻结(允许进程自行处理信号等)    return __refrigerator(false); }/** * @brief 快速检查系统全局冻结状态及当前进程的冻结条件 * @param p - 待检查的进程描述符(struct task_struct指针) * @return bool - true: 需要冻结;false: 无需冻结 * @note 通过原子变量system_freezing_cnt优化高频调用的性能 */static inline bool freezing(struct task_struct *p){    // 原子读取系统全局冻结计数器,若为0则快速返回(likely优化分支预测)    if (likely(!atomic_read(&system_freezing_cnt)))        return false; // 系统未启用冻结功能    // 进入慢速路径,进一步检查进程特定的冻结条件    return freezing_slow_path(p);}/** * @brief 慢速路径检查进程的详细冻结条件 * @param p - 待检查的进程描述符 * @return bool - true: 需冻结;false: 豁免冻结 * @note 此函数处理以下冻结策略: *       1. PF_NOFREEZE标记的进程(如内核关键线程)始终豁免 *       2. 系统级冻结(pm_nosig_freezing)或cgroup冻结策略 *       3. 用户进程冻结(pm_freezing)且非内核线程 */bool freezing_slow_path(struct task_struct *p){    // 检查进程是否标记为禁止冻结(如某些关键内核线程)    if (p->flags & PF_NOFREEZE)          return false; // 明确豁免冻结    // 检查系统是否处于"无信号"冻结模式(如休眠时冻结内核线程)    // 或进程属于需冻结的cgroup    if (pm_nosig_freezing || cgroup_freezing(p))          return true; // 强制冻结    // 检查系统是否在冻结用户进程,且当前进程为用户进程(非内核线程)    if (pm_freezing && !(p->flags & PF_KTHREAD))         return true; // 冻结用户空间进程    return false; // 默认不冻结}

进入冻结状态直到恢复的主要函数:

bool __refrigerator(bool check_kthr_stop)​​​​​​​

for (;;) {  // 无限循环,直到满足解冻条件    /* 1. 设置进程为不可中断睡眠状态(D状态)     * - TASK_UNINTERRUPTIBLE 确保进程不会被信号唤醒,仅能通过内核主动唤醒     * - 这种状态是冻结进程的核心,避免进程在冻结期间被调度执行 */    set_current_state(TASK_UNINTERRUPTIBLE);    /* 2. 获取 freezer_lock 自旋锁并禁用中断(spin_lock_irq)     * - 保护对 current->flags 的原子修改,防止竞态条件     * - 禁用中断避免中断处理程序并发访问冻结状态 */    spin_lock_irq(&freezer_lock);    /* 3. 标记当前进程为已冻结(PF_FROZEN)     * - PF_FROZEN 是冻结完成的标志,被 thaw_processes() 等解冻函数检测     * - 此处仅设置标志,实际冻结通过后续 schedule() 放弃CPU实现 */    current->flags |= PF_FROZEN;    /* 4. 检查是否需要解除冻结:     * - freezing(current): 系统是否仍要求冻结(如休眠未完成)     * - kthread_should_stop(): 内核线程是否收到停止信号(如模块卸载)     * 若任一条件为真,则清除 PF_FROZEN 标志,准备退出循环 */    if (!freezing(current) || (check_kthr_stop && kthread_should_stop()))        current->flags &= ~PF_FROZEN;  // 清除冻结标志    spin_unlock_irq(&freezer_lock);  // 释放锁并恢复中断    /* 5. 检查是否已解除冻结:     * - 若 PF_FROZEN 被清除,则跳出循环,恢复执行     * - 否则继续进入调度等待 */    if (!(current->flags & PF_FROZEN))        break;    /* 6. 记录冻结状态并主动放弃CPU     * - was_frozen 用于返回是否曾被冻结(用于统计或调试)     * - schedule() 触发进程切换,当前进程进入睡眠队列,直到被解冻唤醒 */    was_frozen = true;    schedule();  // 调用调度器,进程进入睡眠状态}

4 参考文献

(1)http://www.wowotech.net/linux_kenrel/suspend_and_resume.html

(2) http://www.wowotech.net/linux_kenrel/std_str_func.html

(3) kenrel document: freezing-of-tasks.txt

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/88157.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/88157.shtml
英文地址,请注明出处:http://en.pswp.cn/diannao/88157.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

GitHub 趋势日报 (2025年06月22日)

📊 由 TrendForge 系统生成 | 🌐 https://trendforge.devlive.org/ 🌐 本日报中的项目描述已自动翻译为中文 📈 今日获星趋势图 今日获星趋势图 624 LLMs-from-scratch 523 ai-engineering-hub 501 n8n 320 data-engineer-handb…

kotlin中为什么新增扩展函数功能?

在 Kotlin 中,扩展函数的本质是「不修改原有类代码,为其新增功能」,这源自编程中「开闭原则」(对扩展开放,对修改关闭)的第一性原理。 核心需求:当需要给第三方库的类(如 Android 的…

excel 数据透视表介绍

Excel 数据透视表(PivotTable)就是你的数据分析神器!它能帮你快速汇总、分类、比较和分析 大量数据,从看似杂乱无章的表格中一键提取关键信息 ,生成交互式的汇总报告。无需复杂公式,只需拖拽几下,就能让数据“开口说话”&#xff…

半导体行业中的专用标准产品ASSP是什么?

半导体行业中的专用标准产品ASSP是什么? “专用标准产品”(ASSP - Application Specific Standard Product)是半导体集成电路中的一个重要分类。 你可以把它理解为介于通用标准产品和全定制ASIC之间的一种芯片。以下是它的核心定义和特点&a…

秋招Day14 - MySQL - 锁

MySQL中有几种类型的锁? 锁粒度来分,有表锁、页锁和行锁。 加锁机制划分,有乐观锁和悲观锁。 按兼容性划分,有共享锁和排他锁。 按锁模式划分,有记录锁,间隙锁,next-key锁,意向锁…

/var/lib/docker/overlay2目录过大怎么办

/var/lib/docker/overlay2 是 Docker 默认用于存储 容器镜像和容器运行时数据 的核心目录,基于 overlay2 存储驱动实现。以下是其具体作用和内容的详细解析: 1. overlay2 目录的作用 存储镜像分层结构: Docker 镜像采用分层设计,o…

JimuReport:一款免费的数据可视化报表工具

JimuReport(积木报表)是一款免费的企业级数据可视化报表软件,提供拖拽的方式像搭建积木一样完成在线设计,功能涵盖数据报表、打印设计、图表报表、门户设计、大屏设计等。 数据源 JimuReport 支持 30 多种数据源,包括…

Neo4j.5.X社区版创建数据库和切换数据库

在使用Neo4j数据库(版本:neo4j-community-5.22.0)时,系统自带的“neo4j”和“system”数据库适用于日常的简单学习和练习,但对于新的项目,将项目数据与练习数据混用会带来诸多不便,例如查询效率…

DAY33神经网络

浙大疏锦行 定义了一个简单的神经网络,主要是掌握pytorch框架

拼团系统多层限流架构详解

拼团系统多层限流架构详解 一、整体架构设计理念 多层限流采用"层层设防"思想,通过网关层全局流量控制→服务层接口粒度限流→本地资源隔离→热点参数精准防护的四级防御体系,实现从粗到细的流量治理,确保大促期间系统稳定性。 …

[ctfshow web入门] web92 `==`特性与intval特性

信息收集 和之前的题差不多,这次是使用了不严格相等的,详情看这篇博客: 和 在 PHP 中有何区别?一共包含哪些部分? 首先,不能使$num 4476,然后需要使intval($num,0)4476 include("flag…

在Springboot项目部署时遇到,centos服务器上,curl请求目标地址不通 ,curl -x 可以请求通的解决办法

在甲方服务器部署项目时,通常遇到需要开通外网权限的问题,有的是直接给开通服务器的白名单,就可以直接访问白名单外网地址了。也有的是通过网络转发,将url前面的部分替换,可以进行网络请求。有一次遇到一个罕见的&…

Python异步爬虫编程技巧:从入门到高级实战指南

Python异步爬虫编程技巧:从入门到高级实战指南 🚀 📚 目录 前言:为什么要学异步爬虫异步编程基础概念异步爬虫核心技术栈入门实战:第一个异步爬虫进阶技巧:并发控制与资源管理高级实战:分布式…

JMeter-SSE响应数据自动化3.0

背景 此次因为多了一些需要过滤排除的错误(数量很少),还需要修改下JMeter的jtl文件输出数据(后续统计数据需要) 所以只涉及到JSR脚本的一些改动(此部分改动并不会影响到JMeter的HTML报告) 改动 主要通过设置JMeter中prev输出数据变量threadN…

012 进程状态和优先级

🦄 个人主页: 小米里的大麦-CSDN博客 🎏 所属专栏: Linux_小米里的大麦的博客-CSDN博客 🎁 GitHub主页: 小米里的大麦的 GitHub ⚙️ 操作环境: Visual Studio 2022 文章目录 进程状态和优先级一、进程状态分类特殊状态说明 二、如何查看进程…

React JSX原理

JSX本质 实质上是React.createElement()的语法糖

Java-51 深入浅出 Tomcat 手写 Tomcat 类加载机制 双亲委派机制 生命周期 插件化

点一下关注吧!!!非常感谢!!持续更新!!! 🚀 AI篇持续更新中!(长期更新) 目前2025年06月13日更新到: AI炼丹日志-28 - Aud…

从C++编程入手设计模式——责任链模式

从C编程入手设计模式——责任链模式 ​ 当我们的一个请求需要多个对象去处理,但具体由谁来处理,是根据情况动态决定的。例如,一个日志系统中,可能希望把错误信息写入文件,把提示信息输出到控制台,而不是每…

泛型方法调用需要显示指定泛型类型的场景

泛型类型的推断确定 一般来说&#xff0c;泛型类型的推断可以由以下几个场景确定&#xff1a; 变量定义指定类型 List<String> strList new ArrayList<>();ArrayList的泛型类型是依据变量的类型确定的。 方法返回值确定 Overridepublic Function<List<I…

Deep Research:开启深度研究的智能新时代

在当今信息爆炸的时代&#xff0c;人们面临着海量的信息&#xff0c;无论是专业人士还是普通消费者&#xff0c;都迫切需要一种高效、精准的方式来获取和分析信息。OpenAI 推出的 Deep Research&#xff0c;宛如一颗璀璨的新星&#xff0c;在知识的海洋中为我们导航&#xff0c…