原文:蜗窝科技Linux进程冻结技术
功耗中经常需要用到,但是linux这块了解甚少,看到这个文章还蛮适合我阅读的
1 什么是进程冻结
进程冻结技术(freezing of tasks)是指在系统hibernate或者suspend的时候,将用户进程和部分内核线程置于“可控”的暂停状态。
2 为什么需要冻结技术
假设没有冻结技术,进程可以在任意可调度的点暂停,而且直到cpu_down才会暂停并迁移。这会给系统带来很多问题:
(1)有可能破坏文件系统。在系统创建hibernate image到cpu down之间,如果有进程还在修改文件系统的内容,这将会导致系统恢复之后无法完全恢复文件系统;
(2)有可能导致创建hibernation image失败。创建hibernation image需要足够的内存空间,但是在这期间如果还有进程在申请内存,就可能导致创建失败;
(3)有可能干扰设备的suspend和resume。在cpu down之前,device suspend期间,如果进程还在访问设备,尤其是访问竞争资源,就有可能引起设备suspend异常;
(4)有可能导致进程感知系统休眠。系统休眠的理想状态是所有任务对休眠过程无感知,睡醒之后全部自动恢复工作,但是有些进程,比如某个进程需要所有cpu online才能正常工作,如果进程不冻结,那么在休眠过程中将会工作异常。
3 代码实现框架
冻结的对象是内核中可以被调度执行的实体,包括用户进程、内核线程和work_queue。用户进程默认是可以被冻结的,借用信号处理机制实现;内核线程和work_queue默认是不能被冻结的,少数内核线程和work_queue在创建时指定了freezable标志,这些任务需要对freeze状态进行判断,当系统进入freezing时,主动暂停运行。
标记系统freeze状态的有三个重要的全局变量:pm_freezing、system_freezing_cnt和pm_nosig_freezing,如果全为0,表示系统未进入冻结;system_freezing_cnt>0表示系统进入冻结,pm_freezing=true表示冻结用户进程,pm_nosig_freezing=true表示冻结内核线程和workqueue。它们会在freeze_processes和freeze_kernel_threads中置位,在thaw_processes和thaw_kernel_threads中清零。
fake_signal_wake_up函数巧妙的利用了信号处理机制,只设置任务的TIF_SIGPENDING位,但不传递任何信号,然后唤醒任务;这样任务在返回用户态时会进入信号处理流程,检查系统的freeze状态,并做相应处理。
任务主动调用try_to_freeze的代码如下:
/**
* @brief 尝试将当前任务(进程)主动置入冻结状态(非安全上下文)
* @return bool - true: 冻结成功;false: 未触发冻结条件
* @note 此函数通常在原子上下文或中断禁用场景调用,需确保无锁竞争风险
*/
static inline bool try_to_freeze_unsafe(void)
{
// 检查当前进程是否满足冻结条件(通过freezing(current)快速判断)
if (likely(!freezing(current)))
return false; // 系统未启用冻结或当前进程无需冻结
// 调用核心冻结逻辑,参数false表示非强制冻结(允许进程自行处理信号等)
return __refrigerator(false);
}
/**
* @brief 快速检查系统全局冻结状态及当前进程的冻结条件
* @param p - 待检查的进程描述符(struct task_struct指针)
* @return bool - true: 需要冻结;false: 无需冻结
* @note 通过原子变量system_freezing_cnt优化高频调用的性能
*/
static inline bool freezing(struct task_struct *p)
{
// 原子读取系统全局冻结计数器,若为0则快速返回(likely优化分支预测)
if (likely(!atomic_read(&system_freezing_cnt)))
return false; // 系统未启用冻结功能
// 进入慢速路径,进一步检查进程特定的冻结条件
return freezing_slow_path(p);
}
/**
* @brief 慢速路径检查进程的详细冻结条件
* @param p - 待检查的进程描述符
* @return bool - true: 需冻结;false: 豁免冻结
* @note 此函数处理以下冻结策略:
* 1. PF_NOFREEZE标记的进程(如内核关键线程)始终豁免
* 2. 系统级冻结(pm_nosig_freezing)或cgroup冻结策略
* 3. 用户进程冻结(pm_freezing)且非内核线程
*/
bool freezing_slow_path(struct task_struct *p)
{
// 检查进程是否标记为禁止冻结(如某些关键内核线程)
if (p->flags & PF_NOFREEZE)
return false; // 明确豁免冻结
// 检查系统是否处于"无信号"冻结模式(如休眠时冻结内核线程)
// 或进程属于需冻结的cgroup
if (pm_nosig_freezing || cgroup_freezing(p))
return true; // 强制冻结
// 检查系统是否在冻结用户进程,且当前进程为用户进程(非内核线程)
if (pm_freezing && !(p->flags & PF_KTHREAD))
return true; // 冻结用户空间进程
return false; // 默认不冻结
}
进入冻结状态直到恢复的主要函数:
bool __refrigerator(bool check_kthr_stop)
for (;;) { // 无限循环,直到满足解冻条件
/* 1. 设置进程为不可中断睡眠状态(D状态)
* - TASK_UNINTERRUPTIBLE 确保进程不会被信号唤醒,仅能通过内核主动唤醒
* - 这种状态是冻结进程的核心,避免进程在冻结期间被调度执行 */
set_current_state(TASK_UNINTERRUPTIBLE);
/* 2. 获取 freezer_lock 自旋锁并禁用中断(spin_lock_irq)
* - 保护对 current->flags 的原子修改,防止竞态条件
* - 禁用中断避免中断处理程序并发访问冻结状态 */
spin_lock_irq(&freezer_lock);
/* 3. 标记当前进程为已冻结(PF_FROZEN)
* - PF_FROZEN 是冻结完成的标志,被 thaw_processes() 等解冻函数检测
* - 此处仅设置标志,实际冻结通过后续 schedule() 放弃CPU实现 */
current->flags |= PF_FROZEN;
/* 4. 检查是否需要解除冻结:
* - freezing(current): 系统是否仍要求冻结(如休眠未完成)
* - kthread_should_stop(): 内核线程是否收到停止信号(如模块卸载)
* 若任一条件为真,则清除 PF_FROZEN 标志,准备退出循环 */
if (!freezing(current) || (check_kthr_stop && kthread_should_stop()))
current->flags &= ~PF_FROZEN; // 清除冻结标志
spin_unlock_irq(&freezer_lock); // 释放锁并恢复中断
/* 5. 检查是否已解除冻结:
* - 若 PF_FROZEN 被清除,则跳出循环,恢复执行
* - 否则继续进入调度等待 */
if (!(current->flags & PF_FROZEN))
break;
/* 6. 记录冻结状态并主动放弃CPU
* - was_frozen 用于返回是否曾被冻结(用于统计或调试)
* - schedule() 触发进程切换,当前进程进入睡眠队列,直到被解冻唤醒 */
was_frozen = true;
schedule(); // 调用调度器,进程进入睡眠状态
}
4 参考文献
(1)http://www.wowotech.net/linux_kenrel/suspend_and_resume.html
(2) http://www.wowotech.net/linux_kenrel/std_str_func.html
(3) kenrel document: freezing-of-tasks.txt