文章目录

  • PyTorch 学习率调度器(LR Scheduler)
    • 1. 一句话定义
    • 2. 通用使用套路
    • 3. 内置调度器对比速览
    • 4. 各调度器最小模板
      • ① LambdaLR(线性 warmup)
      • ② StepLR
      • ③ MultiStepLR
      • ④ CosineAnnealingLR
      • ⑤ ReduceLROnPlateau(必须传指标)
    • 5. 常用调试 API
    • 6. 易踩坑 Top-3
    • 7. 速记口诀

PyTorch 学习率调度器(LR Scheduler)


1. 一句话定义

每过一段时间 / 满足某条件,自动按规则修改优化器学习率的工具。


2. 通用使用套路

optimizer = torch.optim.Adam(model.parameters(), lr=初始LR)
scheduler = XXXLR(optimizer, ...)   # 选下面任意一种
for epoch in range(EPOCH):train(...)val_loss = validate(...)optimizer.step()                # ① 先更新参数scheduler.step(val_loss)        # ② 再调度LR(ReduceLROnPlateau需传loss)

顺序:先 optimizer.step() → 再 scheduler.step(),否则报警告。


3. 内置调度器对比速览

调度器触发规则主要参数参数解释典型场景
LambdaLR自定义函数 f(epoch) 返回乘数lr_lambda, last_epochlr_lambda: 接收 epoch,返回 LR 乘数;last_epoch: 重启训练时设为上次 epochwarmup、分段线性
StepLR固定每 step_size epoch 降一次step_size, gamma, last_epochstep_size: 隔多少 epoch 降;gamma: 乘性衰减系数常规“等间隔”下降
MultiStepLR指定里程碑 epoch 列表降milestones, gamma, last_epochmilestones: List,到这些 epoch 就 ×gamma训练中期多段下降
CosineAnnealingLR余弦曲线从初始→η_minT_max, eta_min, last_epochT_max: 半个余弦周期长度;eta_min: 最小 LR退火、cosine 重启
ReduceLROnPlateau监控指标停止改善时降mode, factor, patience, threshold, cooldown, min_lr见下方详注验证 loss/acc 卡住时

ReduceLROnPlateau 参数详注

  • mode='min''max':指标越小/越大越好
  • factor=0.1:新 LR = 旧 LR × factor
  • patience=3:连续 3 次 epoch 无改善才降
  • threshold=0.01:改善幅度小于阈值视为无改善
  • cooldown=1:降 LR 后冻结监控的 epoch 数
  • min_lr=1e-6:下限,降到此值不再降

4. 各调度器最小模板

① LambdaLR(线性 warmup)

scheduler = LambdaLR(optimizer, lr_lambda=lambda epoch: epoch / 5 if epoch < 5 else 1)

② StepLR

scheduler = StepLR(optimizer, step_size=2, gamma=0.1)   # 每 2 epoch ×0.1

③ MultiStepLR

scheduler = MultiStepLR(optimizer, milestones=[2, 6], gamma=0.1)

④ CosineAnnealingLR

scheduler = CosineAnnealingLR(optimizer, T_max=10, eta_min=1e-6)

⑤ ReduceLROnPlateau(必须传指标)

scheduler = ReduceLROnPlateau(optimizer, mode='min', factor=0.1, patience=3,threshold=0.01, cooldown=1, min_lr=1e-6)
val_loss = validate(...)
scheduler.step(val_loss)          # ← 记得传指标

5. 常用调试 API

scheduler.get_last_lr()   # 当前实际 LR 列表(每个 param_group)
scheduler.last_epoch      # 已完成的 epoch 计数(从 0 开始)

6. 易踩坑 Top-3

  1. optimizer.step()scheduler.step()
    否则报警告 “Detected call of lr_scheduler.step() before optimizer.step()”。
  2. ReduceLROnPlateau 必须传监控值
    不传 → RuntimeError。
  3. Lambda/MultiStep 等无需监控值,传了 → TypeError。

7. 速记口诀

“优化先迈步,调度再跟进;Plateau 传 loss,其余不用问。”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/95795.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/95795.shtml
英文地址,请注明出处:http://en.pswp.cn/bicheng/95795.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

新后端漏洞(上)- Spring Cloud Gateway Actuator API SpEL表达式注入命令执行(CVE-2022-22947)

漏洞介绍&#xff1a;Spring Cloud Gateway是Spring中的一个API网关。其3.1.0及3.0.6版本&#xff08;包含&#xff09;以前存在一处SpEL表达式注入漏洞&#xff0c;当攻击者可以访问Actuator API的情况下&#xff0c;将可以利用该漏洞执行任意命令。漏洞环境&#xff1a;docke…

【OJ】C++ vector类OJ题

只出现过一次的数字&#xff08;简单&#xff09; 136. 只出现一次的数字 - 力扣&#xff08;LeetCode&#xff09; 这道题使用异或就非常简单了&#xff0c;所有数异或到一起&#xff0c;相同的数据双双消除&#xff0c;只剩下一个的数。 C语言异或运算详解-CSDN博客 clas…

为什么外网主机可以telnet通内网nginx端口,但是http请求失败?

问题是这样的:我内网主机nginx配置了 域名80端口&#xff0c;然后防火墙没有配置80端口&#xff0c;但是外网机子去telnet 80端口可以通&#xff0c;用浏览器请求域名不能访问nginx&#xff0c;然后防火墙开了80端口后&#xff0c;浏览器就可以访问nginx了&#xff0c;为什么防…

【Linux游记】基础指令篇

​​​​​​ 枫の个人主页 你不能改变过去&#xff0c;但你可以改变未来 算法/C/数据结构/C/Linux Hello&#xff0c;这里是小枫。C语言与数据结构和算法初阶两个板块都更新完毕&#xff0c;我们继续来学习C&#xff0c;C更新的同时我也会更新Linux。Linux操作系统是很经典的…

阿里云-基于通义灵码实现高效 AI 编码 | 4 | 场景学习:3分钟写一个音乐闹钟小应用

文章目录一、初版需求与代码生成二、需求迭代与代码更新三、需求细化与功能完善3.1 pygame安装3.2 放置音乐文件3.3 执行代码免费个人运维知识库&#xff0c;欢迎您的订阅&#xff1a;literator_ray.flowus.cn 一、初版需求与代码生成 首先向通义灵码提出了基本需求&#xff1…

【算法笔记】欧拉降幂公式与欧拉函数

欧拉降幂公式 在数论中&#xff0c;欧拉降幂公式是一个强大的工具&#xff0c;用于简化大指数模运算。公式如下&#xff1a; ∀k>φ(m)&#xff0c;有Ak≡Akmodφ(m)φ(m)(modm)成立。\forall k > \varphi(m)&#xff0c;有 A^k \equiv A^{k \mod \varphi(m) \varphi(m…

基于STM32的交通灯设计—紧急模式、可调时间

基于STM32交通灯设计&#xff08;仿真&#xff0b;程序&#xff0b;设计报告&#xff09;功能介绍具体功能&#xff1a;1.数码管和LED模拟交通灯&#xff1b;2.南北绿灯9秒&#xff0c;东西绿灯15秒&#xff0c;黄灯2秒&#xff1b;3.紧急情况&#xff1a;按下按键&#xff0c;…

汽车软件研发智能化:AI在CI/CD中的实践

当汽车行业加速驶入“软件定义”的时代&#xff0c;软件已成为决定车辆竞争力的核心要素。从智能座舱的多场景交互到自动驾驶的复杂决策逻辑&#xff0c;汽车软件的代码量逐年递增&#xff0c;复杂度呈指数级攀升&#xff0c;传统研发流程深陷困境&#xff1a;代码质量管控滞后…

DeepSeek:开启智能体驱动对话式数据分析新时代

在数字化浪潮汹涌澎湃的当下,数据已然成为驱动企业发展、推动科学研究以及优化日常生活决策的关键力量。数据分析,作为从海量数据中提取有价值信息、洞察趋势、挖掘规律的核心手段,其重要性不言而喻。无论是企业精准把握市场动态、优化运营流程,还是科研人员探索未知领域、…

MCP驱动企业微信智能中枢:企业级机器人服务构建全攻略

一、背景与目标 公司规模200-300人&#xff0c;主要使用企业微信作为内部沟通平台。日常面临大量重复性通知工作&#xff0c;如会议提醒、系统维护通知、项目进度更新等。 业务痛点&#xff1a; 人工发送通知效率低下&#xff0c;平均3分钟/条重要信息传递不及时&#xff0c…

语音识别系统的技术核心:从声音到文字的智能转换

语音识别技术&#xff0c;也称为自动语音识别&#xff08;ASR&#xff09;&#xff0c;其核心目标是将人类语音信号转换为对应的文本或指令。随着人工智能的发展&#xff0c;语音识别已成为智能助手、实时翻译、车载系统等领域的关键技术。其工作原理可分解为信号处理、特征提取…

《用 Django 构建博客应用:从模型设计到文章管理的全流程实战》

《用 Django 构建博客应用:从模型设计到文章管理的全流程实战》 一、引言:为什么选择 Django 构建博客系统? 在 Python 的 Web 框架中,Django 被誉为“全能型选手”。它不仅提供了强大的 ORM、模板系统、认证机制和后台管理,还鼓励开发者遵循“DRY”(Don’t Repeat You…

以 R1 为视角,手把手教你画 OSPF 最短路径树与推导路由表

视频版讲解>>>>>>>>>>>>>>>>>>>OSPF最短路径树构建与路由计算练习&#xff08;一&#xff09; 在 OSPF 协议的学习中&#xff0c;“纸上谈兵” 不如 “实战推演”—— 尤其是以特定路由器为主视角&#xff0c;从 LS…

axios请求缓存与重复拦截:“相同请求未完成时,不发起新请求”

import axios from "axios";// 1. 缓存已完成的请求结果&#xff08;key&#xff1a;请求URL参数&#xff0c;value&#xff1a;数据&#xff09; const requestCache new Map(); // 2. 记录正在执行的请求&#xff08;避免并行重复请求&#xff09; const pendingR…

k8s的SidecarSet配置和initContainers

目录引言一、k8s如何实现Sidecar这段配置正确吗&#xff1f;正确的配置方式为什么这样做&#xff1f;一个简单的例子总结二、什么是SidecarSet主要功能使用场景示例配置三、也可以通过 initContainers 的 restartPolicy 实现边车逻辑四、题外话&#xff1a;什么是InitContainer…

PostgreSQL与SQL Server:为什么 PostgreSQL遥遥领先

PostgreSQL与SQL Server:为什么 PostgreSQL遥遥领先 在数据库领域&#xff0c;PostgreSQL 和 Microsoft SQL Server 长期以来一直是竞争对手。然而&#xff0c;近年来&#xff0c;PostgreSQL 以其性能、灵活性和创新功能让 SQL Server 望尘莫及。以下是对 PostgreSQL 明显优越的…

零跑汽车8月交付57066台,同比增长超88%

零跑汽车官宣&#xff0c;在刚刚过去的8月份&#xff0c;品牌交付57066辆&#xff0c;同比增长超88%再创历史新高&#xff0c;并实现了连续6个月稳坐新势力销冠。目前&#xff0c;零跑旗下共有T03、B10、B01、C01、C10、C11、C16等七款车型在售&#xff0c;得益于零跑坚持全栈自…

DNS地址推荐

DNS地址推荐&#xff08;2025年最新整理&#xff09; 以下DNS服务器按使用场景分类&#xff0c;涵盖国内、国际、安全隐私、游戏优化等需求&#xff0c;均为2025年仍在维护的公共DNS服务&#xff1a; 一、国内通用DNS&#xff08;适合中国大陆用户&#xff09; 国内DNS服务器对…

兴趣电商内容数据洞察未来市场走向研究——基于开源AI智能名片链动2+1模式S2B2C商城小程序的实践

摘要&#xff1a;在互联网电商数据高度透明的当下&#xff0c;“已发生”的品类规模和品类增速数据虽易获取&#xff0c;但主要反映市场历史状况&#xff0c;难以预测未来走向。兴趣电商的内容数据因揭示消费者“新需求”和“潜在需求”&#xff0c;在宏观层面更早体现用户消费…

【已更新文章+代码】2025数学建模国赛A题思路代码文章高教社杯全国大学生数学建模-烟幕干扰弹的投放策略

截止周四晚上11点已更新五个问题完整建模和问题一二的代码 截止周五早上完整版已更新 可以看主页最新博文获取 完整内容请看文末最后的推广群2.1问题1的分析 问题1是典型的确定性时空几何与运动学计算问题&#xff0c;核心在于通过建立坐标系下的参数方程&#xff0c;量化烟幕云…