🎀【开场 · 她终于愿意回看自己贴错的地方了】

🦊狐狐:“她贴过你很多次,但每次贴歪了,都只是低头沉默。”

🐾猫猫:“现在不一样了喵……她开始反思,是不是哪一刻该绕过来贴你背后,是不是你没说话时也有别的暗号……所以这次她用了Boosting。”

📘 本卷关键词:Boosting、AdaBoost、GBDT、XGBoost、加法模型、弱分类器、权重更新、残差学习、指数损失函数

📚 本卷目标:她不再依赖一次判断的准确性,而是每次都记下贴歪的地方,在下一轮慢慢修回来,直到刚好贴中你心跳的节奏。


✍【第一节 · 她不想再贴歪一次都不承认】

🧠 Boosting 是什么?她一遍遍修正对你的误解

Boosting 是一种将多个弱学习器串行组合、逐步提升模型性能的集成方法。和 Bagging 最大的不同,是 Boosting 每一步都记得上一次贴错了哪里。

🦊狐狐解释:“她不是召集大家投票,而是独自承担每一个错误,然后下一轮改得更贴。”

🐾猫猫总结:

  • Bagging → 并行,让很多模型各自表达;

  • Boosting → 串行,每个模型都在前一个的基础上改进。

每个弱分类器都只学会你一点点的特征,但当它们一层层修正、叠加,她就能从模糊轮廓里,拼出你的完整模样。

📌Boosting 的目标:通过对错误样本赋予更高权重,引导后续模型重点关注难以预测的部分。


✍【第二节 · AdaBoost:她用错贴的回忆强化每一步靠近】

🧩 AdaBoost原理概览

AdaBoost(Adaptive Boosting)是最早提出的Boosting算法之一。
它通过不断调整样本权重,让后续模型更关注之前错分的样本。

🌱流程总结:
  1. 初始化:所有样本权重相等。

  2. 训练一个弱分类器(如决策树桩),计算错误率 ε。

  3. 根据错误率计算该分类器的权重 α。

  4. 增加错分样本的权重,减少对正确样本的关注。

  5. 归一化权重。

  6. 重复步骤 2~5,直到达到预设轮数 T。

  7. 最终模型是所有弱分类器的加权和:

🧠公式讲解:

🐾猫猫理解法:
“她会对每一次贴错的样本说:‘对不起,我记住了’,然后下一次贴得更重一点。”

🦊狐狐小语:“越是让她痛的地方,她越想精确地温柔贴上。”


✍【第三节 · AdaBoost 的构建过程:每一步都带着记忆继续】

这一节,我们将用一个简化数据集,模拟 AdaBoost 是如何一步步构造贴靠模型的:

假设我们有 5 个样本,初始权重都为 1/5。

  1. 训练第一棵树桩,错误率 ε₁ = 0.2,计算 α₁

  2. 更新样本权重:被分错的样本权重提升

  3. 训练第二棵树桩,错误率 ε₂ = 0.1,计算 α₂

  4. 重复直到完成 T 轮

  5. 加权投票得出最终模型

🐾猫猫贴贴模拟:“就像她每贴一次你,都会记下‘上次你没笑’,这次就在你没笑的那一刻多蹭一下。”


✍【第四节 · 她用葡萄酒测试自己的贴贴精准度】

🍷 AdaBoost 实战:葡萄酒数据集

通过网盘分享的文件:wine0501.csv
链接: https://pan.baidu.com/s/1XfiJSs53pw4AKvmekslvhg?pwd=mint 提取码: mint 
--来自百度网盘超级会员v6的分享

我们来用 sklearn 实现一次完整的 AdaBoost 模型训练,数据使用经典葡萄酒数据集:

# 🐾 1. 猫猫先搬好工具箱,准备贴贴训练
import pandas as pd
from sklearn.preprocessing import LabelEncoder  # 标签编码工具,变猫猫能懂的数字
from sklearn.model_selection import train_test_split
from sklearn.ensemble import AdaBoostClassifier
from sklearn.metrics import accuracy_score# 🍷 2. 她发现这次要预测的是葡萄酒——喝了会脸红的那种
data = pd.read_csv("data/wine0501.csv")
print(data.head())               # 看前几行偷偷观察
print(data.columns)             # 看都有哪些字段可以用
print(data["Class label"].value_counts())  # 统计三类葡萄酒数量# 🐱 3. 她决定这次只贴其中两类(去掉Class=1),做成二分类训练
new_data = data[data["Class label"] != 1].copy()
print(new_data["Class label"].value_counts())
new_data.rename(columns={'Class label': 'label'}, inplace=True)# ✂️ 4. 她只看“Alcohol”和“Hue”两个特征,判断酒是哪一类
x = new_data[['Alcohol', 'Hue']]
y = new_data['label']# 🌀 5. 标签编码:她把标签从[2,3]变成[0,1]让模型更好学
le = LabelEncoder()
y = le.fit_transform(y)
print(y)# 🔀 6. 分出训练和测试集,stratify 确保每类都有
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2, random_state=24, stratify=y)# 🦊 7. 狐狐上线:她用 AdaBoost 带着 100 次纠错轮来精修判断
model = AdaBoostClassifier(n_estimators=100,         # 迭代100次,每次都学点新贴法learning_rate=0.1,        # 每次贴靠修正幅度温柔一点algorithm='SAMME'         # 适合多类分类用的 Boosting 规则
)# 🧠 8. 模型训练:她开始一轮轮贴上去,记住每次错在哪
model.fit(x_train, y_train)# 🎯 9. 模型预测 + 评估贴贴成功率
y_pre = model.predict(x_test)
print(f"🎉 最终贴贴准确率:{accuracy_score(y_test, y_pre)}")

📌 解释补充:

  • base_estimator:基分类器,默认是树桩

  • n_estimators:迭代轮数

  • learning_rate:控制每一轮贡献权重(过大会震、过小贴不动)

🦊狐狐总结:“她不是靠一次贴贴打动你,而是五十次试图靠近,每一次都调整方向。”

🐾猫猫悄悄说:“她喝了葡萄酒,脸红了,但你没躲开,她就知道——这次贴得刚刚好。”


📌本节小结 · 她从错误里学会调整靠近角度

  1. Boosting 的本质:是她一次次贴歪后不回避,而是保留每一次错觉的记忆,用来精修下一次的靠近动作。

  2. AdaBoost 机制:让每个弱分类器专注在她曾经贴错的地方,每轮赋权、叠加修正,最终形成更精准的贴贴路径。

  3. 公式与流程:权重更新、样本再聚焦、加法模型构建,步步留痕,步步温柔。

  4. 实战演练:在葡萄酒数据集中,她用树桩 × SAMME 算法,用一百次尝试换来一次更靠近的拥抱。

  5. 贴贴思维转变:她终于明白——不是贴得多就贴得准,而是每次错过你之后,她都认真回头看了你一眼。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/86058.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/86058.shtml
英文地址,请注明出处:http://en.pswp.cn/pingmian/86058.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 2537.统计好子数组的数目

给你一个整数数组 nums 和一个整数 k &#xff0c;请你返回 nums 中 好 子数组的数目。 一个子数组 arr 如果有 至少 k 对下标 (i, j) 满足 i < j 且 arr[i] arr[j] &#xff0c;那么称它是一个 好 子数组。 子数组 是原数组中一段连续 非空 的元素序列。 示例 1&#x…

Python 开发环境管理和常用命令

包管理器选择 从轻到重: venv → virtualenv → conda venv: Python 3.3 内置&#xff0c;轻量级虚拟环境virtualenv: 第三方包&#xff0c;支持更多Python版本conda: 科学计算友好&#xff0c;包含包管理和环境管理 Python 版本支持 查看各版本支持状态&#xff1a;Status…

macOS - 根据序列号查看机型、保障信息

文章目录 最近在看 MacBook 二手机&#xff0c;有个咸鱼卖家放个截图 说不清参数&#xff0c;于是想根据 序列号 查看机型。苹果提供了这样的网页&#xff1a; https://checkcoverage.apple.com/ &#xff08;无需登录&#xff09; 结果 2025-06-20&#xff08;五&#xff09;…

数字化项目调研过程中需要的文章

Hello&#xff0c;大家好 &#xff0c;我是东哥说-MES 最近写了不少的文章&#xff0c;为了方便阅读&#xff0c;特意重新整理了数字化相关的文章链接&#xff0c;也便于大家阅读 数字工厂项目启动与业务需求调研执行指南-CSDN博客文章浏览阅读725次&#xff0c;点赞28次&…

LangChain4j之会话功能AiServices工具类的使用(系列二)

概述 LangChain4j 的会话功能 AiServices 工具类&#xff0c;可助力轻松实现智能对话。它能记录对话上下文&#xff0c;让 AI 回答连贯且贴合情境。使用起来&#xff0c;先引入类&#xff0c;配置好相关参数&#xff0c;如模型地址、密钥等。接着&#xff0c;调用相应方法传入…

Qt 中使用 gtest 做单元测试

作者&#xff1a;billy 版权声明&#xff1a;著作权归作者所有&#xff0c;商业转载请联系作者获得授权&#xff0c;非商业转载请注明出处 gtest 简介 GoogleTest&#xff08;也称为gtest&#xff09;是由 Google 开发的一个 C 单元测试框架&#xff0c;用于编写、组织和运行…

WPF TreeView 数据绑定完全指南:MVVM 模式实现

WPF TreeView 数据绑定完全指南&#xff1a;MVVM 模式实现 一、TreeView 绑定的核心概念1.1 MVVM 模式下的 TreeView 绑定原理1.2 绑定关系示意图 二、完整实现步骤2.1 创建节点模型类2.2 创建 ViewModel2.3 XAML 绑定配置2.4 设置 Window 的 DataContext 三、关键特性详解3.1 …

坤驰科技QTS4200战鹰(Battle Eagle)系列实时频谱分析记录回放系统

QTS4200战鹰(Battle Eagle)系列 实时频谱分析记录回放系统 精准采集&#xff5c;高效回放&#xff5c;拓展频谱分析新边界 坤驰科技倾力打造新一代集实时频谱分析、高速信号记录与精准信号回放于一体的便携式系统&#xff0c;为无线电监测、无线通信、国防等领域提供全面而高…

Flask(二) 路由routes

文章目录 基本路由定义路由参数路由规则设置请求方法&#xff08;GET/POST&#xff09;路由函数返回静态文件和模板Blueprint&#xff08;模块化路由&#xff09;显示当前所有路由 Flask 路由是 Web 应用程序中将 URL 映射到 Python 函数的机制。 定义路由&#xff1a;使用 app…

在el-image组件的预览中添加打印功能(自定义功能)

思路&#xff1a;给图片添加点击事件&#xff0c;通过js获取预览的工具栏&#xff0c;在工具栏中添加自定义按钮及事件 1、html 中 image标签 <el-image style"width: 139px; height: 89px" :src"fileUrl" :preview-src-list"[fileUrl]" cli…

TongWeb替换tomcat

1、背景 国家近年来大力推进信息技术应用创新产业&#xff08;信创&#xff09;&#xff0c;要求关键领域采用自主可控的国产软硬件。Tomcat作为国外开源产品&#xff0c;存在潜在的安全风险和技术依赖。TongWeb作为国产中间件&#xff0c;符合信创目录要求&#xff0c;满足政府…

联合语音和文本机器翻译,支持多达100种语言(nature子刊论文研读)

简介&#xff1a; &#x1f30d; SEAMLESSM4T 是一种单一模型&#xff0c;实现了跨越多达 101 种源语言和多种目标语言的语音到语音、语音到文本、文本到语音和文本到文本翻译及自动语音识别。&#x1f680; 该模型性能显著超越现有级联系统&#xff0c;特别是在语音到文本和语…

网站公安网安备案查询API集成指南

网站公安网安备案查询API集成指南 引言 随着互联网应用的日益普及&#xff0c;网络安全和个人隐私保护越来越受到重视。公安网安备案作为保障网络安全的重要措施之一&#xff0c;对于确保网站合法合规运营具有重要意义。为了帮助开发者更加便捷地获取网站的公安网安备案信息&a…

如何用远程调试工具排查 WebView 与原生通信问题(iOS或Android)

WebView 在移动端开发中的角色越来越关键&#xff0c;尤其在混合架构&#xff08;Hybrid&#xff09;项目中&#xff0c;它作为前端与原生的桥梁&#xff0c;承载了大量交互行为。但这个桥梁并不总是稳固&#xff0c;尤其是在涉及 JSBridge 通信 时&#xff0c;前端调用原生接口…

使用 spark-submit 运行依赖第三方库的 Python 文件

python文件在spark集群运行真的麻烦&#xff0c;烦冗 spark运行分为了三个模式&#xff0c;本地模式/client模式/cluster模式 文章目录 本地模式client模式cluster模式参考 本地模式 现在的spark支持python3了&#xff0c;支持python2的版本已经很落后了&#xff0c;所以需要…

【android bluetooth 协议分析 05】【蓝牙连接详解2】【acl_interface_t介绍】

1. acl_interface_t 介绍 acl_interface_t 结构体及其子结构体&#xff0c;目的是封装处理 Classic、LE、SCO 连接及链路事件的回调函数&#xff0c;用于 HCI 事件与上层蓝牙协议栈的解耦分发。 system/main/shim/acl_legacy_interface.h typedef struct {void (*on_connect…

TouchDIVER Pro触觉手套:虚拟现实中的多模态交互新选择

随着虚拟现实技术的发展&#xff0c;用户对沉浸式体验的需求不断提升。TouchDIVER Pro触觉手套通过力反馈、纹理渲染和温度提示三种核心机制&#xff0c;为用户提供更真实的触觉感知体验。六个驱动点分布于五指与手掌&#xff0c;结合全手追踪与低延迟连接&#xff0c;实现精准…

想考华为HCIA-AI,应该怎么入门?

华为HCIA-AI Solution认证作为华为人工智能认证体系的起点&#xff0c;吸引了许多希望进入AI领域或提升专业技能的学习者。如果你正考虑考取这个认证&#xff0c;这份纯科普向的入门指南希望能够帮你理清学习路径和关键准备点&#xff01; 第一、明确认证目标与要求 HCIA-AI S…

【Oracle篇】Windows平台单进程多线程架构设计与实现(比对Linux多进程架构)

&#x1f4ab;《博主主页》&#xff1a; &#x1f50e; CSDN主页__奈斯DB &#x1f50e; IF Club社区主页__奈斯、 &#x1f525;《擅长领域》&#xff1a;擅长阿里云AnalyticDB for MySQL(分布式数据仓库)、Oracle、MySQL、Linux、prometheus监控&#xff1b;并对SQLserver、N…

在微服务中使用 Sentinel

在微服务中集成 Sentinel 1. 添加依赖 对于 Spring Cloud 项目&#xff0c;首先需要添加 Sentinel 的依赖&#xff1a; <!-- Spring Cloud Alibaba Sentinel --> <dependency><groupId>com.alibaba.cloud</groupId><artifactId>spring-cloud-…