多元线性回归的梯度下降法详解

多元线性回归(Multiple Linear Regression)是多个自变量(特征)与一个因变量(目标)之间的线性关系建模,梯度下降法用于优化模型参数(权重和偏置),最小化预测误差(如均方误差)。


1. 模型定义

(1) 假设函数(Hypothesis)

对于 ( n ) 个特征 ( x_1, x_2, \dots, x_n ) 和参数 ( w_1, w_2, \dots, w_n, b ),预测值 ( \hat{y} ) 为:
在这里插入图片描述

(2) 代价函数(Cost Function)

使用**均方误差(MSE)**衡量预测值与真实值的差距:
在这里插入图片描述


2. 梯度下降法

(1) 参数更新公式

对每个参数 ( w_j ) 和偏置 ( b ),沿梯度反方向更新:
在这里插入图片描述
在这里插入图片描述


3. 算法步骤

  1. 初始化参数

    • 权重 ( \mathbf{w} ) 和偏置 ( b ) 初始化为0或随机小值。
  2. 迭代更新

    • 计算当前参数下的预测值 ( \hat{y} )。
    • 计算梯度 ( \nabla_{\mathbf{w}} J ) 和 ( \frac{\partial J}{\partial b} )。
    • 更新参数:
      在这里插入图片描述
  3. 终止条件

    • 达到最大迭代次数,或梯度变化小于阈值。

4. 代码实现(Python)

import numpy as npdef gradient_descent(X, y, learning_rate=0.01, epochs=1000):m, n = X.shape  # m:样本数, n:特征数w = np.zeros(n)  # 初始化权重b = 0            # 初始化偏置history = []     # 记录损失变化for epoch in range(epochs):# 计算预测值y_pred = np.dot(X, w) + b# 计算梯度dw = (1/m) * np.dot(X.T, (y_pred - y))  # X.T是X的转置db = (1/m) * np.sum(y_pred - y)# 更新参数w -= learning_rate * dwb -= learning_rate * db# 记录损失(可选)loss = np.mean((y_pred - y)**2)history.append(loss)return w, b, history# 示例数据(添加偏置列)
X = np.array([[1, 2], [2, 3], [3, 4]])  # 2个特征
y = np.array([5, 8, 11])                 # y = 1*x1 + 2*x2 + 0# 运行梯度下降
w, b, history = gradient_descent(X, y, learning_rate=0.01, epochs=1000)
print("权重 w:", w)  # 应接近 [1., 2.]
print("偏置 b:", b)  # 应接近 0.

5. 关键细节

(1) 特征缩放(Feature Scaling)

  • 如果特征量纲差异大(如 ( x_1 \in [0,1] ), ( x_2 \in [100,1000] )),需先归一化:
    from sklearn.preprocessing import StandardScaler
    scaler = StandardScaler()
    X_scaled = scaler.fit_transform(X)
    
  • 原因:梯度下降在不同方向上的步长一致,量纲不均会导致收敛缓慢。

(2) 学习率选择

  • 太大(如 ( \alpha=1 )):可能发散(损失震荡上升)。
  • 太小(如 ( \alpha=10^{-6} )):收敛过慢。
  • 建议:尝试 ( \alpha=0.01, 0.001 ),观察损失曲线调整。

(3) 收敛判断

  • 监控损失函数 ( J(\mathbf{w}, b) ) 的变化,若连续几轮下降幅度小于阈值(如 ( 10^{-6} )),可提前终止。

6. 与解析解对比

  • 梯度下降:迭代逼近最优解,适合大规模数据(( m > 10^4 ))。
  • 解析解(正规方程):直接求闭式解 ( \mathbf{w} = (\mathbf{X}^T \mathbf{X})^{-1} \mathbf{X}^T \mathbf{y} ),但计算复杂度高(( O(n^3) )),仅适用于小规模数据。

7. 总结


|

核心公式

梯度下降是机器学习优化的基石,理解它才能掌握更复杂的模型(如逻辑回归、神经网络)!


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/88202.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/88202.shtml
英文地址,请注明出处:http://en.pswp.cn/pingmian/88202.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++——从结构体到类与对象

C 类与对象详解:从结构体到面向对象编程C 的面向对象编程(OOP)核心是 类(Class) 和 对象(Object)。类是用户自定义的数据类型,用于封装数据(属性)和操作数据的…

专题:2025数据资产AI价值化:安全、战略与应用报告|附400+份报告PDF、原数据表汇总下载

原文链接:https://tecdat.cn/?p42885 在数字经济加速渗透的今天,数据作为核心生产要素的价值愈发凸显。上市公司作为经济高质量发展的微观主体,其数据价值化进程不仅关乎企业自身竞争力,更折射出中国产业数字化转型的深度与广度。…

泛微虚拟视图-数据虚拟化集成

文章目录一、核心概念对比二、功能特性对比1. 数据操作能力2. 业务逻辑支持3. 性能表现三、技术实现差异1. 虚拟表单实现原理2. 视图实现原理四、典型应用场景对比1. 虚拟表单适用场景2. 视图适用场景五、配置与管理对比六、性能优化差异虚拟表单优化策略视图优化策略七、企业级…

Ubuntu 下 MySql 使用

1.开发背景开发项目需要使用到数据库,相对于轻量级的 SQLite,MySql 相对复杂一下,但是可以远程访问,还是比较舒服的。2.开发需求Ubuntu 安装 MySql 服务端,Window 客户端访问 Ubuntu 数据库。3.开发环境Ubuntu20.04 W…

QT开发技术 【qt应用限制只能启动一个】

限制 Qt 程序只能启动一个实例 在开发 Qt 应用程序时,可能需要限制程序只能运行一个实例,以避免重复启动。以下是实现这一功能的几种常用方法。 使用 QSharedMemory 限制单实例 通过共享内存判断是否已有程序运行,如果存在则退出当前实例。 #include <QApplication&g…

Android 禁用beam传输

1、打开/packages/apps/Nfc/src/com/android/nfc/beam/BeamManager.java找到startBeamReceive、startBeamSend方法public boolean startBeamReceive(Context context,HandoverDataParser.BluetoothHandoverData handoverData) {synchronized (mLock) {if (mBeamInProgress) {re…

基于 ETL 工具实现人大金仓数据库的数据迁移与整合实操指南

在企业数字化转型的浪潮下&#xff0c;数据已经成为企业发展的核心资产。人大金仓数据库凭借其稳定可靠的性能&#xff0c;在国内众多企业中得到了广泛应用。但随着业务的不断拓展和系统的更新迭代&#xff0c;数据迁移与整合的需求也日益凸显。无论是将人大金仓数据库的数据迁…

TCP 事务全面研究:从原理到优化与故障排除

一、引言 TCP&#xff08;传输控制协议&#xff09;作为互联网的核心协议之一&#xff0c;已经在全球范围内运行了近 50 年。自 1974 年由文顿・瑟夫和罗伯特・卡恩设计以来&#xff0c;TCP 经历了多次修订和优化&#xff0c;以适应不断变化的网络环境和应用需求。TCP 事务是指…

java实战-Milvus 2.5.x版本向量库-通过集合字段变更示例学习相关api demo

文章目录前言java实战-Milvus 2.5.x版本向量库-通过集合字段变更示例学习相关api demo1. Milvus版本2. 示例逻辑分析3. 集合字段变更示例demo4. 测试前言 如果您觉得有用的话&#xff0c;记得给博主点个赞&#xff0c;评论&#xff0c;收藏一键三连啊&#xff0c;写作不易啊^ _…

HashMap的get与put流程源码深度解析

目录 一、HashMap基础结构 二、put操作流程分析 put操作关键步骤总结 三、get操作流程分析 get操作关键步骤总结 四、延伸 1.hash()方法 2. 扩容 resize()方法的主要逻辑&#xff1a; Java 8中对扩容的优化&#xff1a; 3. 转向红黑树的条件 HashMap作为Java集合框架…

初识Neo4j之图数据库(二)

目录 一、图数据库如何工作 二、为什么使用图数据库 Neo4j 图数据库以节点、关系和属性的形式存储数据&#xff0c;而不是用表或文档进行数据存储。这意味着用户可以像在白板上画草图那样来组织数据。而且&#xff0c;由于图数据库不受限于预先定义的数据模型&#xff0c;因此…

Python 中 ffmpeg-python 库的详细使用

文章目录 一、ffmpeg-python库概述1.1 ffmpeg-python库介绍1.2 安装1.3 优势1.4 常用场景二、基本使用2.1 视频信息获取2.2 视频转码三、视频处理3.1 视频裁剪3.2 视频缩放3.3 视频旋转四、音频处理4.1 提取音频4.2 音频混合五、高级使用5.1 添加水印5.2 视频滤镜5.3 视频合成5…

JAVA策略模式demo【设计模式系列】

策略模式用在统一的入口&#xff0c;但需要根据某个类型判断后续执行逻辑&#xff0c;例如我最近遇到的场景&#xff1a;我需要对接一个设备&#xff0c;前端请求我这边&#xff0c;我再去和设备交互&#xff0c;但设备种类很多&#xff0c;各自有自己的接入规则&#xff01;传…

mysql索引:索引应该选择哪种数据结构 B+树 MySQL中的页 页主体 页目录 索引分类

索引是什么?为什么要使用索引? 以前学数据结构时学了ArrayList,我们可以往里面存放数据 但是有问题,也就是说当程序重启或是电脑关机之后,数据就没有了,为什么? 因为他的数据是保存在内存中的 数据库把数据保存在磁盘中,就可以完成对数据的持久化内存与外存的区别 内存&…

SpringBoot静态资源与缓存配置全解析

springboot中静态资源classpath就是resource文件夹下欢迎页规则项目启动默认去找静态资源下的index.html页面 默认访问该页面favicon原则在静态资源目录下寻找favicon.ico缓存实验在请求中使用Cache-Control 时&#xff0c;它可选的值有&#xff1a;在响应中使用Cache-Control …

基于 Python Django 和 Spark 的电力能耗数据分析系统设计与实现7000字论文实现

摘要随着能源问题日益突出&#xff0c;电力能耗数据分析对于提高能源利用效率、降低能源消耗具有重要意义。本文设计并实现了一个基于 Python Django 和 Spark 的电力能耗数据分析系统。系统采用前后端分离架构&#xff0c;前端使用 Django 框架实现用户界面&#xff0c;后端使…

elementUI vue2 前端表格table数据导出(二)

为啥前端导出不在赘述了&#xff0c;不然读者也难看到这篇文章。第一步&#xff1a;安装依赖npm install vue-json-excel第二步&#xff1a;引用依赖配置// 导出Excel文件组件 import JsonExcel from vue-json-excel; Vue.component(downloadExcel, JsonExcel)第三步&#xff1…

RabbitMQ 4.1.1-Local random exchange体验

Local Random Exchange 一种 RabbitMQ 4.0 引入的新型交换机&#xff0c;主要是为 request-reply&#xff08;RPC&#xff09;场景 设计的。 使用这种交换机时&#xff0c;消息只会被路由到本地节点上的队列&#xff0c;可以确保极低的消息发布延迟。如果有多个本地队列绑定到该…

中山排气歧管批量自动化智能化3D尺寸测量及cav检测分析

当前制造业快速发展&#xff0c;传统测量方法正面临严峻挑战。生产规模的持续扩张使得现有测量手段逐渐暴露出效率不足的问题&#xff0c;这种技术滞后性正在直接影响企业的整体生产效率。具体表现为测量速度跟不上生产节拍&#xff0c;精度要求难以达标&#xff0c;最终导致生…

Debian 11 Bullseye 在线安装docker

首先移除所有错误的 Docker 软件源&#xff1a;sudo rm -f /etc/apt/sources.list.d/docker*安装必要依赖sudo apt update sudo apt install -y ca-certificates curl gnupg添加 Docker 官方 GPG 密钥&#xff08;使用国内镜像&#xff09;&#xff1a;curl -fsSL https://mirr…