核心区别对比表

特征Pearson 相关系数Spearman 相关系数
相关性类型线性相关单调相关
计算基础原始数据值数据排名(秩)
公式$\rho = \frac{\text{cov}(X,Y)}{\sigma_X \sigma_Y}$$\rho = 1 - \frac{6\sum d_i^2}{n(n^2-1)}$
数据要求连续变量,近似正态分布有序数据或连续变量
异常值敏感性高度敏感不敏感
取值范围[-1, 1][-1, 1]
单调关系检测仅检测线性关系检测线性+非线性单调关系
计算复杂度较低较高(需计算排名)
适用场景线性关系,数据质量好非线性单调关系,异常值多,有序数据

详细区别解析

1. 相关性类型不同

  • Pearson: 衡量变量之间的线性关系强度

  • Spearman: 衡量变量之间的单调关系强度(无论线性还是非线性)

2. 计算基础不同

  • Pearson: 基于原始数据值的协方差和标准差

  • Spearman: 基于数据值的排名(秩)

    1. 将每个变量的值转换为排名

    2. 计算排名之间的 Pearson 相关系数

4. 数据要求不同

  • Pearson:

    • 要求变量是连续型

    • 最好近似正态分布

    • 变量间关系应为线性

    • 无显著异常值

  • Spearman:

    • 适用于连续变量和有序分类变量

    • 不要求正态分布

    • 可处理非线性但单调的关系

    • 对异常值稳健

5. 异常值敏感性

  • Pearson: 高度敏感,单个异常值可显著改变结果

  • Spearman: 不敏感,因为使用排名而非原始值

6. 单调关系检测

  • Pearson: 只能检测线性关系

  • Spearman: 可检测任何单调关系(线性或非线性)

  • Spearman: 可检测任何单调关系(线性或非线性)

7. 计算示例对比

数据:

XY
11
24
39
416
525

Pearson 计算:

  • 计算原始数据的协方差和标准差

  • 结果 ≈ 0.96(显示强相关)

Spearman 计算:

  1. 转换为排名:

    X_rankY_rank
    11
    22
    33
    44
    55
  2. 计算排名间的 Pearson 相关

  3. 结果 = 1(完全单调相关)

8. 实际应用场景

使用 Pearson 当:

  • 数据满足线性、正态分布假设

  • 需要精确测量线性关系强度

  • 数据质量高,无显著异常值

  • 例如:身高与体重的关系研究

使用 Spearman 当:

  • 数据不满足正态分布假设

  • 存在异常值

  • 变量是有序分类变量(如满意度评分)

  • 关系可能是非线性但单调的

  • 例如:广告投入与销售额的关系(可能存在边际效应递减)

总结

  • Pearson 是"线性相关"的黄金标准,但对数据要求严格

  • Spearman 是更稳健的"单调相关"度量,适用范围更广

  • 在数据分析中,通常建议:

    1. 首先使用 Spearman(更稳健)

    2. 如果 Spearman 显示强相关且数据质量好,再用 Pearson 测量线性强度

  • 两种方法都是度量相关性而非因果性

  • 对于复杂关系,应结合散点图等可视化工具分析

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/92097.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/92097.shtml
英文地址,请注明出处:http://en.pswp.cn/pingmian/92097.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

sqli-labs靶场less36-less40

less361.我们打开靶场之后打开来看一下,输入的内容会被转义,依旧是宽字节注入2.使用以下宽字节注入,使用的是%df?id-1%df%27%20union%20select%201,database(),3--3.剩余内容与前面关卡基本一样,只要使用上面的方法合成宽字节即可…

企业级 TinyMCE Vue 编辑器解决方案 – 配置优化与性能提升指南、自定义插件

## 简介TinyMCE Vue 是官方提供的 TinyMCE 富文本编辑器的 Vue 组件封装,支持 Vue 2 和 Vue 3。它让你可以在 Vue 项目中快速集成强大的富文本编辑能力,支持多种插件、主题和自定义扩展,适用于博客、内容管理、后台系统等多种场景。主要特性&…

【模电笔记】—— 直流稳压电源——稳压电路

Tips:本章节笔记建议读者综合学习,内容较多,可谓是模电相当重要的部分,因此部分知识点没有做到详细解释。 1.稳压电路的性能指标 (同上节直流稳压电源的主要技术指标【模电笔记】—— 直流稳压电源——整流、滤波电路…

C++——设计模式

文章目录一、面向对象的优点和缺点1.1 回答重点1.2 扩展知识二、面向对象的三大特点2.1 回答重点2.2 扩展知识三、设计模式的六大原则3.1 回答重点3.1.1 单一职责原则(Single Responsibility Principle, SRP)3.1.2 开放 - 封闭原则(Open-Clos…

Android PDFBox 的使用指南

Android PDFBox 使用指南 概述 PDFBox是一个强大的PDF处理库,在Android平台上也有对应的实现。本指南将介绍如何在Android项目中使用PDFBox进行PDF文件的加载、读取、修改等操作。 依赖配置 在 app/build.gradle 中添加PDFBox依赖: dependencies {i…

TFTP: Linux 系统安装 TFTP,文件系统启动后TFTP使用

安装 TFTP 服务器 sudo apt update sudo apt install tftpd-hpa配置 TFTP 服务器 编辑配置文件 /etc/default/tftpd-hpa: sudo nano /etc/default/tftpd-hpa 修改内容如下: TFTP_USERNAME"tftp" TFTP_DIRECTORY"/srv/tftp" TFTP_ADD…

昇思+昇腾开发板+DeepSeek模型LoRA微调

昇思昇腾开发板DeepSeek模型LoRA微调 LoRA微调原理核心思想:冻结预训练模型权重,仅训练橙色的低秩适配矩阵(A/B矩阵)优势: 训练参数量减少至全量微调的0.5%显存占用降低50%以上适配器权重仅需保存3MB(原模型…

计算机网络:详解网络地址的计算步骤

网络地址计算是网络规划与配置的基础,核心是通过IP地址和子网掩码确定网络标识、广播地址、可用主机范围等关键信息。以下是详细的计算步骤,配合实例说明(以IPv4为例): 一、明确基础概念 在计算前,需先明确3个核心概念: IP地址:标识网络中主机的32位二进制数,通常以…

Spring AI 系列之三十五 - Spring AI Alibaba-Graph框架之MCP

之前做个几个大模型的应用,都是使用Python语言,后来有一个项目使用了Java,并使用了Spring AI框架。随着Spring AI不断地完善,最近它发布了1.0正式版,意味着它已经能很好的作为企业级生产环境的使用。对于Java开发者来说…

FastAPI后端工程化项目记录

以下是一个使用fastapi上传视频的接口,记录一下工程化后端程序的业务逻辑 重点是代码如何抽离 项目结构优化 project/ ├── .env # 环境变量配置 ├── app/ │ ├── __init__.py │ ├── main.py # 主应用入口 │ …

令牌桶限流算法

你提供的 Java 代码实现的是令牌桶限流算法(Token Bucket Algorithm),这是目前最常用、最灵活的限流算法之一。它允许一定程度的“突发流量”,同时又能控制平均速率。下面我将:逐行详细解释 TokenBucketLimiter 类的每…

基于springboot的宠物商城设计与实现

管理员:登录,个人中心,用户管埋,宠物分类管理,宠物信息管理,留言反馈,宠物论坛,系统管理,订单管理用户:宠物信息,宠物论坛,公告信息&a…

Python day36

浙大疏锦行 Python day36. 复习日 本周内容: 如何导入模块以及库项目的规范拆分和写法官方文档的阅读MLP神经网络的训练在GPU上训练模型可视化以及推理

【gaussian-splatting】用自己的数据复现高斯泼溅(一)

1.环境准备1.1.下载diff-gaussian-rasterization这里本来没啥说的,直接从github上下载就行了,但是我踩坑了,下的版本不对,后续运行报错参数个数对不上,特在此给大家避坑,注意一定要下带3dgs版本的diff-gaus…

中国移动h10g-01_S905L处理器安卓7.1当贝纯净版线刷机包带root权限_融合终端网关

下载固件之前请先将主板上的屏蔽罩取下,查看处理器型号 是否为S905L型号,然后再下载固件进行刷机; 本页面的固件是采用双公头数据线进行刷机的哈; 安卓4.4.2版本固件下载地址:点此进行下载 安卓7.1版本固件下载地址…

夜天之书 #110 涓滴开源:Cronexpr 的故事

在年初的一篇关于商业开源的博文当中,我介绍了在开发商业软件的过程中,衍生出开源公共软件库的模式。在那篇博文里面,我只是简单罗列了相关开源库的名字及一句话总结。近期,我会结合商业开源实践的最新进展,对其中一些…

完整的登陆学生管理系统(配置数据库)

目录 要求 思路 1. 登录模块(LoginFrame.java) 2. 学生信息管理模块(StudentFrame.java) 3. 数据层(StudentDAO.java) 4. 业务层(StudentService.java / UserService.java) 5…

译 | 在 Python 中从头开始构建 Qwen-3 MoE

文章出自:基于 2个Expert 的 MoE 架构分步指南 本篇适合 MoE 架构初学者。文章亮点在于详细拆解 Qwen 3 MoE 架构,并用简单代码从零实现 MoE 路由器、RMSNorm 等核心组件,便于理解内部原理。 该方法适用于需部署高性能、高效率大模型&#x…

Spring Boot + ShardingSphere 分库分表实战

🚀Spring Boot ShardingSphere 实战:分库分表,性能暴增的终极指南! ✅ 适用场景:千万级大表、高并发、读写分离场景 ✅ 核心框架:Spring Boot 3.x ShardingSphere-JDBC 5.4.1 ✅ 数据库:MySQL…

MaxKB 使用 MCP 连接 Oracle (免安装 cx_Oracle 和 Oracle Instant Client)

一、背景 安装cx_Oracle包和Oracle Instant Client来操作数据库,比较繁琐同时容易冲突,不同的 Oracle 版本都需要安装不同的插件。这篇文章将介绍使用 MCP 协议的连接方法。 二、操作步骤 1、使用 1Panel 安装 DBhub a) 数据库类型选择 Oracle 类型。…