文章目录

    • 一、引例——鲸鱼研究
    • 二、泊松分布


一、引例——鲸鱼研究

有生态学家对生活在北冰洋水域的鲸鱼进行了跟踪研究,他们利用一台水下无人机来探测鲸鱼数量,这是近十天的数据:

第1天第2天第3天第4天第5天第6天第7天第8天第9天第10天
1010141211158976

最后四天鲸鱼数目的连续减少趋势令人担忧,水质恶化吗?。

注意到每天探测到的鲸鱼不会是同时发生的,而是分散在一天的不同时间段。

这事实上是一个随机事件的时间分布,于是我们将一天时间划分为12段,那么第一天的数据如下:

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

那么对于这组数据,鲸鱼出现的概率 p = 5/6

我们试图把鱼群数量转换成时间上的二项分布,那么 12 个 时间段就转化成了一个二项分布,一天内出现10头鲸鱼的概率如下:
Cnk⋅pk⋅(1−p)n−k=C1210⋅(56)10⋅(16)2=0.2961C_n^k \cdot p^k \cdot (1-p)^{n-k} = C_{12}^{10} \cdot (\frac{5}{6})^{10} \cdot (\frac{1}{6})^2 = 0.2961 Cnkpk(1p)nk=C1210(65)10(61)2=0.2961
这正是 拉普拉斯 得意门生 西莫恩·德尼·泊松(1781~1840) 的思路。

前面我们选取的是第一天的数据,我们现在选取第二天的数据,有14头鲸鱼,12个时间段有些不够用,于是我们划分成24个时间段。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

则一天中出现14头鲸鱼的概率:
pi=1424=712则Cnk⋅pk⋅(1−p)n−k=C2414⋅(712)14⋅(512)10=0.1634\begin{align} & p_i = \frac{14}{24} = \frac{7}{12} & 则 C_n^k \cdot p^k \cdot (1-p)^{n-k} = C_{24}^{14} \cdot (\frac{7}{12})^{14} \cdot (\frac{5}{12})^{10} = 0.1634 \end{align} pi=2414=127Cnkpk(1p)nk=C2414(127)14(125)10=0.1634
但是我们上面的思考有一个漏洞就:一个时间段是有可能有多头鲸鱼出现的

这说明什么?时间段太大了!我们直接把一天划分成无数个时间段,单独每个时间段都趋于无穷小,这样无论两头鲸鱼的时间挨得有多近,都能区分开来,则有:
limn→∞Cnk⋅pk⋅(1−p)n−k,其中:n代表时间分段数,p代表任意时间段内鲸鱼出现的概率p的估计不再以某一天数据为准,而是选取平均值,即p=μn\begin{align} & lim_{n \rightarrow \infty} C_n^k \cdot p^k \cdot (1-p)^{n-k},其中:\\ & n代表时间分段数,p代表任意时间段内鲸鱼出现的概率 \\ & p的估计不再以某一天数据为准,而是选取平均值,即 p = \frac{\mu}{n} \end{align} limnCnkpk(1p)nk,其中:n代表时间分段数,p代表任意时间段内鲸鱼出现的概率p的估计不再以某一天数据为准,而是选取平均值,即p=nμ

公式的进一步推导
limn→∞Cnk⋅pk⋅(1−p)n−k=limn→∞Cnk⋅(μn)k⋅(1−μn)n−k=lim⁡n→∞n(n−1)(n−2)⋯(n−k+1)k!⋅μknk⋅(1−μn)n−k=μkk!⋅lim⁡n→∞n(n−1)(n−2)⋯(n−k+1)nk⋅(1−μn)n−k=μkk!⋅lim⁡n→∞nn(n−1)n(n−2)n⋯(n−k+1)n⋅(1−μn)n−k=μkk!⋅lim⁡n→∞1⋅1…1⋅(1−μn)n−k=μkk!⋅lim⁡n→∞(1−μn)n−k=μkk!⋅lim⁡n→∞(1−μn)n⋅lim⁡n→∞(1−μn)−k=μkk!⋅lim⁡n→∞(1−μn)n=μkk!e−μ(等价无穷小)\begin{align} & lim_{n \rightarrow \infty} C_n^k \cdot p^k \cdot (1-p)^{n-k} \\ =& lim_{n \rightarrow \infty} C_n^k \cdot (\frac{\mu}{n})^k \cdot (1-\frac{\mu}{n})^{n-k} \\ =& \lim _{n \rightarrow \infty} \frac{n(n-1)(n-2) \cdots(n-k+1)}{k!} \cdot \frac{\mu^{k}}{n^{k}} \cdot\left(1-\frac{\mu}{n}\right)^{n-k} \\ =& \frac{\mu^{k}}{k!} \cdot \lim _{n \rightarrow \infty} \frac{n(n-1)(n-2) \cdots(n-k+1)}{n^{k}} \cdot\left(1-\frac{\mu}{n}\right)^{n-k} \\ =& \frac{\mu^{k}}{k!} \cdot \lim _{n \rightarrow \infty} \frac{n}{n} \frac{(n-1)}{n} \frac{(n-2)}{n} \cdots \frac{(n-k+1)}{n} \cdot\left(1-\frac{\mu}{n}\right)^{n-k} \\ =& \frac{\mu^{k}}{k!} \cdot \lim _{n \rightarrow \infty} 1 \cdot 1 \dots 1 \cdot\left(1-\frac{\mu}{n}\right)^{n-k} \\ =& \frac{\mu^{k}}{k!} \cdot \lim _{n \rightarrow \infty} \left(1-\frac{\mu}{n}\right)^{n-k} \\ =& \frac{\mu^{k}}{k!} \cdot \lim _{n \rightarrow \infty} \left(1-\frac{\mu}{n}\right)^{n} \cdot \lim _{n \rightarrow \infty} \left(1-\frac{\mu}{n}\right)^{-k} \\ =& \frac{\mu^{k}}{k!} \cdot \lim _{n \rightarrow \infty} \left(1-\frac{\mu}{n}\right)^{n} \\ =& \frac{\mu^{k}}{k!} e^{-\mu} (等价无穷小) \\ \end{align} =========limnCnkpk(1p)nklimnCnk(nμ)k(1nμ)nknlimk!n(n1)(n2)(nk+1)nkμk(1nμ)nkk!μknlimnkn(n1)(n2)(nk+1)(1nμ)nkk!μknlimnnn(n1)n(n2)n(nk+1)(1nμ)nkk!μknlim111(1nμ)nkk!μknlim(1nμ)nkk!μknlim(1nμ)nnlim(1nμ)kk!μknlim(1nμ)nk!μkeμ(等价无穷小)

二、泊松分布

我们把上面的μ 换成 λ,就得到了我们熟悉的泊松分布公式:
λkk!e−λ,其中λ代表给定时间段或空间区域内,随机事件平均发生的次数。\frac{\lambda^k}{k!}e^{-\lambda},其中 \lambda 代表给定时间段或空间区域内,随机事件平均发生的次数。 k!λkeλ,其中λ代表给定时间段或空间区域内,随机事件平均发生的次数。

我们利用该公式计算引例中各时间段鲸鱼出现数目的可能性,并用柱状图来表示:

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

我们取显著性水平为 6.5%,那么从图中可以得知,鲸鱼数目在[5, 15]都是正常范围,我们的样本都在正常范围内。

有时候我们会用用泊松分布近似二项分布,一般在 试验次数n 很大,成功概率 p 很小,且 λ = np 为有限值时,二项分布可以用泊松分布来近似,经过前面的推导,不难明白其中缘由。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/92835.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/92835.shtml
英文地址,请注明出处:http://en.pswp.cn/diannao/92835.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python学习DAY22打卡

作业: 自行学习参考如何使用kaggle平台,写下使用注意点,并对下述比赛提交代码 kaggle泰坦尼克号人员生还预测 import warnings warnings.filterwarnings("ignore") #忽略警告信息 # 数据处理清洗包 import pandas as pd import …

在 Ansys CFX Pre 中配置 RGP 表的分步指南

掌握在 Ansys CFX Pre 中设置 RGP 表的技巧,以优化仿真精度和效率。挑战在计算流体动力学 (CFD) 领域,RGP(真实气体属性)表对于准确模拟流体在不同条件下的行为至关重要。这些表格提供了详细的热力学属性&a…

C语言————原码 补码 反码 (日渐清晰版)

本文的内容通下面这篇文章有着紧密的联系,读者可以选择性阅读 C语言————二、八、十、十六进制的相互转换-CSDN博客 目录 基本概念 原码 反码 补码 转换 数据的存储方式 基本存储单位 数据的计算方式 补码的模运算原理 移位操作符 左移操作符 右移操…

函数-变量的作用域和生命周期

变量的作用域 引入问题 我们在函数设计的过程中,经常要考虑对于参数的设计,换句话说,我们需要考虑函数需要几个参数,需要什么类型的参数,但我们并没有考虑函数是否需要提供参数,如果说函数可以访问到已定义…

Ansible在配置管理中的应用

Ansible是一个开源的配置管理和应用程序部署工具,它使用YAML语言编写的Playbook来描述配置和应用部署过程。通过SSH协议与目标机器通信,Ansible可以实现批量操作,极大地提升了工作效率。核心功能Ansible的核心功能包括:配置管理&a…

【学习路线】Go语言云原生开发之路:从简洁语法到微服务架构

一、Go语言基础入门(1-2个月) (一)环境搭建与工具链Go环境安装 官方安装:从golang.org下载安装包版本管理:g、gvm等Go版本管理工具环境变量:GOROOT、GOPATH、GOPROXY配置Go Modules:…

软件工厂:推动新质生产力的组织跃迁

引言:软件工厂的建设,不在于工具多,而在于理解深;不在于上线快,而在于体系稳。不仅是“看得见的流水线”,更是“看不见的组织变革”。在新质生产力的时代命题下,软件工厂正成为连接创新与效率、…

9.0% 年增速驱动!全球自清洁滚轮拖布机器人市场2031年将迈向 946 百万美元

自清洁滚轮拖布机器人是重要的智能清洁设备,采用滚筒式拖布结构,集扫拖功能,通过高速旋转加压擦洗地面,深度除污。其活水清洁系统可实时自清洁、回收污水,避免二次污染,提升清洁效率与效果,带来…

新能源工厂的可视化碳中和实验:碳足迹追踪看板与能源调度策略仿真

摘要新能源工厂明明用着风电、光伏等清洁能源,碳排放数据却依旧居高不下?某锂电池厂耗费百万升级设备,碳足迹却难以精准追踪,能源调度全靠经验“拍脑袋”,导致成本飙升。而隔壁企业通过可视化碳中和实验,碳…

数据结构自学Day13 -- 快速排序--“非递归利用栈实现”

一、快速排序回顾 快速排序本质上是**“分而治之”(Divide and Conquer)策略的递归应用。但递归其实就是函数栈的一种体现,因此我们也可以显式使用栈(stack)来模拟递归过程**,从而实现非递归版本的快速排序…

前端数据库:IndexedDB 基础使用

前言 在现代 Web 开发中,随着应用程序复杂度的增加,对本地存储的需求也越来越高。虽然 localStorage 和 sessionStorage 可以满足一些简单的数据存储需求,但当需要存储大量结构化数据或进行复杂查询时,它们就显得力不从心了。这时…

Kubernetes深度解析:企业级容器编排平台的核心实践

引言:Kubernetes的战略地位与核心价值在云原生技术生态中,​​Kubernetes​​已成为容器编排的事实标准。根据2023年全球云原生调查报告:全球​​96%​​ 的组织正在使用或评估Kubernetes企业生产环境Kubernetes采用率增长​​400%​​&#…

Netty中future和promise用法和区别

定义与概念 Future:表示一个异步操作的结果。它是只读的,意味着你只能查看操作是否完成、是否成功、获取结果或者异常等信息,但不能主动设置操作的结果。Promise:是 Future 的可写扩展。它不仅可以像 Future 一样查看操作结果&…

微算法科技(NASDAQ:MLGO)采用分布式哈希表优化区块链索引结构,提高区块链检索效率

随着区块链技术的快速发展,其在各个领域的应用越来越广泛。然而,区块链数据的存储和检索效率问题一直是制约其发展的瓶颈之一。为了解决这一问题,微算法科技(NASDAQ:MLGO)采用了分布式哈希表(DHT)技术来优化…

Jmeter的元件使用介绍:(三)配置元件详解01

Jmeter的配置元件有非常多,常用的有:信息头管理器、Cookie管理器、用户定义的变量、Http请求默认值、JDBC Connection Configuration、CSV 数据文件设置、计数器等,本文会对这些常用的配置元件一一介绍,还有其他很多配置元件&…

git 连接GitHub仓库

一、安装 git 包在官网下载 git 包二、通过SSH密钥与GitHub远程仓库连接1. 检查本地 SSH 密钥是否存在ls -al ~/.ssh如果看到 id_rsa 和 id_rsa.pub,说明已有密钥。2.如果没有,生成新的 SSH 密钥:ssh-keygen -t ed25519 -C "your_email…

如何通过AI扫描代码中的问题

代码质量其实在需求高压,业务快速迭代的场景下往往容易被人忽视的问题,大家的编码习惯和规范也经常会各有喜好,短期之内获取看不出来什么问题,但长此以往就会发现,屎山逐步成型了,而线上代码跑着往往就不想…

Java 大视界 -- Java 大数据机器学习模型在金融衍生品市场波动特征挖掘与交易策略创新中的应用(363)

Java 大视界 -- Java 大数据机器学习模型在金融衍生品市场波动特征挖掘与交易策略创新中的应用(363)引言:正文:一、Java 构建的金融数据处理架构1.1 多源异构数据实时融合1.2 新闻舆情与市场冲击建模二、Java 驱动的波动特征挖掘与…

Cartographer安装测试与模块开发(三)--Cartographer在Gazebo仿真环境下的建图以及建图与定位阶段问题(实车也可参考)

参数介绍之所以要首先介绍参数而不是实操,是因为大部分建图失败、漂移基本上都是参数设置错误引起的,或者说大部分都是TF存在问题,主要是坐标系Frame之间有冲突或者对不上等原因导致的,因此把参数放在前面介绍,了解了参…

uniapp nvue开发App 横竖屏切换丢失上下文导致 setTimeout和clearTimeout报错

报错内容如下 [JS Framework] Failed to find taskCenter (35). [JS Framework] Failed to execute the callback function:TypeError: c.clearTimeout is not a function reportJSException >>>> exception function:__WEEX_CALL_JAVASCRIPT__, exception:JavaSc…