本文由「大千AI助手」原创发布,专注用真话讲AI,回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我,一起撕掉过度包装,学习真实的AI技术!

一、核心定义:无记忆的随机演化

马尔可夫链(Markov Chain) 是一种具有马尔可夫性质的离散随机过程,其核心特征是:

未来状态仅取决于当前状态,与历史路径无关

数学表述:
[
P ( X t + 1 = x t + 1 ∣ X t = x t , X t − 1 = x t − 1 , … , X 0 = x 0 ) = P ( X t + 1 = x t + 1 ∣ X t = x t ) P(X_{t+1} = x_{t+1} \mid X_t = x_t, X_{t-1} = x_{t-1}, \dots, X_0 = x_0) = P(X_{t+1} = x_{t+1} \mid X_t = x_t) P(Xt+1=xt+1Xt=xt,Xt1=xt1,,X0=x0)=P(Xt+1=xt+1Xt=xt)
]

往期文章推荐:

  • 20.条件概率:不确定性决策的基石
  • 19.深度解读概率与证据权重 -Probability and the Weighing of Evidence
  • 18.WOE值:风险建模中的“证据权重”量化术——从似然比理论到FICO评分卡实践
  • 17.KS值:风控模型的“风险照妖镜”
  • 16.如何量化违约风险?信用评分卡的开发全流程拆解
  • 15.CatBoost:征服类别型特征的梯度提升王者
  • 14.XGBoost:梯度提升的终极进化——统治Kaggle的算法之王
  • 13.LightGBM:极速梯度提升机——结构化数据建模的终极武器
  • 12.PAC 学习框架:机器学习的可靠性工程
  • 11.Boosting:从理论到实践——集成学习中的偏差征服者
  • 10.GBDT:梯度提升决策树——集成学习中的预测利器
  • 9.集成学习基础:Bagging 原理与应用
  • 8.随机森林详解:原理、优势与应用实践
  • 7.经济学神图:洛伦兹曲线
  • 6.双生“基尼”:跨越世纪的术语撞车与学科分野
  • 5.CART算法全解析:分类回归双修的决策树之王
  • 4.C4.5算法深度解析:决策树进化的里程碑
  • 3.决策树:化繁为简的智能决策利器
  • 2.深入解析ID3算法:信息熵驱动的决策树构建基石
  • 1.类图:软件世界的“建筑蓝图”

二、数学建模:状态空间与转移矩阵

1. 状态空间(State Space)
  • 有限状态: ( S = { s 1 , s 2 , … , s N } \mathcal{S} = \{s_1, s_2, \dots, s_N\} S={s1,s2,,sN} ) (如天气:晴/雨/阴)
  • 无限状态: ( S = Z \mathcal{S} = \mathbb{Z} S=Z ) (如随机游走位置)
2. 转移概率矩阵(Transition Matrix)

定义从状态 ( i ) 到状态 ( j ) 的一步转移概率:
[
P i j = P ( X t + 1 = s j ∣ X t = s i ) P_{ij} = P(X_{t+1} = s_j \mid X_t = s_i) Pij=P(Xt+1=sjXt=si)
]
矩阵形式:
[
P = [ P 11 P 12 ⋯ P 1 N P 21 P 22 ⋯ P 2 N ⋮ ⋮ ⋱ ⋮ P N 1 P N 2 ⋯ P N N ] \mathbf{P} = \begin{bmatrix} P_{11} & P_{12} & \cdots & P_{1N} \\ P_{21} & P_{22} & \cdots & P_{2N} \\ \vdots & \vdots & \ddots & \vdots \\ P_{N1} & P_{N2} & \cdots & P_{NN} \end{bmatrix} P= P11P21PN1P12P22PN2P1NP2NPNN
]
性质:每行和为1( ( \sum_j P_{ij} = 1 ) )

:天气预报的转移矩阵(晴 → 晴:0.8,晴 → 雨:0.2)
[
P = [ 0.8 0.2 0.3 0.7 ] (状态:晴, 雨) \mathbf{P} = \begin{bmatrix} 0.8 & 0.2 \\ 0.3 & 0.7 \end{bmatrix} \quad \text{(状态:晴, 雨)} P=[0.80.30.20.7](状态:晴)
]


三、关键性质分类

1. 不可约性(Irreducibility)
  • 任意两状态可互达: ( ∀ i , j , ∃ k > 0 s.t.  P i j ( k ) > 0 \forall i,j, \exists k>0 \text{ s.t. } P_{ij}^{(k)} > 0 i,j,k>0 s.t. Pij(k)>0 )
  • 意义:链是“整体连通”的,无孤立子系统
2. 周期性(Periodicity)
  • 状态 ( i ) 的周期 ( d ( i ) = gcd ⁡ { k : P i i ( k ) > 0 } d(i) = \gcd\{k: P_{ii}^{(k)} > 0\} d(i)=gcd{k:Pii(k)>0} )
  • 若 ( d(i)=1 ) 则非周期(如晴雨交替无固定循环)
3. 常返性(Recurrence)
  • 常返状态:以概率1返回自身(如吸收态 ( P i i = 1 P_{ii}=1 Pii=1 ))
  • 非常返状态:有概率永不返回(如偏向无穷的随机游走)
4. 遍历性(Ergodicity)
  • 定义:不可约 + 非周期 + 所有状态正常返
  • 核心定理:遍历链存在唯一平稳分布 ( \pi ):
    [
    π j = lim ⁡ n → ∞ P i j ( n ) ∀ i \pi_j = \lim_{n \to \infty} P_{ij}^{(n)} \quad \forall i πj=nlimPij(n)i
    ]
    且满足 ( π P = π \pi \mathbf{P} = \pi πP=π ) (左特征向量)

四、平稳分布:系统的终极平衡

1. 存在条件
  • 有限状态马尔可夫链是遍历的 ⇔ 存在唯一平稳分布
2. 求解方法
  • 解方程: ( π P = π \pi \mathbf{P} = \pi πP=π ) 且 ( ∑ π i = 1 \sum \pi_i = 1 πi=1 )
  • :对天气矩阵 ( P = [ 0.8 0.2 0.3 0.7 ] \mathbf{P} = \begin{bmatrix} 0.8 & 0.2 \\ 0.3 & 0.7 \end{bmatrix} P=[0.80.30.20.7] )
    [
    { 0.8 π 1 + 0.3 π 2 = π 1 0.2 π 1 + 0.7 π 2 = π 2 π 1 + π 2 = 1 ⟹ π = [ 0.6 , 0.4 ] \begin{cases} 0.8\pi_1 + 0.3\pi_2 = \pi_1 \\ 0.2\pi_1 + 0.7\pi_2 = \pi_2 \\ \pi_1 + \pi_2 = 1 \end{cases} \implies \pi = [0.6, 0.4] 0.8π1+0.3π2=π10.2π1+0.7π2=π2π1+π2=1π=[0.6,0.4]
    ]
    长期晴/雨概率比为 3:2
3. 细致平衡条件(更强约束)

若 ( π i P i j = π j P j i \pi_i P_{ij} = \pi_j P_{ji} πiPij=πjPji ) 对任意 ( i,j ) 成立,则称链可逆(如MCMC中的Metropolis-Hastings算法)


五、应用场景:从自然到AI

1. 自然语言处理
  • n-gram语言模型
    ( P ( 句子 ) = P ( w 1 ) ∏ t = 2 T P ( w t ∣ w t − 1 ) P(\text{句子}) = P(w_1) \prod_{t=2}^T P(w_t \mid w_{t-1}) P(句子)=P(w1)t=2TP(wtwt1)) (二元马尔可夫链)
2. 排队论
  • M/M/1队列:顾客到达间隔与服务时间均指数分布,系统状态为当前人数
3. 金融市场
  • 股价模型:状态为涨/跌/平,转移矩阵由历史数据估计
4. 隐马尔可夫模型(HMM)
  • 状态不可观测(如语音识别中音素→单词)
    求解算法:前向-后向算法、Viterbi解码
5. PageRank算法
  • 网页重要性排序
    状态=网页,转移=超链接跳转,平稳分布 ( \pi ) 即PageRank值
    [
    π i = ( 1 − d ) + d ∑ j → i π j L ( j ) ( d : 阻尼因子 ) \pi_i = (1-d) + d \sum_{j \to i} \frac{\pi_j}{L(j)} \quad (d: \text{阻尼因子}) πi=(1d)+djiL(j)πj(d:阻尼因子)
    ]

六、高级扩展

1. 连续时间马尔可夫链(CTMC)
  • 状态转移在任意时刻发生
  • 生成矩阵 ( \mathbf{Q} ) 替代转移矩阵:
    [
    Q_{ij} = \lim_{\Delta t \to 0} \frac{P(X_{t+\Delta t}=j \mid X_t=i)}{\Delta t} \quad (i \neq j)
    ]
    应用:化学反应动力学、电信网络拥塞控制
2. 马尔可夫决策过程(MDP)
  • 引入动作(Action)奖励(Reward)
    贝尔曼方程
    [
    V(s) = \max_a \left[ R(s,a) + \gamma \sum_{s’} P(s’ \mid s,a) V(s’) \right]
    ]
    应用:强化学习(如Q-learning)
3. 马尔可夫随机场(MRF)
  • 状态空间为图结构(无向图)
    吉布斯分布: ( P(\mathbf{x}) = \frac{1}{Z} \exp\left(-\sum_c E_c(\mathbf{x}_c)\right) )
    应用:图像分割、Ising模型

七、Python仿真示例

案例1:天气预报模拟
import numpy as np# 转移矩阵: [晴, 雨]
P = np.array([[0.8, 0.2], [0.3, 0.7]])# 初始状态: 晴=0
state = 0
states = [state]# 模拟100天
for _ in range(100):state = np.random.choice([0, 1], p=P[state])states.append(state)# 统计平稳概率 (最后30天)
steady_state = np.bincount(states[-30:]) / 30
print(f"晴: {steady_state[0]:.2f}, 雨: {steady_state[1]:.2f}")  # ≈ [0.6, 0.4]
案例2:求解平稳分布
# 计算P的特征值为1的左特征向量
eigenvals, eigenvecs = np.linalg.eig(P.T)
pi = eigenvecs[:, np.isclose(eigenvals, 1)].real
pi = pi / pi.sum()  # 归一化
print(pi.flatten())  # [0.6, 0.4]

八、历史注记

  • 1906年:安德烈·马尔可夫为分析普希金诗歌中的元音序列,提出马尔可夫链
  • 1940s:柯尔莫哥洛夫建立一般化理论
  • 1953年:Metropolis提出MCMC采样法(曼哈顿计划)
  • 2000s:成为搜索引擎(PageRank)、语音识别(HMM)、强化学习(MDP)的基石

九、总结:为什么马尔可夫链重要?

  1. 建模复杂性:用简单规则描述动态系统演化
  2. 可计算性:矩阵运算高效求解长期行为
  3. 理论基础:MCMC/HMM/MDP等算法的核心骨架
  4. 跨学科通用:物理、生物、经济、AI的通用语言

未来方向

  • 量子马尔可夫链
  • 非马尔可夫过程的近似表示
  • 与神经网络的融合(如马尔可夫神经网络)

马尔可夫链的魅力在于:看似随机的跳跃背后,隐藏着确定性的数学法则——这正是理解复杂世界演化的钥匙。

本文由「大千AI助手」原创发布,专注用真话讲AI,回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我,一起撕掉过度包装,学习真实的AI技术!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/87605.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/87605.shtml
英文地址,请注明出处:http://en.pswp.cn/bicheng/87605.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【vue3+tauri+rust】如何实现下载文件mac+windows

项目背景:【vue3taurirust】 由于Safari对于下载总是有诸多阻拦,目前需求windowsmac可以实现: 后端返回的url文件可以下载;前端根据dom元素生成的PDF报告可以下载(无远程URL); 我的尝试: 方法…

SQL 快速参考手册-SQL001

SQL 快速参考手册: 为方便快速学习和实践,提供了一份 SQL 快速参考手册,您可以打印出来随时查看,了解常见 SQL 命令的语法和用法。 SQL 数据类型 SQL 数据类型根据不同的数据库系统(如 Microsoft Access、MySQL、SQL…

学习java集合

集合与数组的对比集合的长度可变, 数组的长度不可变集合实际上跟数组一样, 是一种容器, 可以存放数据数组可以直接存放基本数据类型和引用数据类型集合可以存放引用数据类型, 但是不能直接存放基本数据类型, 如果要存放基本数据类型, 需要变成一个包装类才行泛型: 限定集合中存…

python训练day49 CBAM

import torch import torch.nn as nn# 定义通道注意力 class ChannelAttention(nn.Module):def __init__(self, in_channels, ratio16):"""通道注意力机制初始化参数:in_channels: 输入特征图的通道数ratio: 降维比例,用于减少参数量,默认…

在小程序中实现实时聊天:WebSocket最佳实践

前言 在当今互联网应用中,实时通信已经成为一个标配功能,特别是对于需要即时响应的场景,如在线客服、咨询系统等。本文将分享如何在小程序中实现一个高效稳定的WebSocket连接,以及如何处理断线重连、消息发送与接收等常见问题。 W…

Python网络爬虫编程新手篇

网络爬虫是一种自动抓取互联网信息的脚本程序,广泛应用于搜索引擎、数据分析和内容聚合。这次我将带大家使用Python快速构建一个基础爬虫,为什么使用python做爬虫?主要就是支持的库很多,而且同类型查询文档多,在同等情…

LeetCode.283移动零

题目链接:283. 移动零 - 力扣(LeetCode) 题目描述: 给定一个数组 nums,编写一个函数将所有 0 移动到数组的末尾,同时保持非零元素的相对顺序。 请注意 ,必须在不复制数组的情况下原地对数组进行…

2025年7月4日漏洞文字版表述一句话版本(漏洞危害以及修复建议),通常用于漏洞通报中简洁干练【持续更新中】,漏洞通报中对于各类漏洞及修复指南

漏洞及修复指南 一、暗链 危害:攻击者通过技术手段在用户网页中插入隐藏链接或代码,并指向恶意网站,可导致用户信息泄露、系统感染病毒,用户访问被劫持至恶意网站,泄露隐私或感染恶意软件,被黑客利用进行…

python --飞浆离线ocr使用/paddleocr

依赖 # python3.7.3 paddleocr2.7.0.2 paddlepaddle2.5.2 loguru0.7.3from paddleocr import PaddleOCR import cv2 import numpy as npif __name__ __main__:OCR PaddleOCR(use_doc_orientation_classifyFalse, # 检测文档方向use_doc_unwarpingFalse, # 矫正扭曲文档use…

数据结构与算法:贪心(三)

前言 感觉开始打cf了以后贪心的能力有了明显的提升,让我们谢谢cf的感觉场。 一、跳跃游戏 II class Solution { public:int jump(vector<int>& nums) {int n=nums.size();//怎么感觉这个题也在洛谷上刷过(?)int cur=0;//当前步最远位置int next=0;//多跳一步最远…

【Redis篇】数据库架构演进中Redis缓存的技术必然性—高并发场景下穿透、击穿、雪崩的体系化解决方案

&#x1f4ab;《博主主页》&#xff1a;    &#x1f50e; CSDN主页__奈斯DB    &#x1f50e; IF Club社区主页__奈斯、 &#x1f525;《擅长领域》&#xff1a;擅长阿里云AnalyticDB for MySQL(分布式数据仓库)、Oracle、MySQL、Linux、prometheus监控&#xff1b;并对…

Docker 实践与应用案例

引言 在当今的软件开发和部署领域&#xff0c;高效、可移植且一致的环境搭建与应用部署是至关重要的。Docker 作为一款轻量级的容器化技术&#xff0c;为解决这些问题提供了卓越的方案。Docker 通过容器化的方式&#xff0c;将应用及其依赖项打包成一个独立的容器&#xff0c;…

《论三生原理》以非共识路径实现技术代际跃迁‌?

AI辅助创作&#xff1a; 《论三生原理》以颠覆传统数学范式的非共识路径驱动多重技术代际跃迁&#xff0c;其突破性实践与争议并存&#xff0c;核心论证如下&#xff1a; 一、技术代际跃迁的实证突破‌ ‌芯片架构革新‌ 为华为三进制逻辑门芯片提供理论支撑&#xff0c;通过对…

一体机电脑为何热度持续上升?消费者更看重哪些功能?

一体机电脑&#xff08;AIO&#xff0c;All-in-One&#xff09;将主机硬件与显示器集成于单一机身。通常仅需连接电源线&#xff0c;配备无线键盘、鼠标即可启用。相比传统台式电脑和笔记本电脑&#xff0c;选购一体机的客户更看重一体机的以下特点。 一体机凭借其节省空间、简…

无人机载重模块技术要点分析

一、技术要点 1. 结构设计创新 双电机卷扬系统&#xff1a;采用主电机&#xff08;张力控制&#xff09;和副电机&#xff08;卷扬控制&#xff09;协同工作&#xff0c;解决绳索缠绕问题&#xff0c;支持30米绳长1.2m/s高速收放&#xff0c;重载稳定性提升。 轴双桨布局…

【大模型推理】工作负载的弹性伸缩

基于Knative的LLM推理场景弹性伸缩方案 1.QPS 不是一个好的 pod autoscaling indicator 在LLM推理中&#xff0c; 为什么 2. concurrency适用于单次请求资源消耗大且处理时间长的业务&#xff0c;而rps则适合较短处理时间的业务。 3.“反向弹性伸缩”的概念 4。 区分两种不同的…

STM32F103_Bootloader程序开发12 - IAP升级全流程

导言 本教程使用正点原子战舰板开发。 《STM32F103_Bootloader程序开发11 - 实现 App 安全跳转至 Bootloader》上一章节实现App跳转bootloader&#xff0c;接着&#xff0c;跳转到bootloader后&#xff0c;下位机要发送报文‘C’给IAP上位机&#xff0c;表示我准备好接收固件数…

AI驱动的未来软件工程范式

引言&#xff1a;迈向智能驱动的软件工程新范式 本文是一份关于构建和实施“AI驱动的全生命周期软件工程范式”的简要集成指南。它旨在提供一个独立、完整、具体的框架&#xff0c;指导组织如何将AI智能体深度融合到软件开发的每一个环节&#xff0c;实现从概念到运维的智能化…

Hawk Insight|美国6月非农数据点评:情况远没有看上去那么好

7月3日&#xff0c;美国近期最重要的劳动力数据——6月非农数据公布。在ADP遇冷之后&#xff0c;市场对这份报告格外期待。 根据美国劳工统计局公布报告&#xff0c;美国6月非农就业人口增加 14.7万人&#xff0c;预期 10.6万人&#xff0c;4月和5月非农就业人数合计上修1.6万人…

Python 的内置函数 reversed

Python 内建函数列表 > Python 的内置函数 reversed Python 的内置函数 reversed() 是一个用于序列反转的高效工具函数&#xff0c;它返回一个反向迭代器对象。以下是关于该函数的详细说明&#xff1a; 基本用法 语法&#xff1a;reversed(seq)参数&#xff1a;seq 可以是…