为了更好的评估机器学习训练出模型的泛化能力，即避免模型在训练集上表现良好，但在未见过的数据上表现不佳（即过拟合），同时也减少了单一训练/测试集划分带来的随机性影响。

一、什么是K折交叉验证？

1、将数据集划分成K个子集（折/Fold）： 原始数据集被随机且均匀地分成K个大小近似相等的互斥子集。

2、进行K次训练和评估：

在每次迭代中，选择其中一个子集作为测试集（Validation Set）。

将其余的 K-1 个子集合并起来作为训练集（Training Set）。

用训练集训练模型。

用测试集评估模型的性能（例如，计算准确率、F1分数、均方误差等）。

3、计算平均性能： 重复上述过程K次，每次都选择不同的子集作为测试集。这样会得到K个性能评估结果。最终，将这K个结果取平均值，作为模型性能的最终估计。

二、常见案例

五重交叉验证，K=5 。

具体步骤如下：

1、数据划分： 将原始数据集随机分成 5个大小近似相等的互不重叠的子集（或称为“折”）。我们称它们为 Fold 1, Fold 2, Fold 3, Fold 4, Fold 5。

2、迭代训练与评估（共进行5次）：

第一次迭代：

将 Fold 1 作为测试集。

将 Fold 2, Fold 3, Fold 4, Fold 5 合并作为训练集。

用训练集训练模型，并在测试集（Fold 1）上评估模型性能，得到性能指标 P1。

第二次迭代：

将 Fold 2 作为测试集。

将 Fold 1, Fold 3, Fold 4, Fold 5 合并作为训练集。

用训练集训练模型，并在测试集（Fold 2）上评估模型性能，得到性能指标 P2。

第三次迭代：

将 Fold 3 作为测试集。

将 Fold 1, Fold 2, Fold 4, Fold 5 合并作为训练集。

用训练集训练模型，并在测试集（Fold 3）上评估模型性能，得到性能指标 P3。

第四次迭代：

将 Fold 4 作为测试集。

将 Fold 1, Fold 2, Fold 3, Fold 5 合并作为训练集。

用训练集训练模型，并在测试集（Fold 4）上评估模型性能，得到性能指标 P4。

第五次迭代：

将 Fold 5 作为测试集。

将 Fold 1, Fold 2, Fold 3, Fold 4 合并作为训练集。

用训练集训练模型，并在测试集（Fold 5）上评估模型性能，得到性能指标 P5。

3、最终性能估计： 将这5次得到的性能指标 P1, P2, P3, P4, P5 取平均值，即 (P1 + P2 + P3 + P4 + P5) / 5。这个平均值就是模型在未见过数据上的性能的最终估计。

三、K的选择

5折和10折交叉验证是实践中最常用的两种K值。

K值越大（例如，留一法交叉验证 LOOCV，K=N，N是样本总数）：

每次训练集包含的样本越多，越接近原始数据集，模型评估的偏差越小。

但需要训练N次模型，计算成本非常高。

测试集只包含一个样本，评估结果的方差可能很大（不稳定）。

K值越小（例如，2折交叉验证）：

训练次数少，计算速度快。

但每次训练集包含的样本较少，模型可能训练不足，评估结果的偏差可能较大。

5折交叉验证提供了一个很好的平衡：它既不会像LOOCV那样计算成本过高，又能比简单的训练/测试划分或小K值交叉验证提供更稳定和可靠的性能估计。

一、什么是K折交叉验证？

二、常见案例

三、K的选择

相关文章

详细解读k8s的kind中service与pod的区别

python---PyInstaller（将Python脚本打包为可执行文件）

利用归并算法对链表进行排序

论文阅读_大模型情绪分析预测股票趋势

websocket和socket区别

网络复习1

AFSim2.9.0学习笔记 —— 4.2、ArkSIM文件结构介绍及项目结构整理

hbuilderx配置微信小程序开发环境

AUTOSAR Adaptive Platform 日志与追踪 (Log and Trace) 规范深度解析

[硬件电路-179]：集成运放，虚短的是电压，虚断的是电流

Redis常见问题及其处理策略

微算法科技（NASDAQ: MLGO）结合子阵列算法，创建基于区块链的动态信任管理模型

【展厅多媒体】从技术到体验，AR在展厅中的一体化整合

人工智能机器学习——模型评价及优化

linux系统启动时脚本命令执行

连接池项目考点

【MySQL】从零开始了解数据库开发 --- 数据类型

mybatis vs mybatis-plus

2025胶水分装机服务商技术解析：聚焦高精度、智能化应用

v-model是怎么实现的，语法糖到底是什么