💡本文主要内容:本项目基于YOLO11深度学习目标检测算法,设计并实现了一个人体坐姿检测系统。系统能够自动识别图像或视频中的多种坐姿类型(如:正常坐姿、不良坐姿等),为健康监测、智能教室、办公环境管理等场景提供技术支持。
1.数据集介绍
数据集
本项目数据集包含多种场景下的人体坐姿图片,涵盖了正常坐姿、驼背、侧身、翘腿等多种常见坐姿。所有图片均经过人工标注,标注内容包括不同坐姿类别
细节图示例
2.基于YOLOv11的人体坐姿检测
修改sitting_pose_data.yaml
train: ../train/images
val: ../valid/images
test: ../test/images
nc: 2
names: ['sitting_bad', 'sitting_good']
启动训练
import torch
from ultralytics import YOLO
from pathlib import Path
def main():"""快速训练主函数"""print("🧍♂️ 人体坐姿检测 - 快速GPU训练 (本地模型)")print("=" * 60)# 检查GPUif torch.cuda.is_available():device_name = torch.cuda.get_device_name(0)print(f"✅ 使用GPU: {device_name}")device = 'cuda'else:print("❌ GPU不可用,使用CPU")device = 'cpu'
3.训练结果分析
混淆矩阵
本图为混淆矩阵,用于展示模型在各个坐姿类别上的预测准确性。横轴为真实类别,纵轴为模型预测类别。每个格子的数值表示对应真实类别被预测为某类别的样本数量。对角线上的数值表示被正确分类的样本数,越大越好。非对角线上的数值表示分类错误的样本数,数值越小越好。颜色越深表示数量越多,颜色越浅表示数量越少。从图中可以看出,绝大多数样本被正确分类,说明模型对“sitting_bad”,“sitting_good”,“background”三类的区分能力较强。混淆矩阵有助于分析模型在哪些类别上容易混淆,为后续优化数据集或模型提供参考。
F1分数-置信度曲线
本图为F1-Confidence曲线,展示了模型在不同置信度阈值下的F1分数变化情况。曲线中分别绘制了“sitting_bad”、“sitting_good”两个类别的F1分数,以及整体平均F1分数。横轴为置信度阈值,纵轴为F1分数。可以看到,随着置信度阈值的提升,F1分数先升高后降低,说明模型在中等置信度时表现最佳。图例中标注了“all classes 0.91 at 0.530”,表示当置信度阈值为0.53时,整体F1分数达到最高0.91。曲线整体较为平滑且高位,说明模型对不同坐姿类别均有较好的检测性能,且对阈值不敏感,鲁棒性较好。
精度-置信度曲线
本图为Precision-Confidence曲线,展示了模型在不同置信度阈值下的精确率变化情况。曲线分别绘制了 “sitting_bad”、 “sitting_good”两个类别的精确率,以及整体平均精确率。横轴为置信度阈值,纵轴为精确率。精确率越高,说明模型预测为正样本时正确的比例越高。图例中标注了“all classes 1.00 at 0.918”,表示当置信度阈值为0.918时,整体精确率达到最高1.00。曲线整体呈上升趋势,说明随着置信度阈值的提高,模型的预测更加“保守”,但正确率也随之提升。
精度-召回率曲线
本图为Precision-Recall曲线,展示了模型在不同召回率下的精确率表现。曲线分别绘制了“sitting_bad”、“sitting_good”两个类别的PR曲线,以及整体平均PR曲线。横轴为召回率,纵轴为精确率,曲线越靠近右上角,说明模型性能越好。图例中标注了各类别的mAP@0.5值,以及整体mAP@0.5=0.955。曲线大部分区域保持在高位,说明模型在不同阈值下都能保持较高的精确率和召回率。曲线下的面积(mAP值)反映了模型在不同召回率下的平均精度表现,是衡量检测模型性能的重要指标。
召回率-置信度曲线
本图为Recall-Confidence曲线,展示了模型在不同置信度阈值下的召回率变化情况。曲线分别绘制了 “sitting_bad”、“sitting_good”两个类别的召回率,以及整体平均召回率。横轴为置信度阈值,纵轴为召回率。召回率越高,说明模型能够检测出更多的真实目标。图例中标注了“all classes 1.00 at 0.000”,表示当置信度阈值为0时,整体召回率达到最高1.00。 曲线整体呈下降趋势,说明随着置信度阈值的提高,模型变得更加“严格”,但漏检的概率也随之增加。
4.Flask Web界面与系统设计
4.1Flask简介
Flask 是一个用 Python 编写的轻量级 Web 应用框架,具有简单易用、扩展性强等特点。它非常适合快速开发和部署基于 Web 的人工智能应用。通过 Flask,可以将深度学习模型与前端界面无缝集成,实现模型的在线推理和结果可视化
4.2安装Flask
pip install flask
4.3系统功能与运行方式
python app.py
图片检测实例: