文章目录

  • 项目介绍大全(可点击查看,不定时更新中)
  • 概要
  • 一、整体资源介绍
    • 技术要点
    • 功能展示:
      • 功能1 支持单张图片识别
      • 功能2 支持遍历文件夹识别
      • 功能3 支持识别视频文件
      • 功能4 支持摄像头识别
      • 功能5 支持结果文件导出(xls格式)
      • 功能6 支持切换检测到的目标查看
  • 二、系统环境与依赖配置说明
  • 三、数据集
  • 四、算法介绍
    • 1. YOLOv8 概述
      • 简介
    • 2. YOLOv5 概述
      • 简介
    • 3. YOLO11 概述
      • YOLOv11:Ultralytics 最新目标检测模型
  • 🌟 五、模型训练步骤
  • 🌟 六、模型评估步骤
  • 🌟 七、训练结果
  • 🌟八、完整代码

往期经典回顾

项目项目
基于yolov8的车牌检测识别系统基于yolov8/yolov5/yolo11的动物检测识别系统
基于yolov8的人脸表情检测识别系统基于深度学习的PCB板缺陷检测系统
基于yolov8/yolov5的茶叶等级检测系统基于yolov8/yolov5的农作物病虫害检测识别系统
基于yolov8/yolov5的交通标志检测识别系统基于yolov8/yolov5的课堂行为检测识别系统
基于yolov8/yolov5的海洋垃圾检测识别系统基于yolov8/yolov5的垃圾检测与分类系统
基于yolov8/yolov5的行人摔倒检测识别系统基于yolov8/yolov5的草莓病害检测识别系统

具体项目资料请看项目介绍大全

项目介绍大全(可点击查看,不定时更新中)

在这里插入图片描述

概要

人工智能 (AI) 在设施农业领域的应用日益广泛,其中基于深度学习的大棚黄瓜检测成为一个备受关注的研究方向。通过利用计算机视觉和深度学习技术,我们可以自动识别大棚黄瓜果实数量、品质等级,提高大棚黄瓜种植的精细化管理水平、产量把控效率与农产品商品价值。本文将介绍基于深度学习的大棚黄瓜检测系统,并提供一个简单的 Python 代码实现,以便读者更好地了解这一技术。

大棚黄瓜是全球重要的设施蔬菜作物,凭借生长周期短、产量高、市场需求稳定的特点,成为大棚种植的核心品类之一,其果实品质与产量直接关系到种植户的经济收益、生鲜市场的供应稳定性及食品加工产业(如腌黄瓜、黄瓜汁制作)的原料质量。然而,大棚黄瓜在种植过程中易面临多重检测需求与挑战:一方面,大棚封闭环境下作物密度高,人工统计果实数量、判断成熟度耗时耗力,且易因主观判断差异导致采收时机偏差,影响果实口感与保鲜期;另一方面,大棚内高温高湿环境易诱发病害(如黄瓜霜霉病导致叶片枯黄、白粉病影响光合作用)与虫害(如蚜虫吸食汁液导致植株衰弱),这些问题初期症状隐蔽,若未及时发现会快速扩散,导致产量锐减、果实品质下降,严重时甚至造成整棚作物绝收。因此,及早检测和准确识别大棚黄瓜的生长状态、果实品质与植株健康问题,对于大棚种植户、设施农业管理团队及农产品收购企业来说至关重要。

此外,我们开发了一款带有UI界面大棚黄瓜检测识别系统,支持实时检测黄瓜数量的识别,并能够直观地展示检测结果。系统采用PythonPyQt5开发,可以对图片、视频及摄像头输入进行目标检测,同时支持检测结果的保存。本文还提供了完整的Python代码和详细的使用指南,供有兴趣的读者学习参考。获取完整代码资源,请参见文章末尾。
  
yolov8/yolov5界面如下

在这里插入图片描述

yolo11界面如下
在这里插入图片描述

关键词:大棚黄瓜检测;深度学习;特征融合;注意力机制;卷积神经网络

在这里插入图片描述

一、整体资源介绍

项目中所用到的算法模型和数据集等信息如下:

算法模型:
    yolov8yolov8 + SE注意力机制yolov5yolov5 + SE注意力机制yolo11yolo11 + SE注意力机制

数据集:
    网上下载的数据集,格式都已转好,可直接使用。

以上是本套代码算法的简单说明,添加注意力机制是本套系统的创新点

技术要点

  • OpenCV:主要用于实现各种图像处理和计算机视觉相关任务。
  • Python:采用这种编程语言,因其简洁易学且拥有大量丰富的资源和库支持。
  • 数据增强技术: 翻转、噪点、色域变换,mosaic等方式,提高模型的鲁棒性。

功能展示:

部分核心功能如下:

  • 功能1: 支持单张图片识别
  • 功能2: 支持遍历文件夹识别
  • 功能3: 支持识别视频文件
  • 功能4: 支持摄像头识别
  • 功能5: 支持结果文件导出(xls格式)
  • 功能6: 支持切换检测到的目标查看

功能1 支持单张图片识别

系统支持用户选择图片文件进行识别。通过点击图片选择按钮,用户可以选择需要检测的图片,并在界面上查看所有识别结果。该功能的界面展示如下图所示:

在这里插入图片描述

在这里插入图片描述

功能2 支持遍历文件夹识别

系统支持选择整个文件夹进行批量识别。用户选择文件夹后,系统会自动遍历其中的所有图片文件,并将识别结果实时更新显示在右下角的表格中。该功能的展示效果如下图所示:

在这里插入图片描述

在这里插入图片描述

功能3 支持识别视频文件

在许多情况下,我们需要识别视频中的目标。因此,系统设计了视频选择功能。用户点击视频按钮即可选择待检测的视频,系统将自动解析视频并逐帧识别多个目标,同时将识别结果记录在右下角的表格中。以下是该功能的展示效果:
在这里插入图片描述

在这里插入图片描述

功能4 支持摄像头识别

在许多场景下,我们需要通过摄像头实时识别目标。为此,系统提供了摄像头选择功能。用户点击摄像头按钮后,系统将自动调用摄像头并进行实时识别,识别结果会即时记录在右下角的表格中。
在这里插入图片描述

在这里插入图片描述

功能5 支持结果文件导出(xls格式)

本系统还添加了对识别结果的导出功能,方便后续查看,目前支持导出xls数据格式,功能展示如下:
在这里插入图片描述

在这里插入图片描述

功能6 支持切换检测到的目标查看

在这里插入图片描述

在这里插入图片描述

二、系统环境与依赖配置说明

本项目采用 Python 3.8.10 作为开发语言,整个后台逻辑均由 Python 编写,主要依赖环境如下:
图形界面框架:

  • PyQt5 5.15.9:用于搭建系统图形用户界面,实现窗口交互与组件布局。 深度学习框架:
  • torch 1.9.0+cu111: PyTorch 深度学习框架,支持 CUDA 11.1 加速,用于模型构建与推理。
  • torchvision 0.10.0+cu111:用于图像处理、数据增强及模型组件辅助。 CUDA与 cuDNN(GPU 加速支持):
  • CUDA 11.1.1(版本号:cuda_11.1.1_456.81):用于 GPU 加速深度学习运算。
  • cuDNN 8.0.5.39(适用于 CUDA 11.1):NVIDIA 深度神经网络库,用于加速模型训练与推理过程。 图像处理与科学计算:
  • opencv-python 4.7.0.72:实现图像读取、显示、处理等功能。
  • numpy 1.24.4:用于高效数组计算及矩阵操作。
  • PIL (pillow) 9.5.0:图像文件读写与基本图像处理库。
  • matplotlib 3.7.1(可选):用于结果图形化展示与可视化调试。

三、数据集

该数据集共包含 1932 张图像,主要用于 大棚环境下黄瓜的目标检测任务。图像采集自实际种植场景,涵盖不同光照、角度、遮挡与密度条件,具有较高的场景复杂性与实用价值。

在这里插入图片描述

四、算法介绍

1. YOLOv8 概述

简介

YOLOv8算法的核心特性和改进如下:

  • 全新SOTA模型
    YOLOv8 提供了全新的最先进(SOTA)的模型,包括P5 640P6 1280分辨率的目标检测网络,同时还推出了基于YOLACT的实例分割模型。与YOLOv5类似,它提供了N/S/M/L/X五种尺度的模型,以满足不同场景的需求。
  • Backbone
    骨干网络和Neck部分参考了YOLOv7 ELAN的设计思想。
    YOLOv5的C3结构替换为梯度流更丰富的C2f结构
    针对不同尺度的模型,调整了通道数,使其更适配各种任务需求。
    在这里插入图片描述
    网络结构如下:
    在这里插入图片描述

相比之前版本,YOLOv8对模型结构进行了精心微调,不再是“无脑”地将同一套参数应用于所有模型,从而大幅提升了模型性能。这种优化使得不同尺度的模型在面对多种场景时都能更好地适应。

然而,新引入的C2f模块虽然增强了梯度流,但其内部的Split等操作对特定硬件的部署可能不如之前的版本友好。在某些场景中,C2f模块的这些特性可能会影响模型的部署效率

2. YOLOv5 概述

简介

YOLOV5有YOLOv5n,YOLOv5s,YOLOv5m,YOLOV5l、YOLO5x五个版本。这个模型的结构基本一样,不同的是deth_multiole模型深度和width_multiole模型宽度这两个参数。就和我们买衣服的尺码大小排序一样,YOLOV5n网络是YOLOV5系列中深度最小,特征图的宽度最小的网络。其他的三种都是在此基础上不断加深,不断加宽。不过最常用的一般都是yolov5s模型。

在这里插入图片描述
本系统采用了基于深度学习的目标检测算法——YOLOv5。作为YOLO系列算法中的较新版本,YOLOv5在检测的精度和速度上相较于YOLOv3和YOLOv4都有显著提升。它的核心理念是将目标检测问题转化为回归问题,简化了检测过程并提高了性能。

YOLOv5引入了一种名为SPP (Spatial Pyramid Pooling)的特征提取方法。SPP能够在不增加计算量的情况下,提取多尺度特征,从而显著提升检测效果。

在检测流程中,YOLOv5首先通过骨干网络对输入图像进行特征提取,生成一系列特征图。然后,对这些特征图进行处理,生成检测框和对应的类别概率分数,即每个检测框内物体的类别和其置信度

YOLOv5的特征提取网络采用了CSPNet (Cross Stage Partial Network)结构。它将输入特征图分成两部分,一部分通过多层卷积处理,另一部分进行直接下采样,最后再将两部分特征图进行融合。这种设计增强了网络的非线性表达能力,使其更擅长处理复杂背景和多样化物体的检测任务。

在这里插入图片描述

3. YOLO11 概述

YOLOv11:Ultralytics 最新目标检测模型

YOLOv11 是 Ultralytics 公司在 2024 年推出的 YOLO 系列目标检测模型的最新版本。以下是对 YOLOv11 的具体介绍:

主要特点

  1. 增强的特征提取

    • 采用改进的骨干和颈部架构,如在主干网络中引入了 c2psa 组件,并将 c2f 升级为 c3k2
    • c3k 允许用户自定义卷积模块的尺寸,提升了灵活性。
    • c2psa 通过整合 psa(位置敏感注意力机制)来增强模型的特征提取效能。
    • 颈部网络采用了 pan 架构,并集成了 c3k2 单元,有助于从多个尺度整合特征,并优化特征传递的效率。
  2. 针对效率和速度优化

    • 精细的架构设计和优化的训练流程,在保持准确性和性能最佳平衡的同时,提供更快的处理速度。
    • 相比 YOLOv10,YOLOv11 的延迟降低了 25%-40%,能够达到每秒处理 60 帧 的速度,是目前最快的目标检测模型之一。
  3. 更少的参数,更高的准确度

    • YOLOv11mCOCO 数据集上实现了比 YOLOv8m 更高的 mAP,参数减少了 22%,提高了计算效率,同时不牺牲准确度。
  4. 跨环境的适应性

    • 可无缝部署在 边缘设备云平台 和配备 NVIDIA GPU 的系统上,确保最大的灵活性。
  5. 支持广泛的任务范围

    • 支持多种计算机视觉任务,包括 目标检测实例分割图像分类姿态估计定向目标检测(OBB)

架构改进

  1. 主干网络

    • 引入了 c2psa 组件,并将 c2f 升级为 c3k2
    • c3k 支持用户自定义卷积模块尺寸,增强灵活性。
    • c2psa 整合了 psa(位置敏感注意力机制),提升特征提取效能。
  2. 颈部网络

    • 采用 pan 架构,并集成了 c3k2 单元,帮助从多个尺度整合特征并优化特征传递效率。
  3. 头部网络

    • YOLOv11 的检测头设计与 YOLOv8 大致相似。
    • 在分类(cls)分支中,采用了 深度可分离卷积 来增强性能。

性能优势

  1. 精度提升

    • COCO 数据集上取得了显著的精度提升:
      • YOLOv11x 模型的 mAP 得分高达 54.7%
      • 最小的 YOLOv11n 模型也能达到 39.5%mAP 得分
    • 与前代模型相比,精度有明显进步。
  2. 速度更快

    • 能够满足实时目标检测需求

🌟 五、模型训练步骤

   提供封装好的训练脚本,如下图,更加详细的的操作步骤可以参考我的飞书在线文档:https://aax3oiawuo.feishu.cn/wiki/HLpVwQ4QWiTd4Ckdeifcvvdtnve , 强烈建议直接看文档去训练模型,文档是实时更新的,有任何的新问题,我都会实时的更新上去。另外B站也会提供视频。

  1. 使用pycharm打开代码,找到train.py打开,示例截图如下:
    在这里插入图片描述

  2. 修改 model_yaml 的值,根据自己的实际情况修改,想要训练 yolov8s模型 就 修改为 model_yaml = yaml_yolov8s, 训练 添加SE注意力机制的模型就修改为 model_yaml = yaml_yolov8_SE

  3. 修改data_path 数据集路径,我这里默认指定的是traindata.yaml 文件,如果训练我提供的数据,可以不用改

  4. 修改 model.train()中的参数,按照自己的需求和电脑硬件的情况更改

    # 文档中对参数有详细的说明
    model.train(data=data_path,             # 数据集imgsz=640,                  # 训练图片大小epochs=200,                 # 训练的轮次batch=2,                    # 训练batchworkers=0,                  # 加载数据线程数device='0',                 # 使用显卡optimizer='SGD',            # 优化器project='runs/train',       # 模型保存路径name=name,                  # 模型保存命名)
    
  5. 修改traindata.yaml文件, 打开 traindata.yaml 文件,如下所示:
    在这里插入图片描述
    在这里,只需修改 path 的值,其他的都不用改动(仔细看上面的黄色字体),我提供的数据集默认都是到 yolo 文件夹,设置到 yolo 这一级即可,修改完后,返回 train.py 中,执行train.py

  6. 打开 train.py ,右键执行。
    在这里插入图片描述

  7. 出现如下类似的界面代表开始训练了
    在这里插入图片描述

  8. 训练完后的模型保存在runs/train文件夹下
    在这里插入图片描述


🌟 六、模型评估步骤

  1. 打开val.py文件,如下图所示:
    在这里插入图片描述

  2. 修改 model_pt 的值,是自己想要评估的模型路径

  3. 修改 data_path ,根据自己的实际情况修改,具体如何修改,查看上方模型训练中的修改步骤

  4. 修改 model.val()中的参数,按照自己的需求和电脑硬件的情况更改

    model.val(data=data_path,           # 数据集路径imgsz=300,                # 图片大小,要和训练时一样batch=4,                  # batchworkers=0,                # 加载数据线程数conf=0.001,               # 设置检测的最小置信度阈值。置信度低于此阈值的检测将被丢弃。iou=0.6,                  # 设置非最大抑制 (NMS) 的交叉重叠 (IoU) 阈值。有助于减少重复检测。device='0',               # 使用显卡project='runs/val',       # 保存路径name='exp',               # 保存命名)
    
  5. 修改完后,即可执行程序,出现如下截图,代表成功(下图是示例,具体以自己的实际项目为准。)
    在这里插入图片描述

  6. 评估后的文件全部保存在在 runs/val/exp... 文件夹下
    在这里插入图片描述


🌟 七、训练结果

我们每次训练后,会在 run/train 文件夹下出现一系列的文件,如下图所示:
在这里插入图片描述

   如果大家对于上面生成的这些内容(confusion_matrix.png、results.png等)不清楚是什么意思,可以在我的知识库里查看这些指标的具体含义,示例截图如下:

在这里插入图片描述

🌟八、完整代码

   如果您希望获取博文中提到的所有实现相关的完整资源文件(包括测试图片、视频、Python脚本、UI文件、训练数据集、训练代码、界面代码等),这些文件已被全部打包。以下是完整资源包的截图

在这里插入图片描述

您可以通过下方演示视频视频简介部分进行获取

演示视频:

67-基于深度学习的大棚黄瓜检测识别系统-yolov8/yolov5-经典版界面

67-基于深度学习的大棚黄瓜检测识别系统-yolo11-彩色版界面

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/95645.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/95645.shtml
英文地址,请注明出处:http://en.pswp.cn/web/95645.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

无人机小尺寸RFSOC ZU47DR板卡

整板尺寸:120*120mmFPGA: XCZU47DR-2FFVE1156I;DDR:PS侧8GB 2400Mhz*64bit / PL侧 4GB 2400Mhz*32bit;2路(QSP0QSPI1)/单片512Mb、共计1Gb;千兆以太网:1路(PS侧);主要接口资源如下&a…

LangGraph(一):入门从0到1(零基础)

文章目录LangGraph入门从0到10️⃣ 安装 & 确认环境1️⃣ 把 LangGraph 想象成「自动化的做菜流水线」2️⃣ 最小可运行例子:一句话复读机3️⃣ 加一个小节点:把用户输入变大写4️⃣ 条件边:如果用户说 quit 就结束,否则复读5…

学习数据结构(16)快速排序

快速排序的基本思想:快速排序是Hoare于1962年提出的一种二叉树结构的交换排序方法,其基本思想为:任取待排序元素序列中的某元素作为基准值,按照该基准值将待排序集合分割成两子序列,左子序列中所有元素均小于基准值&am…

uni-app iOS 上架常见问题与解决方案,实战经验全解析

uni-app 让开发者能够“一套代码,多端运行”,极大降低了开发成本。 但当应用进入 iOS 上架阶段 时,不少团队发现流程并没有想象中那么顺利:证书问题、打包失败、上传出错、审核被拒……这些都可能让项目卡壳。 本文结合实际案例&a…

洗衣机的智能升级集成方案WT2606B屏幕驱动+AI语音控制

2025,洗衣机市场正从功能满足转向体验升级,企业正面临哪些转型难点?一文为您解读洗衣机行业智能化升级之路。传统洗衣机就像是一个"沉默的工人",只能通过简单的LED指示灯告诉你它在工作,却无法让你真正了解它在干嘛。用…

机器学习进阶,梯度提升机(GBM)与XGBoost

梯度提升机(Gradient Boosting Machine, GBM),特别是其现代高效实现——XGBoost。这是继随机森林后自然进阶的方向,也是当前结构化数据竞赛和工业界应用中最强大、最受欢迎的算法之一。为什么推荐XGBoost? 与随机森林互…

【ARMv7】开篇:掌握ARMv7架构Soc开发技能

本专栏,开始与大家共同总结使用ARMv7系列CPU的Soc开发技能。大概汇总了一下,后面再逐步完善下面的思维导图。简单说说:与通用的ARMv7-A/R相比,以STM32F为代表的ARMv7-M架构有以下关键区别和重点:无MMU,有MP…

【学术会议论文投稿】JavaScript在数据可视化领域的探索与实践

【ACM出版 | EI快检索 | 高录用】2024年智能医疗与可穿戴智能设备国际学术会议(SHWID 2024)_艾思科蓝_学术一站式服务平台 更多学术会议请看 学术会议-学术交流征稿-学术会议在线-艾思科蓝 目录 引言 JavaScript可视化库概览 D3.js基础入门 1. 引入…

CSS基础学习步骤

好的,这是一份为零基础初学者量身定制的 **CSS 学习基础详细步骤**。我们将从最根本的概念开始,通过一步一步的实践,带你稳稳地入门。 第一步:建立核心认知 - CSS 是做什么的? 1. 理解角色: HTML&…

MTK Linux DRM分析(三十七)- MTK phy-mtk-hdmi.c 和 phy-mtk-hdmi-mt8173.c

一、简介 HDMI PHY驱动 HDMI 的物理层接口主要就是 HDMI Type-A 接口(19 pin),除此之外还有 Type-B、Type-C(Mini HDMI)、Type-D(Micro HDMI)、Type-E(车载专用)。 1. HDMI Type-A(常见 19-pin 标准接口) HDMI Type-A Connector Pinout ========================…

【人工智能学习之MMdeploy部署踩坑总结】

【人工智能学习之MMdeploy部署踩坑总结】报错1:TRTNet: device must be a GPU!报错2:Failed to create Net backend: tensorrt报错3:Failed to load library libonnxruntime_providers_shared.so1. 确认库文件是否存在2. 重新安装 ONNX Runti…

力扣516 代码随想录Day16 第一题

找二叉树左下角的值class Solution { public:int maxd0;int result;void traversal(TreeNode* root,int depth){if(root->leftNULL&&root->rightNULL){if(depth>maxd){maxddepth;resultroot->val;}}if(root->left){depth;traversal(root->left,depth…

网格图--Day07--网格图DFS--LCP 63. 弹珠游戏,305. 岛屿数量 II,2061. 扫地机器人清扫过的空间个数,489. 扫地机器人,2852. 所有单元格的远离程度之和

网格图–Day07–网格图DFS–LCP 63. 弹珠游戏,305. 岛屿数量 II,2061. 扫地机器人清扫过的空间个数,489. 扫地机器人,2852. 所有单元格的远离程度之和 今天要训练的题目类型是:【网格图DFS】,题单来自灵茶山…

多功能修改电脑机器码序列号工具 绿色版

多功能修改电脑机器码序列号工具 绿色版电脑机器码序列号修改软件是一款非常使用的数据化虚拟修改工具。机器码修改软件可以虚拟的定制您电脑上的硬件信息,软件不会对您的电脑造成伤害。软件不需要您有专业的知识,就可以模拟一份硬件信息。机器码修改软…

React Hooks深度解析:useState、useEffect及自定义Hook最佳实践

React Hooks自16.8版本引入以来,彻底改变了我们编写React组件的方式。它们让函数组件拥有了状态管理和生命周期方法的能力,使代码更加简洁、可复用且易于测试。本文将深入探讨三个最重要的Hooks:useState、useEffect,以及如何创建…

期权平仓后权利金去哪了?

本文主要介绍期权平仓后权利金去哪了?期权平仓后权利金的去向需结合交易角色(买方/卖方)、平仓方式及市场价格变动综合分析,具体可拆解为以下逻辑链条。期权平仓后权利金去哪了?1. 买方平仓:权利金的“差价…

2025国赛C题题目及最新思路公布!

C 题 NIPT 的时点选择与胎儿的异常判 问题 1 试分析胎儿 Y 染色体浓度与孕妇的孕周数和 BMI 等指标的相关特性,给出相应的关系模 型,并检验其显著性。 思路1:针对附件中孕妇的 NIPT 数据,首先对数据进行预处理,并对多…

NLP技术爬取

“NLP技术爬取”这个词组并不指代一种单独的爬虫技术,而是指将自然语言处理(NLP)技术应用于网络爬虫的各个环节,以解决传统爬虫难以处理的问题,并从中挖掘出更深层次的价值。简单来说,它不是指“用NLP去爬”…

让录音变得清晰的软件:语音降噪AI模型与工具推荐

在数字内容创作日益普及的今天,无论是播客、线上课程、视频口播,还是远程会议,清晰的录音质量都是提升内容专业度和观众体验的关键因素之一。然而,由于环境噪音、设备限制等因素,录音中常常夹杂各种干扰声音。本文将介…

大话 IOT 技术(1) -- 架构篇

文章目录前言抛出问题现有条件初步设想HTTP 与 MQTT中间的服务端完整的链路测试的虚拟设备实现后话当你迷茫的时候,请点击 物联网目录大纲 快速查看前面的技术文章,相信你总能找到前行的方向 前言 Internet of Things (IoT) 就是物联网,万物…