LeNet-5

网络架构

输入 32x32
卷积C1 6@28x28
池化S2 6@14x14
卷积C3 16@10x10
池化S4 16@5x5
全连接F5 120
全连接F6 84
输出 10
LeNet-5网络架构示例图
LeNet-5网络架构示例图

核心贡献

  1. 卷积-池化交替结构:奠定CNN基础范式
  2. 特征层次提取:从边缘→部件→对象
  3. 端到端训练:原始像素到最终分类
  4. 权值共享:大幅减少参数

技术规格

  • 输入尺寸:32×32灰度图像
  • 卷积核:5×5
  • 池化:2×2平均池化
  • 激活函数:Sigmoid
  • 首次应用于手写数字识别(MNIST)

AlexNet

突破性架构设计

AlexNet网络架构示例图
AlexNet网络架构示例图

革命性创新

  1. ReLU激活函数

    • 解决梯度消失问题
    • 加速训练收敛
    • 计算效率高于Sigmoid/Tanh
  2. Dropout正则化

    • 在全连接层使用
    • 防止过拟合
    • 提升泛化能力
  3. 重叠池化

    • 池化步长(2)小于窗口大小(3)
    • 提升特征丰富性
    • 减少过拟合
  4. 多GPU并行

    • 首次分布式训练
    • 跨GPU通信优化

卷积网络结构优化之路

1. VGG

输入224x224
2x卷积64
最大池化
2x卷积128
最大池化
3x卷积256
最大池化
3x卷积512
最大池化
3x卷积512
最大池化
全连接x3
输出1000

核心思想

  • 同构块设计:所有卷积层使用3×3小核
  • 深度堆叠:16-19层网络
  • 特征传递:每块通道数翻倍

3×3卷积优势

  • 相同感受野下参数更少:2层3×3 vs 1层5×5
    • 参数量:2×(3²C²) = 18C² vs 25C²
  • 更多非线性变换
  • 决策函数更具判别性

2. ResNet

核心问题:深度网络退化现象

跳跃连接
输入
权重层
权重层
输出

残差块设计
y=F(x,Wi)+xy = \mathcal{F}(x, {W_i}) + xy=F(x,Wi)+x

创新价值

  1. 解决梯度消失问题
  2. 允许训练1000+层网络
  3. 特征复用与传播

Inception结构

1×1卷积

核心功能

  1. 降维压缩
    • 减少通道数
    • 控制计算量
  2. 特征重组
    • 跨通道信息整合
    • 增强特征表达能力
  3. 非线性增强
    • 添加ReLU激活
    • 提升模型表达能力
降维操作
256通道
64通道
1x1卷积64
256@28x28
输出64@28x28

计算量对比

  • 直接5×5卷积:256×256×5×5×28×28 = 1.28G FLOPs
  • 1×1降维后:256×64×1×1×28×28 + 64×256×5×5×28×28 = 0.15G FLOPs
  • 计算量减少88%

Inception模块

设计哲学

“让网络自己选择最优特征尺度” - Christian Szegedy

基础Inception模块

输入
1x1卷积
3x3卷积
5x5卷积
3x3最大池化
特征拼接
输出
Inception示例图
Inception示例图

创新特点

  1. 并行多尺度处理

    • 1×1卷积:捕获局部特征
    • 3×3卷积:中等感受野
    • 5×5卷积:大感受野
    • 池化:空间不变性
  2. 瓶颈设计

    • 每个分支前使用1×1卷积降维
    • 平衡计算复杂度
  3. 特征多样性

    • 不同感受野特征融合
    • 增强模型表达能力

GoogleNet(了解)

网络架构全景

Inception示例图
Inception示例图

核心成就

  • 2014 ImageNet冠军(Top-5错误率6.67%)
  • 仅500万参数(AlexNet的1/12)
  • 计算量1.5G FLOPs(AlexNet的1/3)

创新设计

  1. Inception模块堆叠:9个模块化单元
  2. 中间辅助分类器:2个辅助输出
  3. 高效特征金字塔:宽度渐增,深度渐减

卷积神经网络特征可视化

理解CNN的"视觉世界"

可视化方法

  1. 第一层滤波器可视化

    原始图像
    第一层卷积
    滤波器权重
    边缘/纹理模式
  2. 特征图激活可视化

    输入图像
    卷积层
    选择特定特征图
    上采样回原图
    激活区域可视化
  3. 最大激活图像

    选择神经元
    搜索数据集
    找到最大激活图像
    理解神经元响应

层次化特征学习

特征抽象层次

可视化示例
边缘
纹理
部件
Gabor滤波器
浅层特征
网格/环状模式
中层特征
物体部件
深层特征
完整物体
高级语义
  1. 浅层(Conv1-2)

    • 边缘检测器
    • 颜色对比区域
    • 方向敏感纹理
  2. 中层(Conv3-4)

    • 纹理组合
    • 重复图案
    • 简单形状
  3. 深层(Conv5+)

    • 物体部件(眼睛、车轮)
    • 复杂结构
    • 类别特定特征

经典CNN架构对比分析

架构创新点参数量计算量Top-5错误率
LeNet-5首CNN实践6万->1%(MNIST)
AlexNetReLU/Dropout6000万1.1G FLOPs15.3%
VGG-16同构3×3块1.38亿15.5G FLOPs7.3%
Inception v3多尺度融合2400万5G FLOPs5.6%
ResNet-50残差连接2560万4.1G FLOPs4.9%

总结

  1. 特征学习优于特征工程

    • CNN自动学习层次化特征
    • 端到端训练消除人工干预
  2. 架构创新驱动性能突破

    • ReLU解决梯度消失
    • 残差连接实现深度训练
    • Inception优化计算效率
  3. 可视化解锁黑箱

    • 特征可视化揭示网络工作原理
    • 指导网络设计与优化
    • 增强模型可解释性
  4. 未来方向

    • 神经架构搜索(NAS)
    • 注意力机制融合
    • 多模态联合学习
    • 轻量化部署

“卷积神经网络不仅改变了计算机视觉,更重塑了我们对学习的理解。” - Geoffrey Hinton

经典CNN架构的演进历程,展现了一条从手工特征到自主学习、从浅层网络到深层架构、从单一尺度到多尺度融合的技术进化之路。这些创新奠定了现代深度学习的基础,也为未来人工智能的发展指明了方向。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/88023.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/88023.shtml
英文地址,请注明出处:http://en.pswp.cn/pingmian/88023.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

mybatis/mybatis-plus添加数据,自增id的值为负数

1、问题概述?使用mybatis-plus的insert方法添加数据的时候,数据虽然添加成功了,但是返回值为false,提示添加失败。当观察数据的时候,发现数据的自增主键id的值尽然为-1,或者无规律的长串负数,如…

商业创业融资项目计划书PPT模版

创业融资计划书PPT模版,营销模式分析PPT模版,创业计划书PPT模版,互联网电商创业推广手册PPT模版,商业项目计划书PPT模版,高端商业计划通用PPT模版,商业计划书,科技商业PPT模版 商业创业融资项目…

新人如何入门学习 STM32?

作为一个在嵌入式领域摸爬滚打了近10年的老兵,看到这个问题时我的思绪瞬间回到了当年那个懵懂的自己。说实话,2014年那个夏天,24岁的我刚从机械专业毕业却被调剂到了厦门某马的电子部门,第一次听到"STM32"这个词的时候&…

clickhouse数据库表和doris数据库表迁移starrocks数据库时建表注意事项总结

目录零、前言一、clickhouse数据库表在starrocks数据库建表时问题总结1.1 数据类型类问题:1.2 数据导出阶段:二、doris 数据库表在starrocks数据库建表时问题总结2.1 properties不支持的属性(直接删除):2.2 properties…

社区云管家 - 智慧生活新方式 ——仙盟创梦IDE

社区服务热门推荐数字化时代的社区服务新形态​在数字化浪潮席卷日常生活的今天,一个集多功能于一体的综合社区官网正成为连接居民与社区服务的核心纽带。这类平台以 “一站式解决生活需求” 为核心,将看房、外卖、物业、快递、求职、生鲜、出行、文具打…

MongoDB GridFS

MongoDB GridFS 引言 MongoDB 是一种高性能、可扩展的文档存储系统,它提供了灵活的数据模型和丰富的查询功能。在处理大量非结构化数据时,MongoDB 的 GridFS 功能尤为突出。GridFS 是一种用于存储和检索大文件的解决方案,它可以存储任意大小的文件,并将其分解为多个较小的…

Linux中程序的limits中的Max open files的配置由哪些参数决定

在 Linux 中,程序的 Max open files(最大打开文件数,即 ulimit -n)由多个层级的参数共同控制,具体如下: 1. 内核级全局限制(系统默认上限) 由 /proc/sys/fs/file-max 控制&#xff0…

git clone xxx.git 提示报错:fatal: Unable to find remote helper for ‘http‘

[rootroot /home]# git clone http://gitlab.xxx.qunar.com/xx/xxx.git Cloning into ‘xxx’… fatal: Unable to find remote helper for ‘http’ 我今天在Linux服务器上执行git clone一个仓库的代码到机器上,但是执行的时候提示上面的错误,我就很诧异…

【机器学习笔记Ⅰ】10 特征工程

特征工程(Feature Engineering)详解 特征工程是机器学习和数据科学中的核心环节,旨在通过对原始数据的转换、组合和提取,构建更适合模型的高质量特征。其质量直接决定模型性能上限(“数据和特征决定了模型的上限&#…

20250708-03-string结构及命令详解_笔记

一、字符串操作1. set命令1)set命令详解基本语法与参数命令格式:set key value [ex 秒数]/[px 毫秒数][nx]/[xx]有效期设置:ex参数:以秒为单位设置过期时间,如set a 1 ex 10表示1…

SpringBoot3-集成MybatisPlus

此次操作是在多模块下进行的&#xff0c;SpringBoot3-规划多模块目录 添加管理依赖 根模块 zibocoder-parent 的 pom.xml 中添加 MybatisPlus bom 管理依赖 <properties>...<mybatis-plus.version>3.5.12</mybatis-plus.version>... </properties> <…

部署MongoDB

环境:CentOS7 添加 MongoDB 官方 YUM 仓库 sudo vi /etc/yum.repos.d/mongodb-org-6.0.repo 将以下内容粘贴到文件中(以 MongoDB 6.0 为例): [mongodb-org-6.0] name=MongoDB Repository baseurl=https://repo.mongodb.org/yum/redhat/$releasever/mongodb-org/6.0/x86…

重学前端002 --响应式网页设计 CSS 基础

文章目录css 样式特殊说明根据在这里 Freecodecamp 实践&#xff0c;调整顺序后做的总结。 css 样式 body {background-color: red; # 跟background-image 不同时使用background-image: url(https://cdn.freecodecamp.org/curriculum/css-cafe/beans.jpg);font-family: sans-…

Zig高并发爬取数据简洁模版

上文中我们介绍了Zig语言得爬虫的有些优劣势&#xff0c;想必大家对于自身项目选择那种语言做爬虫应该有些思路了&#xff0c;今天我将使用Zig的标准库来构建一个简单的高并发爬虫模板。由于Zig的异步机制和标准库中的http模块&#xff0c;我们可以实现一个基于事件循环的爬虫。…

IS-IS 协议 | LSP 传输与链路状态数据库同步机制

略作整理&#xff0c;待校。IS-IS 中 SRM 与 SSN 标志的作用及协同机制 SRM 和 SSN 标志的作用 在 IS-IS 协议中&#xff0c;SRM 和 SSN 是两个关键标志&#xff0c;用于控制和优化 LSP&#xff08;Link State PDU,链路状态信息&#xff09;在网络中的泛洪与同步过程。 一、SRM…

xxl-job 改造适配pg数据后的Jenkins自动部署

接上文适配pg数据库之后需要进行部署&#xff0c;便有了此文 1.下载并安装Jenkins如下&#xff1a; https://mirrors.jenkins.io/war-stable/2.504.3/jenkins.war nohup java -jar jenkins.war --httpPort8080 & 启动Jenkins并解锁安装需要的环境&#xff0c;git&#xff0…

数据库Oracle从入门到精通!第四天(并发、锁、视图)

八、并发控制数据库是一个共享资源&#xff0c;可以为多个应用程序所共享&#xff0c;这些程序可以串行执行&#xff08;排队执行&#xff09;&#xff0c;但是很多情况下&#xff0c;可能出现多个程序或一个程序中的多个进程并行的执行&#xff0c;这就是数据库的并行操作&…

EXCEL(带图)转html

文章目录叙述1、效果2、excel 转换主逻辑3、其他补充3.0 主前端bootstrap3.1 my.css&#xff1a;3.2 my.js3.3 入口home.html3.4 Data.ashx叙述 要实现H5 展示excel 查询 了一下没有好的办法,自己写了一个,简单记录一下 1、效果 用bootstrap 根据sheet做了一个菜单。 2、exc…

小程序富文本Editor插入图片、超链接、公式等的一次尝试

小程序插入图片 通过EditorContext.insertImage接口可以实现图片的插入&#xff1a; EditorContext.insertImage({src,width,height,data, })如何插入超链接、公式、视频、表格等等? 通过EditorContext.insertCustomBlock应该是可以实现的&#xff0c;具体实现方式我没有了…

传输层协议TCP、UDP

传输层协议TCP、UDP 1、TCP和UDP报文格式 传输层协议TCPvsUDP 传输层主要两个传输协议&#xff0c;分别是TCP和UDP&#xff0c;负责提供流量控制、排序服务和错误校验。 &#xff08;1&#xff09;TCP是面向连接的&#xff0c;一般用于传输数据量比较少&#xff0c;且对可靠性要…