Class24AlexNet

AlexNet
AlexNet于2012年ImageNet 图像识别挑战赛(ILSVRC-2012)中以 top-5 错误率15.3%获得冠军,远远领先第二名。它首次在大型图像数据集上证明了深层卷积神经网络的强大能力。

AlexNet 的总体结构

AlexNet 总共有 8 层具有学习参数的网络层:

层编号类型参数 / 特点
1卷积层(Conv1)11×11 卷积核,96个通道,步幅4,ReLU,局部响应归一化(LRN),最大池化
2卷积层(Conv2)5×5 卷积核,256个通道,ReLU,LRN,最大池化
3卷积层(Conv3)3×3 卷积核,384个通道,ReLU
4卷积层(Conv4)3×3 卷积核,384个通道,ReLU
5卷积层(Conv5)3×3 卷积核,256个通道,ReLU,最大池化
6全连接层(FC6)输入维度较大,输出为 4096,ReLU,Dropout
7全连接层(FC7)4096 → 4096,ReLU,Dropout
8全连接层(FC8)4096 → 1000(类别数),Softmax 输出

AlexNet的特点

1.使用 GPU 加速

AlexNet 是第一个在训练时使用 GPU 加速的深度网络。当时使用了 2 个 GPU 并行处理,每个 GPU 处理一半神经元,跨 GPU 只在某些层通信。

2.使用 ReLU 激活函数

替代传统的 sigmoid / tanh,使得网络收敛更快。

3.使用 Dropout 防止过拟合

在两个全连接层之间添加 Dropout(随机丢弃部分神经元)。

4.数据增强

包括图像翻转、裁剪、颜色扰动等,有效扩大训练集、防止过拟合。

5.LRN 局部响应归一化

用于增强激活的竞争机制,虽然在后来的网络(如 VGG、ResNet)中被弃用。

6.重叠池化

池化窗口之间存在重叠(如池化核 3×3,步幅 2),有助于减小信息损失。

AlexNet 与 LeNet 对比

特性LeNet-5AlexNet
提出时间19982012
输入尺寸32×32×1224×224×3
激活函数Sigmoid / tanhReLU
网络层数58
使用GPU
Dropout
数据增强

3X3卷积和2X2卷积的主要区别

特性3×3 卷积核2×2 卷积核
感受野(感知范围)覆盖 9 个像素覆盖 4 个像素
参数数量(单通道)9 个参数4 个参数
特征提取能力更强,能提取更复杂的边缘和纹理稍弱,适合较简单的特征
适用性应用于大多数主流网络结构很少用于主干卷积层
信息融合能力更强,覆盖区域大,提取更充分较弱,感受区域小
卷积后输出尺寸变化更容易对称(保持形状)更容易造成输出尺寸减半
是否常用于堆叠是(如 VGG 中大量堆叠)否(多用于特殊场景)

3×3 卷积是主流标准,信息提取强大;2×2 卷积偶尔作为轻量化或结构替代手段出现,但功能更弱。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/916750.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/916750.shtml
英文地址,请注明出处:http://en.pswp.cn/news/916750.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

枚举中间位置高级篇

参考资料来源灵神在力扣所发的题单,仅供分享学习笔记和记录,无商业用途。 核心思路:参考枚举中间位置基础篇-CSDN博客 力扣题单练习(灵神题单中摘取题目) 447. 回旋镖的数量 核心思路: 因给出的点都不相同,所以不会…

主数据管理系统能代替数据中台吗?

目录 一、主数据管理系统≠数据中台 1. 主数据管理系统:管的是 “不变的核心数据” 2. 数据中台:管的是 “流动中的价值” 二、为什么企业更该先建 MDM? 1. 数据中台解决不了数据本身问题 2. MDM 可以解决常见的基础问题 3. 数字化转型…

Nmap 终极教程:安装、常用命令及法律法规指南

Nmap 终极教程:安装、常用命令及法律法规指南 Nmap(Network Mapper)是一款强大的 网络扫描和安全审计工具,广泛用于渗透测试、网络探测和系统管理。本教程涵盖 安装方法、常用命令详解、输出解析 以及 法律法规注意事项&#xff…

开源嵌入式数组引擎TileDB的简单使用

TileDB 是C编写的存储和访问通用多维数组引擎,它的官方Github网站https://github.1git.de/TileDB-Inc/TileDB 1.下载源代码和二进制库 源代码https://github.1git.de/TileDB-Inc/TileDB/archive/refs/tags/2.28.1.tar.gz 选择符合你的机器CPU架构和操作系统的库 二进…

AI对服务器行业的冲击与启示:从挑战走向重构

更多云服务器知识,尽在hostol.comAI(人工智能)技术的迅猛发展,已深刻影响了多个行业,服务器行业亦不例外。在过去,服务器的主要任务是简单地提供存储、计算和传输数据的服务。然而,随着AI的崛起…

基于三台主机搭建 Web 服务环境:Nginx、NFS 与 DNS 配置全流程

基于三台主机搭建 Web 服务环境:Nginx、NFS 与 DNS 配置全流程 一、引言 在当今数字化的时代,搭建一个稳定、高效的 Web 服务环境是许多开发者和运维人员的常见需求。本文将详细介绍如何利用三台主机搭建一个包含 Nginx、NFS 和 DNS 服务的 Web 环境&…

MySQL——MVCC

1.为什么需要MVCC在并发场景下,读写操作会面临严重的冲突问题:1.读操作如果遇到写操作,要么“读到未提交的脏数据”,要么“被写操作阻塞(等待锁释放)”;2.写操作如果遇到读操作,要么…

数据结构第2问:什么是算法?

算法 算法是一组用于解决具体问题的、明确的、有序的步骤或规则,能够在有限的时间内通过这些步骤得到问题的答案。 算法的5个重要特性: 有穷性:算法必须在有限的步骤内结束,不能无限循环,保证最终能够得到结果。确定性…

12-大语言模型—Transformer 打地基,下游任务盖出百样房,指标来验收|下游任务白话指南

目录 1、核心逻辑:Transformer 的 “语言处理闭环” 2、转导与感知 → 模型咋 “理解语言”? 2.1、 人类 vs 机器的 “语言理解逻辑” 2.2、 自注意力机制:模型 “理解语言” 的数学核心 2.2.1、通俗拆解 2.2.1.1、是什么? …

深入探索爬虫与自动化脚本:释放效率的利器

在当今信息爆炸的时代,高效获取和处理数据已成为核心竞争力。爬虫与自动化脚本正是解决这一痛点的关键技术——它们如同数字世界的勤劳助手,帮我们自动完成繁琐重复的任务。下面我们来系统了解这两项技术的核心要点、应用场景和最佳实践。一、爬虫与自动…

React函数组件的“生活管家“——useEffect Hook详解

🎯 React函数组件的"生活管家"——useEffect Hook详解 1. 🌟 开篇:从生活中的"副作用"说起 嘿,各位掘友们!今天咱们来聊聊React函数组件里的一个“大管家”——useEffect Hook。你可能会问&#x…

python基础:request请求Cookie保持登录状态、重定向与历史请求、SSL证书校验、超时和重试失败、自动生成request请求代码和案例实践

Cookie保持登录状态cookie session鉴权机制 cookie是由web服务器保存在用户浏览器(客户端)上的小文本文件,他可以包含有关用户的信息。无论何时用户访问到服务器,都会带上该服务器的cookie信息,一般cookie都是有有效期…

Vulkan入门教程 | 第二部分:创建实例

前言:本教程为笔者依据教程https://docs.vulkan.net.cn/spec/latest/index.html#_about进行Vulkan学习并结合自己的理解整理的笔记,供大家学习和参考。 (注意:代码仅为片段,非完整程序) 学习前提&#xff1…

PHP云原生架构:容器化、Kubernetes与Serverless实践

引言 随着云计算的普及,PHP应用也在向云原生架构演进。本文将深入探讨PHP在云原生环境中的最佳实践,包括容器化部署、Kubernetes编排、Serverless架构以及云原生监控与日志方案,帮助开发者构建现代化、可扩展的PHP应用。 容器化PHP应用 基础Dockerfile优化 # 多阶段构建…

【华为机试】5. 最长回文子串

文章目录5. 最长回文子串描述示例 1示例 2示例 3示例 4提示解题思路方法一:中心扩展法(推荐)方法二:动态规划方法三:Manacher算法方法四:暴力解法代码实现复杂度分析测试用例完整题解代码5. 最长回文子串 …

【图像处理基石】如何对遥感图像进行实例分割?

遥感图像实例分割是指在遥感影像中,不仅要识别出不同类别的目标(如建筑物、车辆、道路等),还要区分同一类别中的不同个体(如建筑物1、建筑物2),并为每个实例生成精确的像素级掩码。 一、遥感图…

电子电气架构 --- 软件bug的管理模式

我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 简单,单纯,喜欢独处,独来独往,不易合同频过着接地气的生活,除了生存温饱问题之外,没有什么过多的欲望,表面看起来很高冷,内心热情,如果你身…

【每日一错】Oracle 19c CDB中如何启动一个PDB

文章目录题目扩展学习CDB与PDB的概念CDB,PDB结构优势总结题目 扩展学习 CDB与PDB的概念 在Oracle 12c及以上版本,Oracle引入了多租户架构,这种架构让数据库的管理和资源使用更加高效。它由两种主要组成部分组成: CDB&#xff0…

Android studio自带的Android模拟器都是x86架构的吗,需要把arm架构的app翻译成x86指令?

Android studio自带的Android模拟器都是x86架构的吗,需要把arm架构的app翻译成x86指令? deepseek回答: Android Studio 自带的官方模拟器(Android Emulator)主要提供基于 x86 架构的系统镜像。当运行 ARM 架构的应用…

Deep Learning_ Foundations and Concepts-Springer (2024)【拜读】20章3节

Diffusion Models 扩散模型 我们已经了解到,构建强大的生成模型的一种有效方法是:先引入一个关于潜在变量z的分布p(z),然后使用深度神经网络将z变换到数据空间x。由于神经网络具有通用性,能够将简单固定的分布转化为关于x的高度灵…