面临的问题

        定义神经⽹络后,我们回到⼿写识别上来。我们可以把识别⼿写数字问题分成两个⼦问题:

  • 把包含许多数字的图像分成⼀系列单独的图像,每个包含单个数字;

        也就是把图像 ,分成6个单独的图像

  • 分类单独的数字

        我们将专注于编程解决第⼆个问题,分类单独的数字。这样是因为,⼀旦你有分类单独数字 的有效⽅法,分割问题是不难解决的。

  • ⼀种⽅法是尝试不同 的分割⽅式,⽤数字分类器对每⼀个切分⽚段打分;
    • 如果数字分类器对每⼀个⽚段的置信度都 ⽐较⾼,那么这个分割⽅式就能得到较⾼的分数;
    • 如果数字分类器在⼀或多个⽚段中出现问题, 那么这种分割⽅式就会得到较低的分数
    • 这种⽅法的思想是,如果分类器有问题,那么很可能是 由于图像分割出错导致的。
    • 这种思想以及它的变化形式能够⽐较好地解决分割问题。

数字的分类

我们使用一个三层神经网络来识别单个数字;

                

⽹络的输⼊层包含给输⼊像素的值进⾏编码的神经元。

  • 我们给⽹络的 训练数据会有很多扫描得到的28x28的⼿写数字的图像组成;
  • 所有输入层包含784 = 28 x 28个神经元;
  • 输⼊像素是灰度级的, 值为0.0表⽰⽩⾊,值为1.0表⽰⿊⾊,中间数值表⽰逐渐暗淡的灰⾊。

⽹络的第⼆层是⼀个隐藏层;

  • 我们⽤n来表⽰神经元的数量,我们将给实验不同的数值。

⽹络的输出层包含有个神经元;

  • 如果第⼀个神经元激活,即输出≈1,那么表明⽹络认为 数字是⼀个0。
  • 如果第⼆个神经元激活,就表明⽹络认为数字是⼀个1。
  • 依此类推。
  • 更确切地说, 我们把输出神经元的输出赋予编号0到9,并计算出那个神经元有最⾼的激活值;

为什么需要10个输出神经元?

        ⼀个看起来更⾃然的⽅式就是使⽤5个输出神经元, 把每⼀个当做⼀个⼆进制值,结果取决于它的输出更靠近0还是1。

        为什么我们反⽽要⽤个神经元呢?这样做难道 效率不低吗?最终的判断是基于经验主义的:我们可以实验两种不同的⽹络设计,结果证明对于这个特定的问题⽽⾔,10个输出神经元的神经⽹络⽐4个的识别效果更好.

        为了理解为什么我们这么做,我们需要从根本原理上理解神经⽹络究竟在做些什么;

  • 我们⾸先考虑第⼀个输出神经元,它告诉我们⼀个数字是不是0。它能那么做是因为可以权衡从隐藏层来的信息。
  • 隐藏层的神经元在做什么呢?假设隐藏层的第⼀个神经元只是⽤于检测如下图像是否存在
  • 为了达到这个⽬的,它通过对此图像对应部分的像素赋予较⼤权重,对其它部分赋予较⼩的 权重
  • 同理,我们可以假设隐藏层的第⼆,第三,第四个神经元是为检测下列图⽚是否存在

        

  • 就像你能猜到的,这四幅图像组合在⼀起构成了前⾯显⽰的⼀⾏数字图像中的0:
  • 如果所有隐藏层的这四个神经元被激活那么我们就可以推断出这个数字是0。 

        假设神经⽹络以上述⽅式运⾏,我们可以给出⼀个貌似合理的理由去解释为什么⽤10个输出⽽不是4个。如果我们有4个输出,那么第⼀个输出神经元将会尽⼒去判断数字的最⾼有效 位是什么。把数字的最⾼有效位和数字的形状联系起来并不是⼀个简单的问题。很难想象出有 什么恰当的历史原因,⼀个数字的形状要素会和⼀个数字的最⾼有效位有什么紧密联系。

启发性

        上⾯我们说的只是⼀个启发性的⽅法。没有什么理由表明这个三层的神经⽹络必须按照我所 描述的⽅式运⾏,即隐藏层是⽤来探测数字的组成形状。可能⼀个聪明的学习算法将会找到⼀ 些合适的权重能让我们仅仅⽤4个输出神经元就⾏。但是这个启发性的⽅法通常很有效,它会 节省你⼤量时间去设计⼀个好的神经⽹络结构

                

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/89385.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/89385.shtml
英文地址,请注明出处:http://en.pswp.cn/diannao/89385.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

nginx基本使用 linux(mac下的)

目录结构 编译后会有:conf html logs sbin 四个文件 (其他两个是之前下载的安装包) conf:配置文件html:页面资源logs:日志sbin:启动文件,nginx主程序 运行后多了文件:&l…

基于大众点评的重庆火锅在线评论数据挖掘分析(情感分析、主题分析、EDA探索性数据分析)

文章目录 有需要本项目的代码或文档以及全部资源,或者部署调试可以私信博主项目介绍数据采集数据预处理EDA探索性数据分析关键词提取算法情感分析LDA主题分析总结每文一语 有需要本项目的代码或文档以及全部资源,或者部署调试可以私信博主 项目介绍 本…

鸿蒙系统(HarmonyOS)应用开发之经典蓝色风格登录页布局、图文验证码

一、项目概述 本项目是一款基于鸿蒙 ArkTS(ETS)开发的用户登录页面,集成了图文验证码功能,旨在为应用提供安全、便捷的用户身份验证入口。项目采用现代化 UI 设计,兼顾用户体验与安全性,适用于多种需要用户…

0.96寸OLED显示屏 江协科技学习笔记(36个知识点)

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 32 33 34 35 36

Flutter SnackBar 控件详细介绍

文章目录 Flutter SnackBar 控件详细介绍基本特性基本用法1. 显示简单 SnackBar2. 自定义持续时间 主要属性高级用法1. 带操作的 SnackBar2. 自定义样式3. 浮动式 SnackBar SnackBarAction 属性实际应用场景注意事项完整示例建议 Flutter SnackBar 控件详细介绍 SnackBar 是 F…

【C++】头文件的能力与禁忌

在C中,​头文件(.h/.hpp)​​ 的主要作用是声明接口和共享代码,但如果不规范使用,会导致编译或链接错误。以下是详细总结: 一、头文件中可以做的事情 1.1 声明 函数声明(无需inline&#xff…

腾讯 iOA 零信任产品:安全远程访问的革新者

在当今数字化时代,企业面临着前所未有的挑战与机遇。随着远程办公、多分支运营以及云计算的广泛应用,传统的网络安全架构逐渐暴露出诸多不足。腾讯 iOA 零信任产品凭借其创新的安全理念和强大的功能特性,为企业提供了一种全新的解决方案&…

IP5219全集成Type-C移动电源SOC!2.1A快充+2.4A放电,极简BOM方案

产品概述: IP5219是一款集成升压转换器、锂电池充电管 理、电池电量指示和TYPE_C协议的多功能电源管 理SOC,为移动电源提供完整的电源解决方案。 IP5219的高集成度与丰富功能,使其在应用时 仅需极少的外围器件,并有效减小整体方案…

报道称CoreWeave洽谈收购Core Scientific,后者涨超30%

CoreWeave与数字基础设施公司Core Scientific的收购事宜可能在未来几周内敲定交易,前提是双方不出现重大分歧。消息传出后,Core Scientific股价一度暂停交易,随后恢复交易最终收涨逾32%。 AI云服务巨头CoreWeave正与数字基础设施公司Core Sc…

Qt5.15.2实现WebAssembly:2、设置emsdk目录

步骤1 打开QT,编辑,Preference(首选项): 设备,WebAssembly,游览。 找到安装好的emscripten目录,选择。 稍等一会,QT会解析出相应的信息,再点确定。 图中…

SpringMVC--使用RESTFul实现用户管理系统

一、静态页面准备 1. user.css .header {background-color: #f2f2f2;padding: 20px;text-align: center; }ul {list-style-type: none;margin: 0;padding: 0;overflow: hidden;background-color: #333; }li {float: left; }li a {display: block;color: white;text-align: ce…

hello算法_C++_ 最差、最佳、平均时间复杂度

算法的时间效率往往不是固定的,而是与输入数据的分布有关。假设输入一个长度为 的数组 nums ,其中 nums 由从 1 至 n 的数字组成,每个数字只出现一次;但元素顺序是随机打乱的,任务目标是返回元素 的索引。我们可以…

2024考研数一真题及答案

历年数一真题及答案下载直通车 已知函数 f ( x ) ∫ 0 x e cos ⁡ t d t f(x) \int_0^x e^{\cos t} dt f(x)∫0x​ecostdt, g ( x ) ∫ 0 sin ⁡ x e t 2 d t g(x) \int_0^{\sin x} e^{t^2} dt g(x)∫0sinx​et2dt,则( )。 A…

MIT 6.824学习心得(2) 浅谈多线程和RPC

上篇文章中我们简单介绍了分布式系统的设计思想以及简单性质,之后用一定篇幅简要介绍了MapReduce这个经典的分布式计算框架的大致工作原理,相信朋友们已经对此有了最基本的理解。在现实场景中,分布式系统的设计初衷是为了解决并发问题&#x…

opensuse/debian grub启动界面太模糊?

现代操作系统或者新电脑使用那么模糊的界面启动,虽然没有什么不良反应,但是多少有点看不过去,这是因为为了保证正常启动做出的适配。而我们可以对其分辨率进行选定。 1 您好,非常感谢您提供的截图。这张图片非常关键&#xff0c…

zookeeper Curator(5):集群架构和集群搭建

文章目录 一、集群架构:Leader-Follower 模式二、核心机制:ZAB 协议三、Leader 选举机制四、集群部署要点五、优势与挑战 Zookeeper 集群是一个由多个 Zookeeper 服务实例组成的分布式协调服务系统, 通过奇数个节点(通常 3、5、7…

道可云人工智能每日资讯|浦东启动人工智能创新应用竞赛

道可云人工智能&元宇宙每日简报(2025年7月1日)讯,今日人工智能&元宇宙新鲜事有: 江城模境工信部人工智能大模型公共服务平台(武汉)上线运行 2025年6月27日,光谷人工智能创新大会在湖北…

Python元组的遍历

一、前言 在 Python 中,元组(tuple) 是一种非常基础且常用的数据结构,它与列表类似,都是有序的序列,但不同的是,元组是不可变的(immutable),一旦创建就不能修…

矩阵的条件数(Condition Number of a Matrix)

文章目录 矩阵的条件数(Condition Number of a Matrix)📌 定义🧮 常见形式:2-范数下的条件数🔍 条件数的意义🧠 实际意义举例💻 Python 示例(NumPy)&#x1f…

1 Studying《Computer Architecture A Quantitative Approach》1-4

目录 Preface 1 Fundamentals of Quantitative Design and Analysis 1.1 Introduction 1.2 Classes of Computers 1.3 Defining Computer Architecture 1.4 Trends in Technology 1.5 Trends in Power and Energy in Integrated Circuits 1.6 Trends in Cost 1.7 Depe…