Perceptron Modeling 感知器建模

  • Linear Discriminants 线性判别式
  • Loss Function 损失函数
    • misclassification 误分类
    • 0-1 Loss/Error function 0-1损失函数
    • Hinge Loss Function 铰链损失函数
  • Optimization 优化
    • 算法

Linear Discriminants 线性判别式

线性判别式公式
f(x;w)=w1x(1)+w2x(2)+⋯+wdx(d)+b=0f(\mathbf{x};\mathbf{w}) = w_1 x^{(1)} + w_2 x^{(2)} + \cdots + w_d x^{(d)} + b = 0 f(x;w)=w1x(1)+w2x(2)++wdx(d)+b=0

两种表示方法
在这里插入图片描述
在这里插入图片描述
w′w'w是更加数学化的公式

我们所要做的,就是求wwwbbb,获得线性判别式。

Loss Function 损失函数

在这里插入图片描述

misclassification 误分类

误分类是一种错误
如果一个训练样本的标签为𝑦 = +1,那么它的判别函数得分f(x)f(x)f(x)应该 > 0
如果一个训练样本的标签为𝑦 = −1,那么它的判别函数得分f(x)f(x)f(x)应该 < 0
因此,当出现 yf(x)<0yf(x)<0yf(x)<0,说明分类错误。

0-1 Loss/Error function 0-1损失函数

l(f(x),y)={0,yf(x)>01,yf(x)≤0l(f(x),y) = \begin{cases} 0, & y f(x) > 0 \\ 1, & y f(x) \le 0 \end{cases} l(f(x),y)={0,1,yf(x)>0yf(x)0
在这里插入图片描述

The whole error整体误差:用于判断全部examples
∑i=1Nl(f(xi),yi)\sum_{i=1}^N l\big(f(x_i), y_i\big) i=1Nl(f(xi),yi)

0-1损失函数有两个问题:

  • 显而易见,这是一个阶跃函数,在0点具有不连续性,没有很好的定义可以求导;
  • 它不是凸的,这意味着当我们试图用梯度下降算法最小化整体损失,它是无法给出这个特定损失函数的最优解

所以我们建议做的或者最初的创造者,或者现在所谓的感知器所做的是,他们想出了这个零一损失函数的凸近似值——the hinge loss 铰链损失函数

Hinge Loss Function 铰链损失函数

Hinge Loss Function is a convex over-approximation of the 0-1 loss. 铰链损失函数是 0-1 损失函数的凸过度近似。

在这里插入图片描述
l(f(x),y)={0,yf(x)>11−yf(x),yf(x)≤1={0,1−yf(x)<01−yf(x),1−yf(x)≥0l(f(x),y)= \begin{cases} 0,& y f(x)>1\\ 1-y f(x),& y f(x)\le 1 \end{cases} \quad=\quad \begin{cases} 0,& 1-y f(x)<0\\ 1-y f(x),& 1-y f(x)\ge 0 \end{cases} l(f(x),y)={0,1yf(x),yf(x)>1yf(x)1={0,1yf(x),1yf(x)<01yf(x)0

OR
l(f(x),y)=max⁡(0,1−yf(x))l(f(x), y) = \max(0,\, 1 - y f(x)) l(f(x),y)=max(0,1yf(x))

简单的理解
在这里插入图片描述

l(z)={0,z>11−z,z≤1\boldsymbol{ l(z) = \begin{cases} 0, & z > 1 \\ 1 - z, & z \le 1 \end{cases} } l(z)={0,1z,z>1z1
我们所做的就是构建0-1损失函数的凸近似函数,它是凸的,我们也可以对它进行微分(求导)。

Optimization 优化

在这里插入图片描述
min⁡wL(X,Y;w)=∑i=1Nmax⁡{0,1−yif(xi;w)}\min_{\mathbf{w}} \; L(\mathbf{X}, \mathbf{Y}; \mathbf{w}) = \sum_{i=1}^{N} \max\{0,\, 1 - y_i f(x_i; \mathbf{w})\} wminL(X,Y;w)=i=1Nmax{0,1yif(xi;w)}

在这个具体实例中,将4个节点代入模型公式 f(x;w)=w1x(1)+w2x(2)+b=0f(\mathbf{x};\mathbf{w}) = w_1 x^{(1)} + w_2 x^{(2)} + b = 0f(x;w)=w1x(1)+w2x(2)+b=0。我们已知道他们的标签 yiy_iyi,由此得到每个节点的损失函数值 max⁡{0,1−yif(xi;w)}\max\{0,\, 1 - y_i f(x_i;\mathbf{w})\}max{0,1yif(xi;w)}。整个数据集,总体损失是 ∑i=14max⁡{0,1−yif(xi;w)}\sum_{i=1}^{4} \max\{0,\, 1 - y_i f(x_i; \mathbf{w})\}i=14max{0,1yif(xi;w)}
由此,我们采用梯度下降算法来求最小损失函数,这就是我们面对的优化问题。

所有的机器学习都可以表示为优化问题,一旦我们有了机器学习问题的表示方式(模型),我们表示了特征features,我们表示了判别式disccriminant,并且量化定义了什么是误差。我们开始使用0-1损失函数,但因为它不可微,使用这个数据会导致复杂的后续处理过程。因此我们简化了它,或者说以此为目的构建了一个复杂的铰链损失过度近似。然后下一步,我们将以优化问题的形式进行问题训练。这是整个机器学习和数据挖掘的一致主题。

现在我们将使用梯度下降算法进行优化。使用这个算法所求的便是这个模型,参数为向量www

在这里插入图片描述

在这里插入图片描述
这里是有点难以理解的,这个图的损失函数,分界点在x=1x=1x=1,不是0点。虽然实际上 yf(x)=[0,1]yf(x)=[0,1]yf(x)=[0,1]是正确分类了,本应该没有损失值的,但这是近似损失函数,不是完全符合实际的,所以我们会计算它的损失值。所以当 yf(x)<1yf(x)<1yf(x)<1 时候,我们会假定视为这是分类错误了。

算法

已知: 训练样本:{(xi,yi)∣i=1…N},yi∈{−1,+1}\{(x_i, y_i) \mid i = 1 \dots N\}, \quad y_i \in \{-1, +1\}{(xi,yi)i=1N},yi{1,+1}
随机初始化 w(0)w^{(0)}w(0)
循环直到收敛(Until Convergence)

  • 对于 i=1…Ni = 1 \dots Ni=1N
    • 选择样本 xix_ixi,其标签为 yiy_iyi
    • 计算
      f(xi)=w(k)Tx+bf(x_i) = \mathbf{w}^{(k)T} \mathbf{x} + b f(xi)=w(k)Tx+b
    • 如果 yif(xi)<1y_i f(x_i) < 1yif(xi)<1,则使用梯度下降更新权重向量:
      w(k)=w(k−1)−α∇l(w(k))=w(k−1)−α(−yixi)=w(k−1)+αyixi\mathbf{w}^{(k)} = \mathbf{w}^{(k-1)} - \alpha \nabla l(\mathbf{w}^{(k)}) = \mathbf{w}^{(k-1)} - \alpha (-y_i x_i) = \mathbf{w}^{(k-1)} + \alpha y_i x_i w(k)=w(k1)αl(w(k))=w(k1)α(yixi)=w(k1)+αyixi

如果循环收敛一直是0,说明这是被完全分类正确的模型。
这个算法是在20世纪60年代开发1960s,是最早的神经网络之一,被称为perceptron 感知器

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/92375.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/92375.shtml
英文地址,请注明出处:http://en.pswp.cn/pingmian/92375.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用qemu运行与GDB调试内核

目录 一、前期准备 二、内核编译 三、QEMU与GDB 1、QEMU调试参数 2、gdb vmlinux 一、前期准备 内核镜像&#xff1a;bzimage gdb&#xff1a;x86_64 QEMU&#xff1a;qemu-system-x86_64 前置知识&#xff1a; &#xff08;1&#xff09;内核编译 &#xff08;2&#x…

欧盟 Radio Equipment Directive (RED)

欧盟 Radio Equipment Directive (RED) ——从 2014/53/EU 原文到 2025-08-01 强制生效的网络安全新规&#xff0c;一次看懂全部关键点。1. 法规身份与适用范围要素内容指令全称Directive 2014/53/EU on radio equipment取代指令1999/5/EC (R&TTE)适用产品所有“有意发射/接…

【FastExcel】解决ReadSheet在Map中获取对象不准确问题(已提交PR并合并到开源社区)

解决问题&#xff1a;源码ReadSheet在同一个Map中获取对象不准确问题 PR&#xff1a;Fixed the issue where different ReadSheet objects could not get the correct value when comparing them. 一&#xff1a;问题场景 ReadSheet在同一个Map中获取对象不准确(如Map<…

【网络安全入门基础教程】TCP/IP协议深入解析(非常详细)零基础入门到精通,收藏这一篇就够了

前言 这是小编给粉丝盆友们整理的网络安全入门到精通系列第三章计算机网络中TCP/IP协议的解析&#xff0c;喜欢的朋友们&#xff0c;记得给大白点赞支持和收藏一下&#xff0c;关注我&#xff0c;学习黑客技术。TCP/IP协议包含了一系列的协议&#xff0c;也叫TCP/IP协议族&…

Latex中公式部分输入正体的字母\mathrm{c}

Latex中公式部分输入正体的字母\mathrm{c}“\mathrm{c}”如何在Word中输入\mathrm{c}“\mathrm{c}” 在 LaTeX 中&#xff0c;“\mathrm{c}” 用于在数学模式中排版“c”这个字母为罗马体&#xff08;正体&#xff09;。“\mathrm” 是罗马字体命令&#xff0c;它告诉LaTeX以罗…

Document Picture-in-Picture API拥抱全新浮窗体验[参考:window.open]

在前端开发中&#xff0c;我们经常会遇到这样的需求&#xff1a;弹出一个浮动窗口来显示一些实时信息、工具栏或视频内容。过去我们会用 window.open()&#xff0c;后来越来越多的开发者倾向于使用 Modal。但现在&#xff0c;一个更现代的 API 出现了——Document Picture-in-P…

【指南版】网络与信息安全岗位系列(三):安全运维工程师

一、安全运维工程师到底做什么&#xff1f;—— 用校园场景帮你理解简单说&#xff0c;安全运维工程师就像 “网络世界的安保队长 系统管家”&#xff1a;既要实时监控网络和系统的 “异常动静”&#xff08;类似学校保安巡逻查隐患&#xff09;&#xff0c;又要负责日常的安全…

matlab——simulink学习(5向NXP库中添加新模块)

向NXP库中添加新的函数模块一、环境二、库添加模块1.打开文件夹2.创建文件3.添加S-Function三、浏览器添加模块一、环境 Windows10、MATLAB R2022b、安装NXP的S32K1XX系列工具包 二、库添加模块 1.打开文件夹 在文件系统中找到安装工具包的位置&#xff0c;用文件资源管理器…

使用ProxySql实现MySQL的读写分离

ProxySQL简介1、ProxySQL是一款开源的使用C编写的MySQL集群代理中间件&#xff1b;2、用于在MySQL数据库和客户端之间进行负载均衡、查询缓存、故障转移和查询分发&#xff1b;3、它可以作为中间层插入到应用程序和数据库之间&#xff1b;4、特点是高效灵活&#xff0c;使用简单…

WiFi 核心概念与实战用例全解

&#x1f4d6; 推荐阅读&#xff1a;《Yocto项目实战教程:高效定制嵌入式Linux系统》 &#x1f3a5; 更多学习视频请关注 B 站&#xff1a;嵌入式Jerry 1. WiFi基础与协议 WiFi&#xff08;Wireless Fidelity&#xff09;是基于IEEE 802.11协议族的无线局域网&#xff08;WLAN…

面向远程智能终端的超低延迟RTSP|RTMP视频SDK架构与实践指南

引言&#xff1a;遥操作时代&#xff0c;视觉链路已成“主控神经元” 从工业巡检到应急救援&#xff0c;从城市安防到边境监控&#xff0c;远程操控正成为智能终端与人机协同的重要落点。而在这些场景中&#xff0c;“视觉”不再只是用来观看的工具&#xff0c;而是贯穿感知、…

C++中的继承:从基础到复杂

目录 前言 1. 继承的基本概念 2. 继承方式与访问控制 3. 派生类与基类的对象转换 4. 继承中的作用域 5. 派生类的默认成员函数 6. 继承中的特殊关系 6.1 继承与友元 6.2 继承与静态成员 7. 复杂的菱形继承问题 8. 继承与组合的选择 9. 常见面试题 总结 前言 继承…

Eyevinn 彻底改变开源部署模式

该咨询公司借助Akamai云平台&#xff0c;为其创新的开源平台和可持续收益分成模式提供强大支持。 "时间就是金钱&#xff0c;我们通过Akamai云平台快速将开源云平台投入生产。" ——Eyevinn Technology研发副总裁 Jonas Birm实现可持续视频流媒体服务 自2013年以来&…

17day-人工智能-机器学习-分类算法-KNN

1. 什么是knn算法knn算法全名叫做k-近邻算法&#xff08;K-Nearest Neighbors&#xff0c;简称KNN&#xff09;&#xff0c;看到名字是不是能想到是算距离的&#xff0c;第一个k是指超参数的意思&#xff0c;就是可以认为设置的意思&#xff0c;这里是指最近的k个样本。2. 为什…

12-netty基础-手写rpc-编解码-04

netty系列文章&#xff1a; 01-netty基础-socket02-netty基础-java四种IO模型03-netty基础-多路复用select、poll、epoll04-netty基础-Reactor三种模型05-netty基础-ByteBuf数据结构06-netty基础-编码解码07-netty基础-自定义编解码器08-netty基础-自定义序列化和反序列化09-n…

解决 Windows 下的“幽灵文件”——记一次与带空格的 .gitignore 文件的艰难斗争

引言 你是否遇到过这样的情况&#xff1a;一个文件明明躺在你的文件夹里&#xff0c;ls 或 dir 命令都能清楚地看到它&#xff0c;但无论你用什么方法尝试删除&#xff0c;系统都冷酷地告诉你“找不到文件”&#xff1f; 就在今天&#xff0c;我就遇到了这样一个“幽灵”般的 .…

(易视宝)易视TV is-E4-G-全志A20芯片-安卓4-烧写卡刷工具及教程

&#xff08;易视宝&#xff09;易视TV is-E4-G-全志A20芯片-安卓4-烧写卡刷工具及教程PhoenixCard_V309烧录步骤&#xff1a;1、将TF或SD卡插入计算机&#xff0c;打开软件&#xff1b;2、选择固件所在目录&#xff1b;3、烧写模式选“卡量产”4、点击“烧录”开始量产&#x…

(数据结构)顺序表实现-增删查改

1.线性表 线性表(linear list)是n个具有相同特性的数据元素的有限序列。线性表是一种在实际中广泛使用的数据结构,常见的线性表:顺序表、链表、栈、队列、字符串… 线性表在逻辑上是线性结构,也就说是连续的一条直线。但是在物理结构上并不一定是连续的,线性表在物理上存储时…

【面试八股总结】线程/进程同步问题

一、同步与互斥 在线程并发执行的过程中&#xff0c;进程/线程之间存在协作的关系&#xff0c;例如有互斥、同步的关系。为了实现进程/线程间正确的协作&#xff0c;操作系统必须提供实现进程协作的措施和方法&#xff0c;主要的方法有两种&#xff1a; 锁&#xff1a;加锁、解…