• AI 核心任务与数据类型
    • 特征提取核心:AI 的核心是从原始输入数据中提取特征,CV 是将图像数据转换为计算机可识别的特征,NLP 是将文本数据转换为特征,数据挖掘是将结构化数据转换为特征。
    • 数据类型特点:图像数据在计算机眼中是矩阵,每个值是像素点,可直接计算;文本数据如字符串,较难直接处理成矩阵。
  • 神经网络基础概念
    • 映射概念:映射可看作 y = wx + b 的方程,w 和 b 组成映射方程。通过权重参数对输入数据进行组合变换,将原始数据投影到特征空间,得到新特征,目的是让数据更好被认识和识别。
    • 输入与权重矩阵:以图像数据为例,输入数据可拉成向量,如 32×32×3 的图像有 3072 个像素点。权重参数与特征一一对应,做矩阵乘法,横向量乘列向量得一个值,在分类任务中,该值代表数据属于各个类别的概率。
    • 偏置参数:偏置用于对结果做微调,偏置个数与输出结果个数相同,如 10 分类任务就有 10 个偏置。
    • 权重初始化:权重一开始是随机初始化的,后续根据预测结果与真实标签的一致性进行更新。
  • 损失计算方法
    • 回归任务损失:回归任务预测一个值,通过计算预测值与真实值的差异来衡量损失,如计算错误类别和真实类别得分的差值,差值越大损失越大。
    • 分类任务损失:分类任务要得到数据属于各个类别的概率,二分类使用 ZMOD 函数将输入值映射到 0 - 1 之间,大于 0.5 为正例,小于 0.5 为负例;多分类通过 Softmax 函数,先将得分值进行 e 的幂运算放大差异,再进行归一化得到概率值,最后用对数计算损失,只考虑正确类别的概率,概率越高损失越小。
  • 权重更新方法
    • 梯度下降原理:神经网络由前向传播和反向传播组成。前向传播通过输入数据和权重参数得到预测值,计算损失;反向传播通过求梯度找到权重更新方向,梯度是损失对权重参数的偏导数,沿梯度反方向更新权重可使损失变小。
    • 学习率:学习率控制每次更新的步长,一般较小且适中,学习率有 warm up 阶段,先缓慢上升到基础学习率,再进行衰减。
    • 批量处理:有随机梯度下降、批量梯度下降和小批量梯度下降。随机梯度下降用一个样本更新,速度快但结果可能不稳定;批量梯度下降用所有样本求平均,结果稳定但计算量大;小批量梯度下降用一批样本,batch 越大越好,可使求平均更准确。
    • 动量概念:引入动量(惯性),考虑前一步的梯度方向,通过求合力方向更新权重,可使模型更新更快,多数模型都会引入。
  • 网络结构与特征提取
    • 特征提取本质:神经网络通过权重参数对输入数据进行线性组合,将原始数据转换为新特征,权重参数越多,可得到的特征个数越多。
    • 深度学习不可解释性:深度学习得到的特征难以解释其具体含义。
    • 网络结构示例:输入数据通过多组权重和偏置参数得到中间特征和最终预测结果,如输入 1×3 矩阵,通过 3×4 矩阵的 W1 和 4 个偏置 B1 得到 1×4 的中间特征,再经过 4×4 矩阵的 W2 和 4 个偏置 B2,最后通过 4×1 矩阵的 W3 和 1 个偏置 B3 得到预测值。
  • 网络效果与优化
    • 神经元个数影响:神经元个数越多,可切分数据集的 “刀数” 越多,能更好地对数据进行分类,但可能出现过拟合问题。
    • 过拟合问题:模型为了识别离群点开辟过大区域,导致测试时预测错误,数据预处理很重要,数据质量和数量都会影响模型效果。
    • 非线性变换:神经网络的线性变换只能解决线性问题,通过引入激活函数(如 SoftReLU)进行非线性变换,可使模型解决非线性问题。SoftReLU 函数小于 0 时 y = 0,大于 0 时 y = x,能去除不好的特征。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/91309.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/91309.shtml
英文地址,请注明出处:http://en.pswp.cn/web/91309.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

kotlin类型可为空,进行空安全的区别

定义一个可为空的变量b(String?),默认没有?是不可以为空的 var b: String? "Kotlin" b null print(b) // 输出 null默认不可为空 var a: String "Kotlin" a null // 编译器报错,null 不能被赋给不为空的变量空安全调用&#x…

Mysql事务基础

事务是一个不可分割的数据库操作序列,也是数据库并发控制的基本单位,其执行的结果必须使数据库从一种一致性状态变到另一种一致性状态。事务是逻辑上的一组操作,要么都执行,要么都不执行 事务的特点 A(Atomicity&#…

FastAPI入门:安装、Pydantic、并发和并行

本系列参考FastAPI官方文档:https://fastapi.tiangolo.com/zh/python-types/安装 使用pip安装: pip install fastapi此外还需要 ASGI 服务器,生产环境可以使用 Uvicorn 或者 Hypercorn。 ASGI服务器:异步服务网关接口,…

欢乐的周末 - 华为OD统一考试(JavaScript 题解)

题目描述 小华和小为是很要好的朋友,他们约定周末一起吃饭。 通过手机交流,他们在地图上选择了多个聚餐地点(由于自然地形等原因,部分聚餐地点不可达)。 求小华和小为都能到达的聚餐地点有多少个? 输入描述 第一行输入m和n,m代表地图的长度,n代表地图的宽度 第二行…

算法竞赛阶段二-数据结构(38)数据结构动态链表list

动态链表(List)的基本概念动态链表是一种线性数据结构,通过节点间的指针连接实现动态内存分配。与数组不同,链表的大小可随需增减,插入和删除操作的时间复杂度为 O(1)(已知位置时),但…

Qt 移动应用推送通知实现

推送通知是移动应用提升用户粘性的核心功能——无论是即时消息提醒、活动推送还是状态更新,都需要通过推送功能触达用户。Qt虽未直接提供跨平台推送API,但可通过集成原生服务(如Firebase Cloud Messaging、Apple Push Notification service&a…

Word和WPS文字如何制作分栏试卷?想分几栏分几栏

使用Word和WPS文字制作试卷的时候,通常会使用A3大小的纸张,横向布局。但是如果题目的题干、问题、选项文字太少,会带来试卷上有较大的空白,既不美观又浪费纸,解决办法就是将试卷分栏,根据需要分成多栏&…

ubuntu 安装vmware tools

VMware Workstation菜单栏->虚拟机->安装VMware Tools 打开ubuntu内加载的光盘,复制VMwareTools-10.3.26-22085142.tar.gz,解压出来 sudo ./vmware-install.pl #执行安装软件 VMware Tools 安装完成以后重启Ubuntu,重启以后就可以直…

【实时Linux实战系列】在实时应用中进行负载均衡

在实时应用中,负载均衡是确保系统能够高效处理多个任务的关键技术。通过合理调度任务到不同的处理单元,负载均衡可以提高系统的整体性能,减少延迟,并提高资源利用率。在实时 Linux 系统中,负载均衡尤为重要&#xff0c…

bash的特性-命令和文件自动补全

一、前言在 Linux Shell 编程和日常使用中,Bash 的自动补全功能 是一个非常强大且实用的特性。它不仅可以节省输入时间,还能有效减少拼写错误,提升命令执行效率。本文将带你全面了解 Bash 的自动补全机制,包括:✅ 命令…

Ubuntu系统 系统盘和数据盘扩容具体操作

Linux磁盘配置和需求,以下是完整的操作方案: 可以看到系统盘vda3 还有48GB 数据盘则是还有512GB没有挂载使用,下面是完成数据扩容的具体操作 一、完成系统盘扩容(使用98GB空间) # 1. 扩展逻辑卷(LVM架构&am…

从0到1学Pandas(七):Pandas 在机器学习中的应用

目录一、数据预处理1.1 特征提取1.2 数据标准化与归一化1.3 特征编码二、特征工程2.1 特征选择​2.2 特征组合与衍生​2.3 缺失值处理策略​三、模型训练与评估3.1 数据集划分3.2 模型训练与预测3.3 模型评估与调优四、Pipeline 构建4.1 自动化工作流4.2 模型部署与应用4.3 模型…

LangChain和LangGraph 里面的 `create_react_agent`有什么不同

这两个函数虽然名称相同,但来自不同的库(LangChain 和 LangGraph),它们在实现和使用上有一些关键区别: 主要区别特性LangChain 的 create_react_agentLangGraph 的 create_react_agent所属库LangChainLangGraph设计目的…

PostgreSQL 与 Oracle 数据库字段类型的详细对比

一、数值类型对比数据类型OraclePostgreSQL说明整数NUMBER(p,0)SMALLINT/INT/BIGINTOracle 统一用 NUMBER,PG 区分精度范围浮点数BINARY_FLOATREAL单精度浮点双精度浮点BINARY_DOUBLEDOUBLE PRECISION双精度浮点高精度小数NUMBER(p,s)NUMERIC(p,s)精确数值存储自增序…

JVM 性能调优实战:让系统性能 “飞” 起来的核心策略

在 Java 应用的生命周期中,性能问题如同隐藏的 “暗礁”—— 初期可能不显眼,但随着用户量增长和业务复杂度提升,微小的性能损耗会被无限放大,最终导致系统响应迟缓、频繁卡顿甚至崩溃。JVM 性能调优的目标,就是通过优…

Android Handler 完全指南

在 Android 开发中,Handler 是线程通信的核心工具 —— 当你在子线程下载图片后需要更新 UI,当你在 TCP 连接中收到数据需要通知界面,当你需要延迟执行某个任务时,都会用到 Handler。这个看似简单的类,却蕴含着 Androi…

梳理Ego-Planner模式下5通道、6通道与无人机模式的关系

Copilot said: 你需要梳理Ego-Planner模式下5通道、6通道与无人机模式的关系,以及轨迹跟随、紧急情况和人工接管的流程。下面结合你的描述和三张图片,对核心逻辑进行总结和整理: --- ## 一、状态组合与对应模式(见图1)…

odbc和jdbc什么区别

ODBC 和 JDBC 都是用于连接和操作数据库的标准接口,但它们分别面向不同的编程语言和平台。下面是它们的区别与对比,帮助你理解它们的用途和适用场景。📊 一、基本概念对比特性ODBC(Open Database Connectivity)JDBC&am…

境外期货Level2高频Tick历史行情数据获取与应用指南

在金融量化分析中,本地数据的高效使用是提升策略效果的重要基础。本文以CSV格式的本地数据为核心,以外盘期货分钟数据、CME/COMEX/CBOT历史行情为例,阐述专业化的数据处理与应用方法,为研究者提供可行性方案。一、数据预处理标准化…

迅为RK3588开发板安卓GPIO调用-APP运行测试

将网盘上的安卓工程文件复制到 Windows 电脑上。确保工程路径中使用英文字符,不包含中文。接着,启动 Android Studio,点击“Open”按钮选择应用工程文件夹,然后点击“OK”。由于下载 Gradle 和各种 Jar 包可能需要一段时间&#x…