一、三大概念

1.1 人工智能(AI)

  • Artificial Intelligence 人工智能
  • AI is the field that studies the synthesis and analysis of computational agents that act intelligently

1.2 机器学习(ML)

  • Machine Learning 机器学习
  • Field of study that gives computers the ability to learn without being explicitly programmed

1.3 深度学习(DL)

  • Deep Learning 深度学习

1.4 三者关系

在这里插入图片描述

  1. 机器学习是实现人工智能的一种途径。
  2. 深度学习是机器学习的一种方法。

1.5 学习方式

1.5.1 基于规则的学习

  • 基于规则的预测
  • 图像与语音识别
  • 自然语言处理

1.5.2 基于模型的学习

在这里插入图片描述

  • 通过编写机器学习算法,让机器自己学习从历史数据中获得经验、训练模型

二、人工智能应用领域和发展史

2.1 应用领域

在这里插入图片描述

  • 用户分析:社交网络、影评、商品评论
  • 搜素引擎:网页、图片、规频、新闻、学术、地图
  • 信息推荐:新闻、商品、游戏、书籍
  • 图片识别:人像、用品、劢物、交通工具
  • 机器翻译、摘要生成 … 生物信息学习 … 多模态 AR/VR

2.2 发展历史

在这里插入图片描述

2.3 发展三要素

在这里插入图片描述

  1. CPU:负责调度任务、计算任务等;主要适合I\O密集型的任务。
  2. GPU:更加适合矩阵运算;主要适合计算密集型任务。
  3. TPU:Tensor,专门针对神经网络训练设计一款处理器。

三、常见术语

  1. 样本(sample):一行数据就是一个样本;多个样本组成数据集;有时一条样本被叫成一条记录。
  2. 特征(feature):一列数据一个特征,有时也被称为属性。
  3. 标签/目标(label/target):模型要预测的那一列数据。
  4. 数据集:
    • 训练集(training set):用来训练模型(model)的数据集
    • 测试集(testing set):用来测试模型的数据集

四、算法分类

4.1 有监督学习

4.1.1 定义

  输入数据是由输入特征值和目标值所组成,即输入的训练数据有标签的。

4.1.2 数据集

在这里插入图片描述

数据人工标注

4.1.3 分类

在这里插入图片描述

目标值(标签值)不连续
分类种类:二分类和多分类

4.1.4 回归

在这里插入图片描述

目标值(标签值)连续

4.2 无监督学习

4.2.1 定义

  输入数据没有被标记,即样本数据类别未知,没有标签,根据样本间的相似性,对样本集聚类,以发现事物内部 结构及相互关系。

4.2.2 数据集

在这里插入图片描述

数据无需标注

4.2.3 特点

  1. 训练数据无标签。
  2. 根据样本间的相似性对样本集进行聚类,发现事物内部结构及相互关系。

4.3 半监督学习

4.3.1 工作原理

在这里插入图片描述

  1. 标注少量数据。
  2. 利用已经标注的少量数据训练出一个模型。
  3. 再利用训练出的模型去套用未标记的数据。
  4. 对比专家分类结果与模型分类结果,从而对模型做进一步改善和提高。

4.3.2 特点

  1. 大幅降低标注成本

4.4 强化学习

4.4.1 工作原理

在这里插入图片描述

四要素:

  • agent
  • 环境状态
  • 行动
  • 奖励

4.5 四者对比

在这里插入图片描述

Inputoutput目的案例
监督学习(supervised learning)有标签有反馈预测结果猫狗分类、房价预测
无监督学习(unsupervised learning)无标签无反馈发现潜在结构“物以类聚,人以群分”
半监督学习(Semi-Supervised Learning)部分有标签,部分无标签有反馈降低数据标记的难度
强化学习(reinforcement learning)决策流程及激励系统一系列行动长期利益最大化学下棋

五、建模流程

步骤序号步骤名称具体内容
1获取数据获取经验数据、图像数据、文本数据 …
2数据基本处理数据缺失值处理、异常值处理 …
3特征工程特征提取、特征预处理、特征降维 …
4机器学习(模型训练)线性回归、逻辑回归、决策树、GBDT
5模型评估回归评测指标、分类评测指标、聚类评测指标

六、特征工程

6.1 定义

  1. 从数据集的角度,指一列一列的数据。
  2. 从模型训练的角度,指对预测结果有用的属性。

  利用专业背景知识和技巧处理数据,让机器学习算法效果最好。数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。

6.2 特征提取

  从原始数据中提取与任务相关的特征,构成特征向量。对于文本、图片这种非行列形式的数据行列形式转换,一旦转换成行列形式一列就是特征。

6.3 特征预处理

  将不同的单位的特征数据转换成同一个范围内,使训练数据中不同特征对模型产生较为一致的影响。

6.4 特征降维

  将原始数据的维度降低,会丢失部分信息,但需要保证数据的主要信息要保留下来。

6.5 特征选择

  原始数据通常存在丰富多样的特征,对于给定任务而言,有效特征仅为全体特征构成集合中的一个子集。此时,需从原始特征集合里,甄别并选取对任务具备显著价值的重要特征或强相关特征,且整个过程不会对原始数据本身的特征表示与分布产生改变。

6.6 特征组合

  通过加法、乘法等方法把多个的特征合并成一个特征。

  • [A x B]:将两个特征的值相乘形成的特征组合
  • [A x B x C x D x E]:将五个特征的值相乘形成的特征组合
  • [A x A]:对单个特征的值求平方形成的特征组合

七、模型拟合

  1. 拟合
    • 定义:表示模型对样本点的拟合情况
  2. 欠拟合
    • 定义:模型在训练集上表现很差,在测试集表现也很差
    • 原因:模型过于简单
  3. 过拟合
    • 定义:模型在训练集上表现很好,在测试集表现很差
    • 原因:模型过于复杂,数据不纯,训练数据太少
  4. 泛化
    • 定义:模型在新数据集上的表现好坏的能力
  5. 奥卡姆剃刀原则
    • 给定两个具有相同泛化误差的模型,较简单的模型比较复杂的模型更可取

微语录:在一切破旧褪色中,请你永远闪烁。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/88689.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/88689.shtml
英文地址,请注明出处:http://en.pswp.cn/pingmian/88689.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AGX Xavier 搭建360环视教程【一、先确认方案】

设备默认自带 NVIDIA 硬件编解码能力(NVDEC/NVENC),但是需要你在 OpenCV 和 FFmpeg 里正确启用 调通 GStreamer 或 nvmpi,才真正能用起来!这里的硬解码是核心:Jetson 平台的硬解码,要么走 GStr…

服务器怎么跑Python项目?

在服务器上运行 Python 项目通常涉及 环境配置、依赖安装、项目部署 和 进程管理。以下是详细步骤:1. 连接服务器确保你能通过 SSH 访问服务器:ssh usernameyour_server_ip(如果是本地测试,可跳过这一步)2. 安装 Pytho…

【软件设计师】

UML 类图中的关系用例图中的关系 关系例子类图用例图顺序图 概念示例通信图活动图泳道图状态图

Java 内部类详解:从基础到实战,掌握嵌套类、匿名类与局部类的使用技巧

作为一名 Java 开发工程师,你一定在实际开发中遇到过这样的场景:想在一个类内部定义另一个逻辑相关的类;需要为某个接口或抽象类提供一个临时实现(比如监听器);想利用面向对象特性来组织代码结构&#xff0…

Java设计模式之行为型模式(观察者模式)介绍与说明

一、模式结构 观察者模式包含以下四个角色: Subject(主题/被观察者) 维护观察者列表,提供注册(registerObserver)、移除(removeObserver)观察者的方法,并定义通知所有观察…

实现一个点击输入框可以弹出的数字软键盘控件 qt 5.12

我们将创建两个自定义组件: 1. NumericInputField:一个输入框,当点击时弹出数字键盘。 2. NumericKeyboard:一个可缩放的数字键盘。 设计思路: - NumericInputField 是一个常规的输入框,但点击后会弹出 Num…

Java 深入解析:JVM对象创建与内存机制全景图

第一章:引言 Java 是一种面向对象的编程语言,对象(Object)是其最基本的组成单位。Java 的“一切皆对象”不仅体现在语法层面,更体现在运行时,几乎所有数据都以对象形式存在于内存中。 然而,很…

Redis 基本操作笔记

1. Redis 简介 Redis(Remote Dictionary Server)是一个开源的、高性能的键值对存储系统,通常作为数据库、缓存、消息中间件等使用。它支持多种数据类型,包括字符串、哈希、列表、集合、有序集合等。 Redis 特点: 性能&…

Docker从环境配置到应用上云的极简路径

Docker从环境配置到应用上云的极简路径主要包括环境配置、应用容器化、选择云平台及部署应用等步骤,具体如下: - 配置Docker环境: - 安装Docker:根据操作系统下载对应版本的Docker安装包。如在Linux系统中,可使用命令…

Slicer渲染Dicom到nrrd

Slicer渲染Dicom到nrrd 工作中遇到一些处理Dicom数据的需求,个人通过网络上的一些教程 对于原始数据尝试转换到nrrd时,发现部分的窗体数据的渲染方向不一致 进一步发现这些很多定义的方向是跟设备厂家强相关的,不同厂家对于同一段的Dicom参…

QT中设计qss字体样式但是没有用【已解决】

检查一下stylesheet里面是不是有不能被QT读取的CSS语言,可能会跟字体颜色冲突错误示范:/* 错误示例:QSS 中使用 box-shadow */ QPushButton {box-shadow: 0 4px 8px rgba(0, 0, 0, 0.3); /* Qt 不支持此属性 */ }删掉就行了如果后续想用阴影…

uniapp获取状态栏高度,胶囊按钮的高度,底部安全区域的高度,自定义导航栏

相关API uni.getSystemInfoSync() uni.getMenuButtonBoundingClientRect() 创建一个utils文件夹,该文件下封装一个systemInfo.js /*** 系统信息工具类* 封装获取系统状态栏、导航栏和安全区域等相关信息的方法*/// 获取系统信息并缓存 const systemInfo uni.get…

jQuery 文本属性值

一、前言在网页开发中,我们经常需要对页面上的文本内容进行操作,例如动态修改段落文字、读取用户输入框的内容、更新按钮文本等。jQuery 提供了简洁而强大的方法来处理这些常见的文本操作需求。本文将带你全面了解 jQuery 中用于操作文本内容的三个核心方…

JAVA并发——为什么Java中的ThreadLocal对key的引用为弱引用

1、ThreadLocal 的用途 给每个线程提供自己独立的变量副本,实现线程间隔离。 常用于: 数据库连接、Session 缓存、用户上下文(如 userId)线程池中的线程复用时避免共享污染;实现线程封闭的设计模式 2、内存泄漏 使用弱…

【C++】多线程同步三剑客介绍

目录 条件变量 头文件 主要操作函数 1、等待操作 2、唤醒操作 使用示例 信号量 头文件 主要操作函数 1、信号量初始化 2、等待操作(P操作) 3、信号操作(V操作) 4、获取信号量值 5、销毁信号量 使用示例 互斥锁 …

《Java Web程序设计》实验报告八 JSP+Servlet+JDBC+MySQL实现课程管理

目 录 一、实验目的 二、实验环境 三、实验步骤和内容 1、小组成员分工(共计4人) 2、实验方案 3、实验结果与分析 4、项目任务评价 四、遇到的问题和解决方法 五、实验总结 一、实验目的 1、掌握mysql的安装、数据库表单创建 2、掌握JDBC的链接…

基于数据挖掘的课程推荐系统研究

摘要本研究设计并开发了一套基于先进数据挖掘技术的智能化课程推荐系统。该系统创新性地采用了协同过滤算法与内容推荐算法相结合的混合推荐策略,通过深度分析学生在学习平台上的历史行为数据(包括选课记录、学习时长、测试成绩等)以及课程的…

【SCI 4区推荐】《Journal of Visual Communication and Image Representation》

期刊简介:《视觉传达与图像表示杂志》(Journal of Visual Communication and Image Representation)致力于发表视觉传达与图像表示领域的最前沿研究,特别强调多学科交叉领域中的新技术和理论应用。这本期刊涵盖的研究范围广泛&…

20250711_Sudo 靶机复盘

target:192.168.43.20 外部打点 (文件上传) nmap扫一下,80,22 开放 扫目录,发现 README.md [17:04:30] 200 - 664B - /Dockerfile [17:04:38] 200 - 34KB - /LICENSE …

STEP 7-Micro/WIN SMART 编程软件:从入门到精通的使用指南

STEP 7-Micro/WIN SMART 编程软件:从入门到精通的使用指南 在工业自动化控制领域,编程软件是连接工程师与 PLC 的桥梁,而 STEP 7-Micro/WIN SMART 作为 S7-200 SMART PLC 的专用编程工具,以其友好的界面和高效的编程能力备受青睐。…