​一、人工智能三大概念​

  1. ​人工智能(AI)​

    • 定义:使用计算机模拟或代替人类智能的研究领域

    • 目标:像人类一样思考(理性推理)、行动(决策执行)

    • 别名:仿智

  2. ​机器学习(ML)​

    • 定义:从数据中​​自动学习规律​​(模型),并用模型预测新数据

    • 核心:基于模型自动学习(非人工规则编程)

    • 示例:房价预测模型 y = ax + b(a、b为模型参数)

  3. ​深度学习(DL)​

    • 定义:模拟人脑神经元的​​深度神经网络​​,通过多层结构学习复杂规律

    • 特点:从机器学习发展而来,适合图像、语音等复杂任务

  4. ​三者关系​

机器学习是实现人工智能的一种途径,深度学习是机器学习的一种方法


​二、机器学习的应用领域与发展史​

​应用领域​
  • ​计算机视觉(CV)​​:图像/视频理解(如人脸识别)

  • ​自然语言处理(NLP)​​:文本分析、机器翻译

  • ​数据挖掘​​:从大数据中发现隐藏规律

​发展史​
  • ​1956年​​:AI元年

  • ​2012年​​:AlexNet引爆深度学习(CV领域)

  • ​2017年​​:Transformer框架推动NLP发展

  • ​2022年​​:ChatGPT开启AIGC时代

​三要素​
  • ​数据​​:模型训练的基础

  • ​算法​​:解决问题的数学方法

  • ​算力​​:硬件支持(CPU/GPU/TPU)

    • CPU:适合I/O密集型任务

    • GPU:适合计算密集型任务(如神经网络训练)


​三、机器学习常用术语​

术语

说明

示例

​样本​

数据集中的一行数据(一条记录)

西瓜数据集中的一条

​特征​

描述样本的属性(一列数据)

西瓜的色泽、根蒂

​标签​

待预测的目标值

西瓜是否是好瓜(0/1)

​训练集​

用于训练模型的数据(70-80%)

x_train, y_train

​测试集​

用于评估模型的数据(20-30%)

x_test, y_test


​四、机器学习算法分类​

1. ​​监督学习​​(数据含标签)
  • ​回归​​:预测连续值(如房价)

  • ​分类​​:预测离散类别(如是否垃圾邮件)

2. ​​无监督学习​​(数据无标签)
  • ​聚类​​:按样本相似性分组(如用户分群)

3. ​​半监督学习​
  • 少量标注数据 + 大量未标注数据,降低标注成本

4. ​​强化学习​
  • 智能体通过​​环境交互​​获取奖励(如AlphaGo、自动驾驶)

  • 四要素:Agent, Environment, Action, Reward


​五、机器学习建模流程​

  1. ​数据预处理​​:处理缺失值、异常值

  2. ​特征工程​​(核心耗时步骤):

    • 特征提取 → 特征预处理 → 特征降维 → 特征选择 → 特征组合

  3. ​模型训练​​:选择算法(如线性回归、决策树)

  4. ​模型评估​​:

    • 回归:均方误差(MSE)

    • 分类:准确率、召回率


​六、特征工程详解​

​目标​​:提升模型效果,是影响模型上限的关键

​原则​​:数据和特征 > 模型算法

步骤

作用

​特征提取​

从原始数据构造特征向量(如文本转词向量)

​特征预处理​

标准化/归一化,消除特征量纲影响(如MinMax缩放)

​特征降维​

降低特征维度,保留主要信息(如PCA)

​特征选择​

筛选与任务相关的特征子集(不修改原始数据)

​特征组合​

合并特征(如乘法/加法),增强表达能力(如组合“面积×位置”预测房价)


​七、模型拟合问题​

问题

表现

原因

解决方案

​欠拟合​

训练集和测试集效果均差

模型过于简单

增加特征、增强模型复杂度

​过拟合​

训练集效果好,测试集效果差

模型复杂/数据噪声多

简化模型、正则化、增加数据量

​核心概念​
  • ​泛化能力​​:模型在​​新数据​​上的表现(最终目标)

  • ​奥卡姆剃刀原则​​:相同效果下,选择更简单的模型


​八、开发环境​

  • ​工具​​:scikit-learn(Python库)

    • 特点:

      • 基于NumPy/SciPy/matplotlib

      • 开源,支持分类/回归/聚类等算法

    • 安装:pip install scikit-learn

    • 官网:https://scikit-learn.org


​关键总结​

  1. ​学习方式​​:

    • 规则编程(人工定义逻辑) → 机器学习(自动学习模型)

  2. ​核心链路​​:

    数据 → 特征工程 → 模型训练 → 评估优化

  3. ​避坑指南​​:

    • 优先解决特征工程,再优化模型

    • 模型选择:简单模型优先,避免过拟合

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/94556.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/94556.shtml
英文地址,请注明出处:http://en.pswp.cn/pingmian/94556.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

GIT压缩提交,将多个已经push的commit提交,合并成一个

1.选中要合并的提交2.选中后右键选着Squash Committs3.重新编辑提交信息4.操作完成后不能pull,要强制pushgit push --force

(多线程)线程安全和线程不安全 产生的原因 synchronized关键字 synchronized可重入特性死锁 如何避免死锁 内存可见性

线程安全问题产生原因 线程安全问题主要发生在多线程环境下,当多个线程同时访问共享资源时, 如果没有采取适当的同步措施,就可能导致数据不一致或程序行为异常1.[根本]操作系统对于线程的调度是随机的.抢占式执行,这是线程安全问题…

defineCustomElement 的局限性及重载需求分析

一、defineCustomElement 的核心局限性 Vue 的 defineCustomElement 虽然实现了 Vue 组件到 Web Components 的转换,但在跨框架/跨语言场景下存在以下关键局限,这也是你的项目需要重载其返回构造器的根本原因: 1. 框架间事件模型不兼容 Vue 事件机制:依赖 $emit 转换的 C…

如何在前端开发中应用AI技术?

一、AI 辅助前端开发流程(提效工具)智能代码生成与补全使用 AI 编程工具(如 GitHub Copilot、Cursor、Amazon CodeWhisperer)实时生成代码片段,支持 HTML、CSS、JavaScript、React/Vue 等框架语法。例如,输…

极海发布APM32F425/427系列高性能MCU:助力工业应用升级

聚焦工业4.0及能源管理应用对主控MCU的高性能需求,极海正式发布APM32F425/427系列高性能拓展型MCU,集合运算性能、ADC性能、Flash控制器性能与通信接口四大维度革新,进一步增强了EMC性能,重新定义Cortex-M4F内核在复杂工业场景下的…

JSX深度解析:不是HTML,胜似HTML的语法糖

JSX深度解析:不是HTML,胜似HTML的语法糖 作者:码力无边大家好!我是依然在代码世界里乘风破浪的码力无边。欢迎回到我们的《React奇妙之旅》第二站! 在上一篇文章中,我们成功地用Vite启动了第一个React应用&…

大模型应用新趋势:从思维链到 HTML 渲染的破局之路

一、大模型交互范式的演进:从 Prompt 工程到思维链革新早期的 Prompt 工程曾面临 “模型特异性” 困境 —— 精心设计的提示词在不同模型上效果迥异。但随着 ** 思维链(CoT)** 技术的成熟,这一局面正在改变。从 OpenAI o1 的隐式整…

从“找不到”到“秒上手”:金仓文档系统重构记

你是否曾在浩如烟海的产品手册中迷失方向?是否为了一个关键参数翻遍十几页冗余说明?是否对时灵时不灵的搜索功能感到抓狂?甚至因为漫长的加载时间而失去耐心?我们懂你!这些曾困扰金仓用户的文档痛点,从现在起&#xff…

【开源项目分享】可监控电脑CPU、显卡、内存等硬件的温度、功率和使用情况

系列文章目录 【开源项目分享】可监控电脑CPU、显卡、内存等硬件的温度、功率和使用情况 (一)开源的硬件监控工具 LibreHardwareMonitor (二)LibreHardwareMonitor 分层架构设计 (三)LibreHardwareMonitor…

帕累托优化:多目标决策的智慧与艺术

本文由「大千AI助手」原创发布,专注用真话讲AI,回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我,一起撕掉过度包装,学习真实的AI技术! 在相互冲突的目标中寻找最优平衡 ✨ 1. 帕累托优化概述 帕累托优化&a…

#Linux内存管理学以致用# 请你根据linux 内核struct page 结构体的双字对齐的设计思想,设计一个类似的结构体

Linux struct page 的双字对齐设计思想1.双字对齐(8字节对齐):确保struct page的大小是sizeof(long)的整数倍(通常8字节),便于CPU高效访问。减少内存碎片,提高缓存行(Cache Line&…

白酒变局,透视酒企穿越周期之道

今年以来,在科技股的带动下,A股市场表现十分突出,近期沪指甚至创出了十年来新高。然而,在这轮市场的表现中,曾经被资金热捧的白酒板块,却显得有些沉寂。业绩层面,从目前已披露的白酒上市公司半年…

智慧园区:从技术赋能到价值重构,解锁园区运营新范式

在数字化浪潮席卷产业的当下,智慧园区已从 “概念蓝图” 落地为 “实战方案”,其核心逻辑既源于技术的突破性应用,也扎根于企业的实际需求,更顺应着行业发展的未来趋势,成为驱动园区从传统管理向智能化运营升级的核心引…

模运算(密码学/算法)

1 什么是模运算 模运算的概念 模运算是一种算术运算,常写作a mod n,表示整数a除以正整数n后的余数。 模数是模运算中的除数n,它决定了结果的范围。 公式表达: 对于任意整数a和正整数n,可以将a表示为:a qn …

海康相机的 HB 模式功能详解

海康相机的 HB 模式是一种无损压缩技术,全称为High Bandwidth 模式,主要用于提升工业相机在高速场景下的数据传输效率。其核心原理是通过硬件级无损压缩算法对原始图像数据进行压缩,在不损失画质的前提下减少数据量,从而突破千兆网络的带宽限制,实现更高的行频和传输帧率。…

electron应用开发:命令npm install electron的执行逻辑

我们来彻底解析 npm install electron 这个命令背后的完整执行逻辑。这是一个非常精妙的过程,远不止下载一个简单的 JavaScript 包那么简单。理解了它,你就能透彻地明白 Electron 开发环境的运作原理,并能轻松解决各种安装问题。 npm instal…

Visual Studio 2022不同项目设置不同背景图

ClaudiaIDE Visual Studio 地址:https://marketplace.visualstudio.com/items?itemNamekbuchi.ClaudiaIDE&ssrfalse#overviewgithub 地址:https://github.com/buchizo/ClaudiaIDE/ 这是一个Visual Studio扩展,可以让你设置自定义背景图…

React页面使用ant design Spin加载遮罩指示符自定义成进度条的形式

React页面使用ant design Spin加载遮罩指示符自定义成进度条的形式具体实现:import React, { useState, useEffect, } from react; import { Spin, Progress, } from antd; import styles from ./style.less;const App () > {// 全局加载状态const [globalLoadi…

TCP并发服务器构建

TCP并发服务器构建: 单循环服务器:服务端同一时刻只能处理单个客户端的任务 并发服务器:服务端同一时刻能够处理多个客户端的任务 产生多个套接字可建立多个连接:TCP服务端并发模型: 1:使用多进程 头文件&a…

优选算法-常见位运算总结

1.基础位运算: >> :右移运算符: 逻辑右移(无符号数):高位补 0,低位直接丢弃。 示例:8 >> 2(二进制 1000 右移 2 位)结果为 0010(十进制 2&#…