机器学习常见方法

涉及方法:

2.半监督学习

3.无监督学习

4.度量学习

5.迁移学习

6.多示例多标记学习

7.在线学习

8.元学习

9.联邦学习

10.强化学习

11.概率图模型

独立同分布

独立指的是,样本集包括训练集测试集的任意两个样本之间都是不相关的。在表示样本的特征确定后,训练样本集的分布是具体而确定的,成为基于训练样本的分布;样本全集,如果能够获取的话(通常无法获取),也对应着一个具体而确定的分布,称为基于样本全集的分布,同分布就是基于训练样本集的分布与基于样本全集的分布完全相同

2.半监督学习

训练数据中一部分有标签(xi,yi),一部分无标签(xj),学习一个映射f:X->Y

预测数据(xt)

未标记数据的优点:优化决策边界,提升泛化能力

假设

所有的无标记数据都属于有标记数据中的某一类

1.光滑性假设,如果高密度区域两个点x1x2很接近,那么相应输出y1y2很接近

2.聚类假设:如果在同一个簇中,很可能为同一类

3.流形假设:高维数据大致位于低维流形上,如果高维中属于一个类,那么低维也属于一个类

常见方法

自训练

1.假设:具有高置信度的预测是正确的

2.过程

用已有的有标记数据(xi,yi)训练f,预测未标记(xu,f(xu)),将预测的未标记数据加入已标记数据,继续训练,预测再加入

(全部加入|基于置信度分配权重全部加入|少量最自信的加入)

3.优点

易于理解

框架性思路:自训练+各种机器学习算法

4.缺点

对初始模型质量敏感

对数据分布敏感

伪标签错误累加

协同训练

1.假设

单独使用单个视图的数据可以训练一个好的分类器

不同视图数据相互独立

2.过程 

两个分类器f1,f2

分别对无监督数据标记,f1分类最自信的k个加入f2中,f2的加入f1中

3.优点 

互补信息

框架性思路

与自训练相比,对错误的伪标记不太敏感

4.缺点

在某些任务中不一定有多视图条件

5.风格

划分特征|划分数据集|划分模型

6.扩展

两个视角->三个视角

一致性正则化

1.数据增强

图片旋转裁剪放大缩小等

2.PI模型

输入有标签xi,无标签xu,进行随机数据增强,经过神经网络模型,计算损失(监督损失+无监督损失(无标签数据增强前后))

3.优点

使用简单

对噪音不敏感

4.缺点

训练时间长,效率低

3.无监督学习

最小化无监督损失函数

(k均值:样本间的相似度集|主成分分析:信息损失|自编码器:重构误差)

方法

K-means

1.过程

随机初始化k个点

计算其他数据点到这个k个的距离,选最近的中心点作为数据所在簇

在一个中心点的一个簇内,重新计算中心点的位置

重复n次

2.缺点

对初始点敏感

对噪声敏感

3.k-means++

初始化k个点的时候

先随机初始化一个中心点,算其他数据点离中心点的距离D(xi),选最远的点作为新的中心点加入,继续计算,直到得到k个中心点

主成分分析

自编码器

4.度量学习

方法

线性判别分析

最大化类间距离,最小化类内距离

深度度量学习

5.迁移学习

6.多标记多示例学习

单标记多示例

多标记单示例,包

7.在线学习

全信息在线学习,知道损失函数

只知道回报,老虎机

8.元学习

学习很多任务,元学习器,针对每个任务优化,每个任务最后验证的损失优化外层的参数

9.联邦学习

信息加密,串行并行

10.强化学习

11.概率图模型

贝叶斯

贝叶斯平均

基于后验概率的预测

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/93438.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/93438.shtml
英文地址,请注明出处:http://en.pswp.cn/diannao/93438.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Chrome 提示 “此扩展程序不再受支持”(MacOS/Windows)

原因 最新 Chrome 使用 Manifest V3, 并在新版浏览器中 停止 V2 支持 处理方法 MacOS 新建一个后缀为 .mobileconfig 的文件, 内容参考 <?xml version"1.0" encoding"UTF-8"?> <!DOCTYPE plist PUBLIC "-//Apple//DTD PLIST 1.0//EN&…

C++20协程实战:高效网络库、手机终端、多媒体开发开发指南

基于C++协程和事件循环的网络库 以下是基于C++协程和事件循环的网络库实例,涵盖常见场景和功能实现。示例基于libuv、Boost.Asio或自定义事件循环,结合C++20协程(如std::coroutine)或其他协程库(如cppcoro)实现。 基础TCP服务器 #include <cppcoro/task.hpp> #in…

数据库4.0

索引 事务 JDBC~ 目录 一、MySQL索引 1.0 概述 2.0 相关操作 3.0 注意 4.0 索引背后的原理的理解 二、 事务 1.0 原子性 2.0 隔离性 (1)并发执行 (2) 出现的问题 3.0 使用 三、JDBC编程 1.0 概述 2.0 如何下载驱动包 3.0 jar如何引入到项目之中 4.0 jdbc…

HarmonyOS-ArkUI Web控件基础铺垫6--TCP协议- 流量控制算法与拥塞控制算法

HarmonyOS-ArkUI Web控件基础铺垫1-HTTP协议-数据包内容-CSDN博客 HarmonyOS-ArkUI Web控件基础铺垫2-DNS解析-CSDN博客 HarmonyOS-ArkUI Web控件基础铺垫3--TCP协议- 从规则本质到三次握手-CSDN博客 HarmonyOS-ArkUI Web控件基础铺垫4--TCP协议- 断联-四次挥手解析-CSDN博客…

Dify 从入门到精通(2/100 篇):Dify 的核心组件 —— 从节点到 RAG 管道

Dify 的核心组件&#xff1a;从节点到 RAG 管道 引言 在 Dify 博客系列&#xff1a;从入门到精通&#xff08;100 篇&#xff09; 的第一篇《Dify 究竟是什么&#xff1f;真能开启低代码 AI 应用开发的未来&#xff1f;》中&#xff0c;我们全面介绍了 Dify 的定位、核心特点…

在线培训、远程示教——医疗器械行业的直播解决方案

文章目录前言一、医疗器械直播应用的两大核心场景二、直播平台在医疗场景中的关键技术支持点三、典型功能实现原理总结前言 医疗器械行业对“培训”和“示教”的专业性要求极高&#xff0c;传统的线下模式常因时间、空间、人员成本等受限而效率低下。而随着高清低延迟视频技术…

Mqttnet的MqttClientTlsOptions.CertificateValidationHandler详解

MqttClientTlsOptions.CertificateValidationHandler 是 MQTTnet 库中用于自定义 TLS 证书验证逻辑的关键回调函数。在 MQTT 客户端与服务器建立 TLS 连接时&#xff0c;该回调允许你覆盖默认的证书验证流程&#xff0c;实现自定义的安全策略。核心作用当 MQTT 客户端通过 TLS …

【图像噪点消除】——图像预处理(OpenCV)

目录 1 均值滤波 2 方框滤波 3 高斯滤波 4 中值滤波 5 双边滤波 6 小结 噪声&#xff1a;图像中的一些干扰因素。通常是由于图像采集设备、传输信道等因素造成的&#xff0c;表现为图像中随机的亮度。常见的噪声类型有高斯噪声和椒盐噪声。高斯噪声是一种分布符合正态分布…

Vulnhub napping-1.0.1靶机渗透攻略详解

一、下载靶机 下载地址&#xff1a;https://download.vulnhub.com/napping/napping-1.0.1.ova 下载好后使用VM打开&#xff0c;将网络配置模式改为net&#xff0c;防止桥接其他主机干扰&#xff08;桥接Mac地址也可确定主机&#xff09;。 二、发现主机 使用nmap扫描没有相应…

Kubernetes自动扩容方案

Kubernetes 自动扩容可以概括为 “三层六类”&#xff1a;层级类型触发维度官方/社区方案一句话说明Pod 级HPACPU / 内存 / 自定义 / 外部指标内置副本数横向扩缩&#xff0c;最常用VPACPU / 内存社区组件单 Pod 资源竖向扩缩&#xff0c;不改副本数KEDA任意事件&#xff08;队…

linux命令ps的实际应用

ps&#xff08;Process Status&#xff09;是 ​Linux/Unix 系统中最核心的进程管理工具&#xff0c;用于实时抓取系统进程快照。它直接读取 /proc 文件系统&#xff0c;不持续监控进程&#xff08;区别于 top&#xff09;&#xff0c;但可通过参数组合实现精准进程诊断。下面从…

深入理解C语言:详解直接插入排序的实现与优化

目录 引言 一、直接插入排序的相关概念 1.1、基本概念 1.2、直接插入排序过程详解 二、代码实现 三、时间复杂度 四、希尔排序 4.1、希尔排序的陈述 4.2、代码实现 4.3、时间复杂度 结语 引言 在计算机科学的世界里&#xff0c;排序算法是基础且重要的组成部分。它们…

【DRAM存储器五十五】LPDDR5介绍--command bus training

👉个人主页:highman110 👉作者简介:一名硬件工程师,持续学习,不断记录,保持思考,输出干货内容 参考资料:《某LPDDR5数据手册》 、《JESD209-5A》 在为高频或中频操作启用ODT之前,必须对L

一道曾经百度面试题

&#x1f680;个人主页&#xff1a;BabyZZの秘密日记 &#x1f4d6;收入专栏&#xff1a;C语言 &#x1f30d;文章目入1. 题目重现2. 大小端到底在比什么&#xff1f;3. 解法一&#xff1a;联合体&#xff08;union&#xff09;为什么一行就够&#xff1f;使用示例4. 解法二&am…

VIKOR(Multi-criteria Optimization and Compromise Solution)简介与简单示例

前言 提醒&#xff1a; 文章内容为方便作者自己后日复习与查阅而进行的书写与发布&#xff0c;其中引用内容都会使用链接表明出处&#xff08;如有侵权问题&#xff0c;请及时联系&#xff09;。 其中内容多为一次书写&#xff0c;缺少检查与订正&#xff0c;如有问题或其他拓展…

【算法训练营Day18】二叉树part8

文章目录修剪二叉搜索树将有序数组转换为二叉搜索树把二叉搜索树转换为累加树修剪二叉搜索树 题目链接&#xff1a;669. 修剪二叉搜索树 解题逻辑&#xff1a; 因为在删除的同时要保证相对结构&#xff0c;所以我们不能沿用上一篇文章中的删除逻辑&#xff0c;新的删除逻辑为&…

【C++篇】“内存泄露”的宝藏手段:智能指针

目录 智能指针的使用场景分析 RAII和智能指针的设计思路 C标准库智能指针的使用 auto_ptr的使用&#xff1a; unique_ptr的使用&#xff1a; shared_ptr的使用&#xff1a; 模拟shared_ptr: 定制删除器&#xff1a; shared_ptr的循环引用 weak_ptr 智能指针的使用场景…

【密码学】4. 分组密码

目录分组密码分组密码概述Feistel 密码结构数据加密标准&#xff08;DES&#xff09;差分密码分析与线性密码分析分组密码的运行模式国际数据加密算法&#xff08;IDEA&#xff09;高级加密标准&#xff08;AES&#xff0c;Rijndael&#xff09;中国商用密码 SM4祖冲之密码&…

单片机(STM32-WIFI模块)

一、WIFI模块介绍 1. ESP12-F模组介绍 1.1 简介 ESP12-F模组&#xff08;安信可&#xff08;Ai-Thinker&#xff09;ESP8266系列模组&#xff09;是一款基于乐鑫&#xff08;Espressif&#xff09;公司ESP8266芯片的Wi-Fi无线通信模块&#xff0c;广泛应用于物联网&#xff0…

PyTorch 数据类型和使用

关于PyTorch的数据类型和使用的学习笔记 系统介绍了PyTorch的核心数据类型Tensor及其应用。Tensor作为多维矩阵数据容器&#xff0c;支持0-4维数据结构&#xff08;标量到批量图像&#xff09;&#xff0c;并提供了多种数值类型&#xff08;float32/int64等&#xff09;。通过…