一、KNN 简介

KNN:K-近邻算法 (K Nearest Neighbor)

算法思想:一个样本最相似的 k 个样本中的大多数属于某一个类别,则该样本也属于这个类别

距离计算:欧氏距离

二、KNN 解决两类问题

分类问题与回归问题

分类流程:

  1. 计算未知样本到每一个训练样本的距离
  2. 将训练样本根据距离大小升序排列
  3. 取出距离最近的 K 个训练样本
  4. 进行多数表决,统计 K 个样本中哪个类别的样本个数最多
  5. 将未知的样本归属到出现次数最多的类别

回归流程:

  1. 计算未知样本到每一个训练样本的距离(欧式距离:对应维度差值的平方和 开平方根
  2. 将训练样本根据距离大小升序排列
  3. 取出距离最近的 K 个训练样本
  4. 把这个 K 个样本的目标值计算其平均值
  5. 作为将未知的样本预测的值

其中K值的选择:需要一些方法来寻找这个最合适的K值 交叉验证、网格搜索

  • K值过小 ,过拟合,容易受到异常点的影响,整体模型变得复杂
  • K值过大 ,欠拟合,整体的模型变得简单

三 、KNN算法API的使用

首先机器学习的开发环境,安装:基于Python的 scikit-learn 库

分类问题与回归问题

分类问题

'''
分类问题
KNN算法 代码实现步骤1:导包2:创建模型对象3:准备训练集4:准备测试集5:模型训练6:模型预测,并打印结果
'''
# 1:导包
from sklearn.neighbors import KNeighborsClassifier
#2:创建模型对象
estimator = KNeighborsClassifier(3)
#3、准备训练集   列表嵌套   二维  [样本数量,特征数量]
#外层列表  样本数  4个
#内层列表  特征数量  1列
x_train = [[0], [1], [2], [3]]
#一维的   [样本数量]  4个
y_train = [0, 0, 0, 1]
#4、准备测试集  易错点2:注意这里x_test是二维的
x_test = [[4]]
#5、模型训练
#参1:训练集特征  参2:训练集标签
estimator.fit(x_train, y_train)
#6、模型预测
y_test = estimator.predict(x_test)
#打印结果
print(y_test)

回归问题

'''回归问题'''
#1、导包
from sklearn.neighbors import KNeighborsRegressor
#2、创建模型(算法)对象 注意!!这里是回归问题
estimator = KNeighborsRegressor(2)
#3、准备训练集
x_train = [[0, 0, 1],[1, 1, 0],[3, 10, 10],[4, 11, 12]]
y_train = [0.1, 0.2, 0.3, 0.4]
#4、测试集(x_test)
x_test = [[3, 11, 10]]
#5、模型训练
estimator.fit(x_train, y_train)
#6、模型预测(y_test)
y_test = estimator.predict(x_test)
#打印结果
print(y_test)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/95384.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/95384.shtml
英文地址,请注明出处:http://en.pswp.cn/bicheng/95384.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

《架构师手记:SpringCloud整合Nacos实战·一》

《架构师手记:SpringCloud整合Nacos实战一》 🌈 第一章:SpringCloud与Nacos的初识之旅 引言 在微服务架构的浪潮中,服务发现和配置管理成为了每个架构师必须面对的挑战。今天,我们将开启一段SpringCloud与Nacos的探…

卷积神经网络训练全攻略:从理论到实战

卷积神经网络(Convolutional Neural Networks, CNN)作为深度学习的重要分支,已成为计算机视觉领域的核心技术。从图像分类到目标检测,从人脸识别到医学影像分析,CNN 展现出了强大的特征提取和模式识别能力。本文将全面…

从零开始学习n8n-定时器+HTTP+飞书多维表格(上)

概述零基础也能把自动化玩明白:本篇将从“为什么要做自动化”出发,带你在 n8n 里新建第一个工作流,只用两个核心节点——Schedule Trigger(定时器) 与 HTTP Request。你会学会如何按固定频率触发流程、向接口发起请求、…

小白成长之路-k8s原理(二)

文章目录一、Service原理1.1概述1.2为什么需要service1.3service1.4service类型1.5service组件协同二、configMap原理2.1概述2.2命令2.3类型三、volume2.1emptydir2.2hostPath2.3pv/pvc2.4storageClass四、调度管理3.1概念3.2特点3.3亲和性3.4容忍和污点3.5固定节点调度五、etc…

2025 数字化转型期,值得关注的 10 项高价值证书解析

2025 年,数字化转型已迈入深度渗透阶段,大数据、人工智能、云计算等技术重塑各行业格局,相关领域人才缺口持续扩大。对于职场人突破瓶颈、大学生抢占就业先机而言,适配转型需求的专业证书已成为核心竞争力。本文结合行业经验&…

STM32 入门教程:从零基础到项目实战

STM32 微控制器凭借其高性能、低功耗、丰富外设以及庞大的生态系统,成为工程师和开发者的首选。对于刚接触 STM32 的新手来说,面对复杂的芯片架构和开发流程,往往会感到无从下手。本文将以通俗易懂的语言,结合实际案例&#xff0c…

ros、slam、激光雷达、自动驾驶相关学习内容和计划

明白 ✅。你现在做的是 LHD自动驾驶,核心技术是 SLAM、LiDAR、ROS、感知与规划控制。这类项目涉及“工程落地 学术算法 安全规范”三大方面。我给你一个循序渐进的学习方案(从基础到应用),并附带开源项目推荐,方便你…

Flutter 完全组件化的项目结构设计实践

Flutter 完全组件化的项目结构设计实践 在做 Flutter 项目的时候,随着业务不断扩展,如果所有代码都堆在 lib/ 目录里,后期维护会越来越痛苦。组件化(Componentization) 是一种常见的解决方案,它能让项目更清…

文件上传漏洞基础及挖掘流程

基础介绍定义用户通过文件上传的功能模块进行文件上传时,如果服务端没有对上传文件进行严格的验 证和过滤,而导致的用户可以越过其本身权限向服务器上上传可执行的动态脚本文件。则 攻击者可以通过上传木马,webshell等恶意文件,经…

【C2000】C2000的硬件设计指导与几点意见

《C2000 MCU硬件设计指南》 提示:《C2000 MCU硬件设计指南》用于指导C2000 MCU应用中的原理图设计与注意事项 文章目录 《C2000 MCU硬件设计指南》 前言 1.器件选型与封装决策 2.电源设计与去耦策略 3.时钟与复位电路设计 4.PCB布局与接地策略 5.EMI/EMC与ESD防护 [F2800x C20…

屏随人动+视觉魔方+多样主题+智能留言,涂鸦Wukong AI 2.0助力打造爆款带屏云台相机

一、带屏云台机:超硬核的市场魔力 作为 IPC 消费级别里的第一大品类,云台机市场一直处于稳步增长阶段,2024 年全球出货量达到 7000 万台。而其中的最强潜力股–带屏云台机,在 AI 大模型的强势赋能下,更于今年迎来全新…

Polkadot - ELVES

ELVES (Endorsing Light Validity Evaluator System) 即 轻量级背书有效性评估系统 。它是 JAM 可扩展且自适应的区块审计协议,即是JAM用于finalise区块的协议, 确保只有有效区块才能最终确定。 论文 – 2024-961 : Jeff Burdges、Cevallos 等人在2024年提出的 ELV…

【科研写作自动化工具】如何​​用AI技术组合(大模型+多Agent+自动化)打造一个“智能论文生产线”​​,把写作流程变成自动化

自主构建智慧科研写作系统——融合LLM语义理解、多智能体任务协同与n8n自动化工作流n8n 是一款开源的 ​​工作流自动化工具​​,类似于 Zapier 或 Make(原 Integromat),但更注重灵活性和开发者友好性。在课程文件中提到的 ​​n8…

window显示驱动开发—监视器类函数驱动程序

设备节点用于表示已连接到一台监视器的显示适配器上的每个视频输出。 设备节点是显示适配器设备节点的子节点。通常情况下,设备堆栈中只有两个设备对象代表一对视频输出/监视器:物理设备对象 (PDO)。功能设备对象 (FDO)。在某些情况下,筛选器…

STM32CubeMX + HAL 库:基于 I²C 通信的 AHT20 高精度温湿度测量实验

1 概述1.1 实验目的本实验基于 STM32CubeMX 与 HAL 库,借助硬件 IC 接口实现对 AHT20 高精度温湿度传感器的测量与数据处理。实验内容涵盖 AHT20 的初始化流程、指令交互机制、测量数据的采集与物理量转换等关键环节。通过对实验驱动代码与测试结果的完整展示&#…

今日分享:C++ -- vector

😎【博客主页:你最爱的小傻瓜】😎 🤔【本文内容:C vector 😍 】🤔 --------------------------------------------------------------------------------------------------------------------…

NAS Docker 安装N8N

NAS Docker 安装N8Ndocker 操作中文版使用 Docker Compose(更易于管理)创建一个 docker-compose.yml 文件,内容如下:yaml version: 3services:n8n:image: n8nio/n8n:latestcontainer_name: n8nrestart: unless-stoppedports:- &q…

Node.js汉字转拼音指南:pinyin-pro全解析

pinyin-pro 工具库简介核心功能:汉字转拼音、多音字处理、音调控制、格式定制等性能特点:高效、轻量级、支持多种拼音风格应用场景:搜索优化、数据排序、中文输入法等环境准备与安装Node.js npm 或 yarn 安装 pinyin-pronpm install pinyin-p…

UART-TCP双向桥接服务

UART-TCP双向桥接服务是一种将串口(UART)通信与TCP/IP网络通信相互转换的技术服务,其核心功能是实现两种不同协议之间的数据透明传输。1. 基本概念UART(串口):硬件设备的传统通信接口,常见于嵌入…

江协科技STM32学习笔记补充之001。为什么C语言在对STM32编程过程中的二进制要用十六进制来进行读写。而不能直接用二进制来进行读写。

下面给你一个“为什么嵌入式 C(如 STM32)普遍用十六进制而不是二进制来读写寄存器/地址”的系统性分析。核心观点:十六进制是对底层位模式更高效、更可靠的“人类可读编码”,与硬件资料、编译器和调试器生态形成了标准化协同。1&a…