7、有监督学习和无监督学习的区别

有监督学习:

        对具有概念标记(分类)的训练样本进行 学习,以尽可能对训练样本集外的数据进 标记(分类)预测。   ,所有的标记(分类)是已知的。 因此 ,训练样本的岐义性低。监督学习中只要输 样本集,机器就可以从中推演出 制定标变量的可能结果.如协同过滤推荐算法,通过对训练集进 监督学习,并对测试集进预测,从 达到预测的 的.

监督学习: 

        对没有概念标记(分类) 的训练样本进 学习, 以发现训练样本集中的结构性知识。这 所有的标记 (分类)是未知的。 因此 ,训练样本的岐义性。聚类就是典型的无监督学习。监督学习的典型例 就是决策树、神经以及疾病监测, 而无 监督学习就是很早之前的西 洋双陆棋和聚类。

8、有了解过哪些机器学习的算法?

问题分析:

        考官主要考察的是学员是否对于人工 智能方面 的感兴趣 ,是否有空闲时间了解过机器学习算法这方面 的知 ,有则更好。

答案讲解:

        学员需要根据自己 的实际情况去回答 ,学员也可以自己 课下空余的时间去掌握 两常的机器学习算法,以此来增  的筹码。

决策树模型:

构建决策树三要素

1、特征选择

信息熵---信息增益---信息增益

H(x) = -sum(pi*log(pi))

Gain(A) =Info(D)-Info_A(D)

43Gini Gini系数是对信息熵关于ln(x)在x =0处的 阶泰勒展开近似得到是信息GIni系数

2、决策树的构成

ID3算法:

算法输:特征和样本构成的数据集

算法输出: ID3的决策树

算法步骤:

(1)如果所有的属性都被处理完毕

(2)计算各个节点的信息增益 ,选择最的信息增益所代表的特征构建决策树(信息熵--sum(pi*log(pi)))

(3)如果上述的属性没有处理完毕 ,需要从剩余的属性中继续获取其他的信息增益较的值对应的特征。

(4)递归构建决策树算法模型算法优化

选择信息增益率--C4.5算法算法的停 迭代条件:

(1)迭代次数

(2)树的深度

(3)树的叶 节点的个数

(4)树的分 节点含有样本的个数

(5)树的最 不纯度的下降

(Cart树---gini系数)

3、决策树剪枝

先剪枝

后剪枝

问题扩展:

        在算法的推导过程中 ,会 量的使到数学的推导公式,  数学思想对于程序员来说是必不可缺的 种思想 ,可以 在讲解的时候 ,概括性的给学员讲 下数学的相关知识。

        信息熵数学公式(sum(pi*log(pi)))+信息增益数学公式(总体的信息熵-以A节点作为划分节点的信息熵)

结合项中使用:

        此问题在项目 中是没有什么体现的,  试官就是想考察  试者本身具有的学习能 以此来评估该试者的可 培养价值 ,以及潜。但是机器学习算法在推荐系统 中、以后数据挖掘 作中会起到 关重要作 

9、你对LR是怎么理解的? LR的损失函数是怎样的?

先,LR是逻辑斯特回归 ,是分类算法。

        LR的原理是在线性回归的基础上增加  线性函数 ,这里 用 的是sigmod函数 ,得到的结果是以概率的形式输出类别的结果。

        LR的损失函数是似然函数 ,似然函数的log对数的形式 ,得到是交叉熵损失 ,对应的是分类中最重要交叉熵损失函数。

        交叉熵损失和其他的损失函数区别就在于交叉熵损失是定义在概率分布基础上的, 它通常是被于基于多项式的逻辑斯 特回归和神经 络中 ,还有 EM算法中。对数损失是来度量分类器的预测输出的概率分布和真是分布的差距,  不是 较离散类标签是否相等。

10、二分类模型如何做多分类?

        决策树中ID3和C4.5算法都是可以解决多分类问题 logisticModelSVM只能解决 分类问题,如何将二分类问题拓展到多分类上 ,使 法有两种:

Ovo-One vs one :通过将任意两个分类的组合形式来进 多分类

Ovr-One vs rest: C( n,2)f分类结果

scikit-learn: machine learning in Python

11、KMeans算法和KNN算法区别?

KMeans算法是聚类的算法, KNN 个分类算法

        KNN是通过K值设定最近邻的个数,通过当前样本点到各个点之间的距离的求解,通过少数服从多数的投票原则划分当前样本点

        KMeans通过K值设定有 个聚类中,通过将各个样本点到聚类中的距离 ,将离中 点最 距离的样本 组合 ,从   将样本点分成不同的簇 ,通过均值的 法迭代聚类,直到迭代次数或mse误差或聚类 不在改变停 迭代。

12、请问GBDT和XGBoost的区别是什么?

        XGBoost类似于GBDT的优化版 ,不论是精度还是效率上都有了提升。与GBDT ,具体的优点有:

        损失函数是用 泰勒展式 项逼近  不是像GBDT的就是阶导数;对树的结构进了正则化约束 ,防模型过度复 杂, 降低了过拟合的可能性;节点分裂的 式不同, GBDT的基尼系数 XGBoost是经过优化推导后的分裂增益。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/920802.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/920802.shtml
英文地址,请注明出处:http://en.pswp.cn/news/920802.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python如何下载svg图片

# 生成博客文章框架代码 import datetimeblog_content f"""# Python如何下载SVG图片## 引言 SVG(可缩放矢量图形)作为一种基于XML的矢量图形格式,在Web开发中广泛应用。本文将介绍如何使用Python从网络下载SVG图片&#xff0…

Linux(一) | 初识Linux与目录管理基础命令掌握

个人主页-爱因斯晨 文章专栏-Linux 最近学习人工智能时遇到一个好用的网站分享给大家: 人工智能学习 文章目录个人主页-爱因斯晨文章专栏-Linux一、前言1.为什么学习Linux2.操作系统概述:3.常见的操作系统:二、初识Linux1.诞生2.什么是Linux…

android-studio 安装

下载地址 国内:https://developer.android.google.cn/studio?hlzh-cn 全国:https://developer.android.com/studio 1.设置 ANDROID_HOME 环境变量 ANDROID_HOME D:\zhy\android-studio\sdk 2. 更新 PATH 环境变量 %ANDROID_HOME%\platform-tools %AN…

【重学MySQL】九十三、MySQL字符集与比较规则完全解析

【重学MySQL】九十三、MySQL字符集与比较规则完全解析一、字符集概述1.1 支持的字符集1.2 UTF8与UTF8MB4的区别二、比较规则(Collation)2.1 比较规则分类2.2 常见比较规则差异三、配置层级与继承关系3.1 配置层级3.2 继承关系四、最佳实践与问题解决4.1 …

基于Kafka的延迟队列

实现原理 通过topic区分不同的延迟时长,每个topic对于一个延迟,比如 topic100 仅存储延迟 100ms 的消息,topic1000 仅存储延迟 1s 的消息,依次类推。生产消息时,消息需按延迟时长投递到对应的topic。消费消息时&#x…

LabVIEW转速仪校准系统

LabVIEW 与机器视觉的智能校准系统以工控机为核心,整合标准源、智能相机等硬件,通过软件实现校准流程自动化,支持 500-6000r/min 转速范围校准,覆盖 5 类转速测量仪,校准时间缩短约 70%,满足计量院高效、精…

Synchronized 概述

1. 初识 synchronized 是 Java 中的关键字,是一种 同步锁 ,可重入锁,悲观锁。它修饰的对象有以下几种: 具体表现为以下3种形式。 对于普通同步方法,锁是当前实例对象。 对于静态同步方法,锁是当前类的 Clas…

通过Auth.log来查看VPS服务器是否被扫描和暴力破解及解决办法

说明:很多人vps可能出现过被扫的情况,有的还被爆破了,这里提供下查看方法 查看用密码登陆成功的IP地址及次数grep "Accepted password for root" /var/log/auth.log | awk {print $11} | sort | uniq -c | sort -nr | more查看用密…

碰一碰发视频手机版源码开发:支持OEM

**从事开发 20 年,见过不少技术风口起起落落,最近 “碰一碰发视频” 又成了热门话题。不少同行或刚入行的年轻人来问我,手机版源码开发该从哪下手,怕踩坑、怕走弯路。今天就以一个老程序员的视角,把碰一碰发视频手机版…

只出现一次的数字(总结)

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录前言一、给定一个整数数组nums,除了某个元素只出现一次以外,其余元素均出现两次。找出那个只出现一次的元素二、给你一个整数数组nums&#x…

Cesium 入门教程(十一):Camera相机功能展示

文章目录一,Cesium 实际示例(含源代码)1,vuecesium: 围绕一个固定点自动左右旋转2,vuecesium: flyto一个具体的实体位置3,vuecesium: flyto一个具体的点位置4&#xff0c…

go语言基本排序算法

package mainimport "fmt"func main() {BubbleSort()SelectSort()InsertSort()MergeSort()QuickSort()HeapSort()ShellSort() }//冒泡排序 func BubbleSort() {str : []int{9, 1, 5, 8, 3, 7, 4, 6, 2}for i : 0; i < len(str)-1; i {flag : falsefor j : len(str…

一步完成CalDAV账户同步,日历服务助力钉钉日历日程集中管理

在信息爆炸节奏飞快的今天&#xff0c;高效的管理时间已经成为我们工作和生活中的核心竞争力&#xff0c;复杂纷繁的日程安排&#xff0c;无处不在的提醒需求以及跨设备同步的困扰&#xff0c;这些问题仿佛都在呼唤着一个更智能、更便捷、更可靠的解决方案。 而华为日历App&am…

企业内部机密视频安全保护|如何防止企业内部机密视频泄露?

在企业数字化进程飞速发展的今天&#xff0c;视频内容已成为承载企业内部培训、战略会议、产品机密和核心技术的关键载体。一次意外的泄露&#xff0c;不仅可能导致知识产权流失&#xff0c;更会让企业声誉和市场竞争力遭受重创。面对无孔不入的安全威胁&#xff0c;企业该如何…

C# Deconstruct | 简化元组与对象的数据提取

官方文档&#xff1a;析构元组和其他类型 - C# | Microsoft Learn 标签&#xff1a;Deconstruct、Tuple、record、模式匹配 PS&#xff1a;record相关内容后续还会继续更新&#x1f504; 模式匹配可以查看我的另一篇&#x1f449;模式匹配 目录1. 概述2. 基本用法2.1 元组解…

R 语言 ComplexUpset 包实战:替代 Venn 图的高级集合可视化方案

摘要 在生物信息学、数据挖掘等领域的集合分析中,传统 Venn 图在多维度数据展示时存在信息拥挤、可读性差等问题。本文基于 R 语言的 ComplexUpset 包,以基因表达研究为场景,从包安装、数据准备到可视化实现,完整演示如何制作正刊级别的集合交集图,解决多条件下差异基因(…

​导游|基于SprinBoot+vue的在线预约导游系统

在线预约导游系统 基于SprinBootvue的在线预约导游系统 一、前言 二、系统设计 三、系统功能设计 前台功能实现 后台功能实现 管理员模块实现 导游模块实现 用户模块实现 四、数据库设计 五、核心代码 六、论文参考 七、最新计算机毕设选题推荐 八、源码获取&am…

SQL server 异常 出现错误 824

2025-08-27 01:36:37,324 ERROR c.z.i.w.DatabaseUtils [Scheduled-7] Error executeStoredProcedure SQL script: sp_RefreshDWDByDateFive警告: 在 08 27 2025 1:36AM 出现错误 824。请记录该错误和时间&#xff0c;并与您的系统管理员联系。 2025-08-27 01:36:37,332 ERROR …

制造业生产线连贯性动作识别系统开发

制造业生产线连贯性动作识别系统开发 第一部分&#xff1a;项目概述与理论基础 1.1 项目背景与意义 在现代智能制造环境中&#xff0c;尽管自动化程度不断提高&#xff0c;但人工操作仍然在复杂装配任务中扮演着不可替代的角色。研究表明&#xff0c;人机协作被视为打破传统人机…

什么是Jmeter? Jmeter工作原理是什么?

&#x1f345; 点击文末小卡片&#xff0c;免费获取软件测试全套资料&#xff0c;资料在手&#xff0c;涨薪更快 第一篇 什么是 JMeter&#xff1f;JMeter 工作原理 1.1 什么是 JMeter Apache JMeter 是 Apache 组织开发的基于 Java 的压力测试工具。用于对软件做压力测试&a…