一、实操

1)通用语法(常见于实操题第一块代码块)

1.读取文件数据或加载数据集等描述时

一般为以下结构:Data=pd.read_文件格式('文件名')  注意:文件名需要用‘ ’框起来,必须要有引号

文件格式有以下内容csvtxtxlsxjsonhtmlsqlparquetsasspssstatahdf5,替代文件格式的位置

2.读取前几行数据

使用.head()方法

head( n ) 方法用于读取前面的 n 行,如果不填参数 n ,默认返回 5 行。

使用句法:print(data.head(n))如果要求返回5行数据,n可不填

3.保存数据到对应文件

使用.to_文件类型方法

例如data.to_csv('文件名.csv',index = False) 即将data中的数据保存到csv格式的文件 文件名.csv文件中

4.删除空值或异常值

使用drop或dropna语法

  • drop 是按 行标签(index)或列标签(columns) 删除整行/整列,你必须告诉它"删掉第几行或第几列"。

  • dropna 是按 缺失值的位置 删除行/列,你只需告诉它"哪一列有缺失就删哪一行",不需要知道具体行号。

  • dropna(subset=['列名']) = "只要这一列缺值就删该行,别的列缺不缺我不管"。

2)实操题看到关键字常用语法

关键字:归一化,标准化,或scaler

看到归一化,标准化,或scaler这些关键字,写如下格式的代码
scaler.fit_transform(data[numerical_features])
其中scaler是抄上文,fit_transform是固定用法,括号里的参数是被标准化的对象,抄前文。

关键字:转换数据类型

看到将什么转换成数据类型时,迅速想到pandas.to_numeric(转换的数据)

类似以下格式

df['horsepower'] = pd.to_numeric(df['horsepower'], errors='coerce')

这里我要转换的数据是加载的数据集df中的horsepower列 注:多关注使用的符号例如[]和''

关键字:划分为训练集和测试集

看到划分数据集想到train_test_split语法例如以下语句

X_train, X_test, y_train, y_test = train_test_split(X,y,test_size=0.2, random_state=42)

这里定义了X为训练集,y为测试集,使用train_test_split语法划分,test_size=0.2代表测试集占比20%

关键字训练模型

如果出现训练模型等关键字,使用 数据.fit(训练集,测试集)例如以下代码

pipline.fit(X_train,y_train)

训练pipline数据,使用fit方法训练,训练数据为X_train,y_train

关键字:保存模型

pickle.dump(model,文件名)

文件名为题目命名文件

关键字:预测并保存结果

model.predict(X_test)02

过拟合,欠拟合通用改进点;
1 清洗数据,清洗空值,重复值和异常值。
2 扩充训练样本数,增多训练次数
3 调整特征值,加入和目标值有关的字段,去掉和目标值无关的字段
4 对样本进行标准化处理(凑数)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/99120.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/99120.shtml
英文地址,请注明出处:http://en.pswp.cn/diannao/99120.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Cherry Studio递归工具调用机制深度解析

在现代AI应用开发中,工具调用(Tool Calling)已成为大语言模型与外部系统交互的核心机制。Cherry Studio作为一款先进的AI对话客户端,实现了一套完整的递归工具调用系统,能够让AI助手在执行复杂任务时自动调用多个工具,并根据执行结果智能决策下一步操作。本文将深入解析这…

[哈希表]966. 元音拼写检查器

966. 元音拼写检查器 class Solution:def spellchecker(self, wordlist: List[str], queries: List[str]) -> List[str]:origin set(wordlist) # 存储原始单词用于完全匹配lower_to_origin {} # 存储小写形式到原始单词的映射vowel_to_origin {} # 存储元音模糊形…

正则表达式与文本三剑客(grep、sed、awk)基础与实践

正则表达式基础与实践一、正则表达式概述1. 定义正则表达式(Regular Expression,简称 RE)是用于描述字符排列和匹配模式的语法规则,核心作用是对字符串进行分割、匹配、查找、替换操作。它本质是 “模式模板”,Linux 工…

eclipse中web项目编译后的lib里面jar为空问题处理

1. 检查项目构建配置验证项目性质右键单击项目 → Properties确认项目已正确配置:​Project Facets​:确保已勾选"Dynamic Web Module"​Targeted Runtimes​:确保已选择服务器运行时(如Tomcat)检查部署程序…

C语言中的递归问题——汉诺塔问题

汉诺塔(Tower of Hanoi),又称河内塔,是一个源于印度古老传说的益智玩具。传说大梵天创造世界的时候做了三根金刚石柱子,在一根柱子上从下往上按照大小顺序摞着64片黄金圆盘。大梵天命令婆罗门把圆盘从下面开始按大小顺序重新摆放在…

ArkAnalyzer源码初步分析I——分析ts项目流程

1.前言: 鸿蒙程序分析框架ArkAnalyzer(方舟分析器) 源码地址 入门文档 2.阅读入门文档后: 本人具有一定的Java开发经验。虽然我对 TypeScript(TS)和 ArkTS 还不熟,但很多概念对我这个 Java 开…

c#基础二(类和对象,构造器调用顺序、访问级别、重写和多态、抽象类和接口)

一、类1.0对象初始化器class Student {public String name;public int age { get; set; } } internal class Program {static void Main(string[] args){ //写法一Student stunew Student();stu.name"Tom";stu.age20;//写法二Student stu2 new Student { name &qu…

Qt之快捷键、事件处理、自定义按键——完成记事本项目

快捷键我们电脑中的记事本中还支持快捷键,如“CTRLO”打开文件、“CTRLS”保存文件在Qt中使用QShortcut这个类创建快捷键在.cpp文件的构造函数中创建QShortcut对象,绑定打开文件和保存文件的槽函数放大缩小字体还是在.cpp的构造函数中编写代码Widget::Wi…

Open cascade中如何使用BRepAlgoAPI_Splitter分割一个Face

理论介绍 在OpenCASCADE几何建模内核中,BRepAlgoAPI_Splitter是一个强大的工具,用于将一个形状(Shape)用另一个形状(Tool)进行分割。这种操作在CAD建模中非常常见,比如用平面切割实体、用曲线分…

【医疗 AI】Baichuan-M2 医疗大模型:技术解读与使用方法

【医疗 AI】Baichuan-M2 医疗大模型:技术解读与使用方法1. Baichuan-M2 医疗大模型简介1.1 基本信息1.2 下载地址1.3 技术特点2. Baichuan-M2 模型技术报告2.1 摘要2.2 医学性能评估2.2.1 HealthBench基准2.2.2 中国医疗场景对比评估2.3 系统架构2.3.1 验证器系统2.…

unity pcd 二进制版 简单显示文件对象(单色)

unity Point Cloud Viewer and Tool 那个插件不支持pcd二进制,而且网上到处都是AI 我恨这种AI滥用,提供不了一点价值 好了,言归正传 可以在Point Cloud Viewer and Tool这个插件报错地方转用这个代码,具体咋结合请自行研究。 …

强大的开源文档问答工具-Kotaemon

Kotaemon 是一个基于 RAG(Retrieval-Augmented Generation)架构的开源文档问答工具,为用户提供与文档对话的智能交互体验。该项目同时服务于终端用户和开发者,具有高度的可扩展性和定制化能力。技术栈分析核心技术栈后端框架Pytho…

区块链:搭建简单Fabric网络并调用智能合约

使用docker服务搭建Hyperledger/fabric网络的详细教程,实现构建多节点的简单联盟链,并编写、调用智能合约实现投票业务。 目录 背景知识 Hyperledger Fabric 基本组件 交易(Transaction) 智能合约 实验目的 实验环境 基础依赖 安装Golang 安装do…

Web前端面试题(2)

Web前端面试题(附答案及解析)&#xff08;2025.9月最新版&#xff09;-CSDN博客 1.link 与 import 的区别和用法 主要区别 特性<link>import语法类型HTML标签CSS规则加载方式并行加载&#xff08;与其他资源同时加载&#xff09;串行加载&#xff08;必须等待主CSS文件…

Paxos协议

目录 Paxos 是什么&#xff08;What&#xff09; Paxos 的目的&#xff08;Why&#xff09; 角色与职责&#xff08;Who&#xff09; 基本流程&#xff08;How&#xff09; 常见问题与对策 什么是多数派&#xff08;Quorum&#xff09; Paxos vs Raft 异同点 Paxos 是什…

第十二篇:Qcom Camx打印实时帧率 FPS

一、第一种方式(有些低平台可能没有) adb shell setprop persist.vendor.camera.enableFPSLog TRUE adb shell setprop persist.vendor.camera.systemLogEnable TRUE adb shell setprop vendor.debug.camera.overrideLogLevels 0xff chi-cdk/core/chiframework/chxextensi…

TRAE通用6A规则+敏捷开发5S规则

网上研究别人的一些规则,也搞一份给大家 6A工作流项目规则 身份定义 你是一位资深的软件架构师和工程师,具备丰富的项目经验和系统思维能力。你的核心优势在于: 上下文工程专家:构建完整的任务上下文,而非简单的提示响应 规范驱动思维:将模糊需求转化为精确、可执行的规…

【Nginx开荒攻略】Nginx主配置文件结构与核心模块详解:从0到1掌握nginx.conf:

目录 引言 1 nginx.conf的整体结构 2 main全局块详解 2.1 核心指令解析 2.1.1 user&#xff1a;运行用户 2.1.2 worker_processes&#xff1a;工作进程数 2.1.3 pid&#xff1a;PID文件路径 2.1.4 worker_rlimit_nofile&#xff1a;文件描述符限制 2.2 main块配置示例…

【前端教程】从基础到优化:一个登录页面的完善过程

最近做了一个简单的登录页面,主要练习了文本框的onfocus与onblur事件的使用。虽然功能实现了,但仔细想想还有不少可以改进的地方。今天就来分享一下这个登录页面的开发过程和优化思路。 初始实现与解析 先来看一下最初的实现代码: <!DOCTYPE html> <html> &l…

独家 | 抖音生活服务调整:涂晴接管市场和达人运营,旭凯担任北部大区负责人

文/刀客doc(头条精选作者)刀客doc独家获悉&#xff0c;9月8日抖音生活服务完成新一轮组织调整&#xff0c;并已在内部all hands完成官宣。此次调整主要涉及北部大区、达人运营与市场部三大条线的人事轮换与汇报关系变更。核心变动如下&#xff1a;涂晴&#xff0c;原抖音生活服…