一.扫盲

(一)、pandas 是什么

pandas 是 Python 的一个第三方数据处理库,它提供了高效、灵活的数据结构(如 Series 和 DataFrame),能方便地对结构化数据进行清洗、转换、分析和处理。

(二)、pandas 与 NumPy 的关系

NumPy 是 Python 中用于科学计算的基础库,主要用于存储和处理数值型数组。但它有一个局限,就是不能直接存储和处理字符串等非数值类型的数据

而 pandas 是在 NumPy 的基础上构建的,它不仅继承了 NumPy 对数值型数据的处理能力,还扩展了对字符串、日期等多种数据类型的支持,能更好地应对复杂的结构化数据处理场景。

(三)、为何需要用 pandas 处理 Excel 文件

在日常办公中,Excel 文件是非常常用的数据存储和处理格式。但如果仅依靠 Excel 软件本身进行大量数据的复杂处理,效率往往较低。

这时候就需要用到 pandas,它可以轻松读取和写入 Excel 文件,并且能通过简洁的代码实现数据筛选、排序、分组、计算等操作,大幅提升数据处理效率。

(四)、哪些行业常用 Excel 且适合用 pandas

很多行业在工作中频繁使用 Excel,其中金融行业、投行尤为典型。这些行业需要对大量的财务数据、交易数据、市场数据等进行编排、统计和分析计算,借助 pandas 能快速完成复杂的数据处理任务,提高工作效率和准确性。

(五)、openpyxl 库

除了 pandas,还有一个名为openpyxl的 Python 库,它可以直接读取和写入 Excel 文件。同时,openpyxl 还能模拟 pandas 的部分功能,在一些特定场景下为 Excel 文件处理提供更多选择。

(六).安装

  1. 点击顶部菜单栏 “File”(文件)→ “Settings”(设置)(或直接按 Ctrl + Alt + S 快捷键打开设置)。
  2. 在设置左侧列表,找到并点击 “Project: [你的项目名称]” → “Python Interpreter”(Python 解释器) 。
  3. 在右侧 “Python Interpreter” 界面,点 + 号(“Add” 按钮),打开包搜索安装窗口,搜索你需要的第三方库(如 pandas numpy 等 ),再点击 “Install Package” 安装即可。

二.代码演示

"""
DataFrame(数据框)
就是excel表(多个Series的拼接)
"""
import pandas as pddf_1 = pd.DataFrame({'age':[10,11,12],'name':['tim', 'tom', 'rose'],'income':[100,200,300]},index=['person1', 'person2', 'person3'])
print(df_1)"""
dataframe的属性
"""
#行索引
df_1.index
#列名
df_1.columns
#值
df_1.valuesdf_1 = pd.DataFrame({'age':[10,11,12],'name':['tim', 'tom', 'rose'],'income':[100,200,300]})
print(df_1)
print(df_1.name)

在这个代码里面我们可以看到在6行 pandas 数据类型是dataframe numpy的数据类型是ndnarry

 其中

df_1 = pd.DataFrame({'age':[10,11,12],'name':['tim', 'tom', 'rose'],'income':[100,200,300]},index=['person1', 'person2', 'person3'])

在DataFrame后面的数据是可以全部强制转化表格数据的类型,

#效果展示:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/89991.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/89991.shtml
英文地址,请注明出处:http://en.pswp.cn/web/89991.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

React 英语单词补全游戏——一个寓教于乐的英语单词记忆游戏

预览:英语单词补全 📖 产品概述 英语单词大冒险是一款专为 7-12 岁儿童设计的互动式英语学习游戏。通过听音频、补全单词的游戏方式,让孩子在轻松愉快的环境中提升英语词汇能力和听力水平。 🎯 核心价值主张 寓教于乐: 将枯燥…

我的第一个开源项目 -- 实时语音识别工具

这是我的第一个开源项目,是我一直想做的一个小工具: 端到端实时语音转文字系统。 通过小程序和H5页面,用户可以实时采录音频,通过ws上传到java的netty server。 Java在经过权限验证、流量控制等操作之后,通过gRPC流…

AG32 mcu+cpld 联合编程(概念及流程)

在使用mcucpld联合编程之前,请确认已经熟练掌握mcu的使用方法,并且对cpld编程(verilog语言)有一定的基础。 另外,对AHB总线也需要有一定的了解。 这个章节分为两部分: 第一部分,展示联合编程…

Hadoop调度器深度解析:FairScheduler与CapacityScheduler的优化策略

Hadoop调度器概述在大数据处理的生态系统中,Hadoop作为分布式计算框架的核心,其资源调度机制直接决定了集群的吞吐效率和作业执行公平性。调度器作为Hadoop资源管理的中枢神经,通过协调计算资源与任务需求之间的动态平衡,成为支撑…

怎么自己搭建云手机

用闲置电脑搭建云手机 确保电脑安装 Ubuntu 20.04(或其他支持Docker的Linux系统)。 安装 Docker(运行云手机的核心工具)安装Redroid(安卓容器)运行安卓容器就欧克啦。 用云服务器搭建(适合长…

网关:数据翻译、中转、协议转换与边缘计算

网关(Gateway)详解:翻译与中转站的核心作用 在计算机网络中,网关(Gateway)是一个非常重要的概念。它本质上是一个“翻译中转站”,其主要作用是将不同网络之间的数据进行“翻译”,并确…

UE5多人MOBA+GAS 番外篇:使用ECC(UGameplayEffectExecutionCalculation)制作伤害计算的流程

文章目录定义一些属性用于作为伤害基础还有获取要打出去的伤害创建一个ECC(里面执行伤害的计算)在执行ECC的GE之前需要修改ECC需要调用的值,也可以不改直接计算在属性中监听ECC输出的那个值然后处理扣血定义一些属性用于作为伤害基础还有获取…

SpringBoot实战0-5

接口文档:通俗的讲,接口文档能告诉开发者接口能返回的数据,以及为了获取这些数据,开发者需要输入什么样的数据,请求哪个接口(即规范)为什么使用接口文档:1、项目开发过程中前后端工程…

二、SpringBoot-REST开发

rest开发(表现形式转换): 1、优点:隐藏访问资源的行为,无法通过地址得知对资源是何种操作,书写简化 2、GET查询 POST 新增/保存 PUT(修改/更新) DELETE(删除)…

大数据之路:阿里巴巴大数据实践——离线数据开发

数据开发平台 统一计算平台MaxCompute:主要服务于海量数据的存储和计算 ,提供完善的数据导入方案, 以及多种经典的分布式计算模型,提供海量数据仓库的解决方案,能够更快速地解决用户的海量数据计算问题,有效…

我的网页聊天室设计

一、需求分析1.用户管理模块注册功能实现一个注册页面。注册页面上包含了一个输入框,输入用户名和密码. 注册成功后可以跳转到登录页面.登录功能实现一个登录页面。登录页面上包含一个输入框。输入用户名和密码. 登录成功后可以跳转到主页面.2.主界面用户信息左上角…

数据结构自学Days10 -- 二叉树的常用实现

✅ 一、为什么要学习二叉树? 1. 📦 组织数据的高效方式 二叉树可以快速插入、删除、查找数据,尤其在平衡时,时间复杂度为 $O(\log n)$。 适合表示分层结构(如组织结构、文件系统、语法树)。 2. &#x…

Java注解家族--`@ResponseBody`

ResponseBody ResponseBody是 Spring 框架中的一个注解,在基于 Spring 的 Web 开发中扮演着重要角色,以下是对它的详细总结: 1.定义与基本功能 定义:ResponseBody注解用于将 Controller 方法的返回值,通过适当的 HttpM…

react-window 大数据列表和表格数据渲染组件之虚拟滚动

简介 React Window 是一个高效的 React 组件库,专为渲染大数据列表和表格数据而设计。它通过”虚拟化”技术(也称为”窗口化”或”列表虚拟化”)解决了在 React 应用中渲染大量数据时的性能问题。与传统方法不同,React Window 只…

Eltable tree形式,序号列实现左对齐,并且每下一层都跟上一层的错位距离拉大

要的是如图所示效果序号加个class-name写样式然后给eltable加indent属性就可以了,我设置的25

FOC算法中SIMULINK一些常用模块(2)-Permanent Magnet Synchronous Machine模块

一,介绍这三个模块一起介绍了,由左到右,分别是电源模块,驱动模块和电机模块。主要介绍一下电机模块二,DC Voltage SourceDC Voltage Source 模块是用于表示直流电压源的基本组件,可以提供恒流直压&#xff…

RPG62.制作敌人攻击波数二:攻击ui

1。经典创建userwidget,使用xmbtextblock,结构如下。然后设置动画与音频,上下的参数是一样的,转到图表打开BP_SurvialGameMode2.再创建一个widget,结构如下新添的动画打开XMBGameModeBase,创建构造函数AXMB…

DL00691-基于深度学习的轴承表面缺陷目标检测含源码python

DL00691-基于深度学习的轴承表面缺陷目标检测含源码python

Word 中为什么我的图片一拖就乱跑,怎么精确定位?

核心原因:文字环绕方式 (Text Wrapping) 问题的根源在于图片的**“文字环绕”**设置。 默认状态:“嵌入型” (In Line with Text) 当您插入一张图片时,Word默认会把它当作一个巨大的文字字符来处理。这就是为什么您拖动它时,它会像…

Linux物理地址空间入门:从硬件到内核内存的基石

目录 一、物理地址空间是什么? 二、物理地址空间的构成:不仅仅是内存 三、Linux内核如何管理物理地址空间 (1)物理内存的碎片化问题 (2)物理地址的分区管理 (3)物理地址与内核…