内容覆盖使用GPT处理数据、生成论文摘要、文献综述、技术方法分析等实战案例,将AI技术广泛应用于科研工作。特别关注将GPT与Python结合应用于遥感降水数据处理、ERA5大气再分析数据的统计分析、干旱监测及风能和太阳能资源评估等大气科学关键场景。旨在提升参与者在数据分析、趋势预测和资源评估等方面的能力,激发创新思维,并通过实践操作深化对AI在气象数据分析中应用的理解。

专题一 预备知识

1.AI领域常见工具模型

1.1OpenAI模型-GPT-4 1.2谷歌新模型-Gemini

1.3 Meta新模型-LLama 1.4科大讯飞-星火认知

1.5百度-文心一言 1.6MoonshotAI-Kimi

2.POE平台及ChatGPT使用方法

2.1POE使用方法 2.2ChatGPT使用方法

3.提示词工程

3.1提示词工程介绍 3.2提示词工程 3.3提示词常见模板

4.Python简明教程

4.1 Python基本语法 4.2 Numpy使用 4.3 Pandas使用 4.4 Xarray使用 4.5 Matplotlib使用

专题二 科研辅助专题

1.GPT作为科研工具

1.1把GPT当作搜索引擎

1.2把GPT当作翻译软件

1.3把GPT当作润色工具

1.4用GPT提取整理文章数据

1.5用GPT数据处理

2.GPT作为科研助手生成

2.1用GPT分析结果

2.2用GPT总结生成论文摘要

2.3用GPT总结生成文献综述

2.4用GPT分析论文技术方法

2.5用GPT分析代码

2.6用GPT分析论文公式

2.7用GPT识别图片并分析

2.8 DIY:上传本地PDF资料

用GPT分析相关资料中提出问题

用GPT总结评价(评阅、审稿意见)

3.GPT作为辅助工具下载数据

3.1使用GPT生成PERSIANN /GSMaP数据的下载代码

3.2使用GPT生成代码下载GSOD数据

3.3使用GPT生成代码下载NCEP/NCAR再分析数据

3.4使用GPT生成代码下载GFS预报数据

专题三 可视化专题

1.绘制常见统计图

2.绘制风场图、风羽图、风矢图、流线图

3.通过GPT绘制双Y轴

4.风玫瑰图

5.填充图

6.绘制添加子图

7.绘制期刊常见图

专题四 站点数据处理

使用GPT处理/生成相应代码,实现下列目标:

1.读取多种来源原始数据(ISD、GSDO)

2.缺失值处理

2.1缺失值统计

2.2常见统计方法缺失值填补

2.3机器学习方法填补数据

3.数据质量控制

3.1基于统计阈值的异常检测

3.2基于机器学习的异常检测(Isolation Forest等方法)

3.3多变量数据的异常检测(服务于自动气象站数据)

3.4基于时间序列方法均一化检验(服务于长时间气候变化评估)

4.时间序列的趋势

4.1移动平均法

4.2分解法(STL, Seasonal and Trend decomposition using loess)

4.3 Sen’s斜率

5.时间序列的突变检验

5.1 MK (Mann-Kendall): Mann-Kendall趋势检验(用于分析数据集中的趋势变化)

5.2 Pettitt: Pettitt检验(非参数检验方法,用于检测时间序列中的单一变化点)

5.3 BUT (Buishand U Test): Buishand U型统计检验

5.4 SNHT (Standard Normal Homogeneity Test): 标准正态同质性检验(常用于气候数据的同质性检测)

5.5 BG (Buishand Range Test): Buishand范围检验

6.时间序列周期分析

6.1功率谱方法提取周期(提取气温、降水等周期)

6.2小波分析方法提取周期

6.3EMD经验模态分解

6.4EEMD集成经验模态分解

7.不同时间尺度上的统计

8.回归分析

8.1线性回归(Linear Regression):简单线性回归、多元线性回归等

8.2多项式回归(Polynomial Regression):

8.3非参数回归(Non-parametric Regression):

9.相关分析

9.1常见的相关系数(Pearson Correlation Coefficient、Spearman's Rank Correlation Coefficient)

9.2偏相关分析(Partial Correlation)

9.3典型相关分析(Canonical Correlation Analysis, CCA)

10.站点数据的空间化

10.1克里格插值

10.2临近点插值

10.3反距插值

10.4基于高程模型的外推

专题五 WRF专题

1.静态数据的替换

1.1使用Python生成WPS的静态数据

A替换反照率和LAI数据

GPT生成转化GLASS(The Global Land Surface Satellite (GLASS) Product suite)替换默认粗分辨率数据。

B替换土地利用

GPT将多分类的ECI CCI土地利用数据分类进行整合,使之能够用于WPS系统;GPT生成转化代码,将数据转化为WPS可读取的二进制格式

使用Python更改WRF初始场

GPT生成代码修改WRF初始场文件,并替换土地利用、地表反照率等静态数据

2.生成WRF配置文件

2.1在指定的地区推荐WRF namelist.input文件相关参数

2.2补全相关参数信息

3.WRF的后处理

3.1站点插值

3.2能见度计算

3.3垂直高度变量插值

3.4降水相态辨识

3.5水汽通量

4.WRF的评估

4.1格点尺度评估

4.2点尺度评估

4.3模态评估

专题六 遥感降水专题

1.将PERSSIAN/GSMaP数据转化为netCDF格式

2.合并数据

3.时间域统计并可视化

4.空间域统计并可视化

5.常见统计评估指标

生成统计指标空间图

生成泰勒图

生成卫星降雨散点密度图

专题七 再分析数据专题

1.ERA5再分析数据

1.1ERA5数据的下载 1.2ERA5数据预处理 1.3多时间尺度统计 1.4干旱监测

计算标准化降水蒸散指数(SPEI)或标准化降水指数(SPI)作为干旱监测的指标。

根据土壤湿度和降水量数据,使用时间序列分析和阈值判断来评估干旱风险等级。

1.5极端指数计算

连续干旱天数夏日指数R99极端降水指数等

1.6趋势分析

滑动平均累积距平趋势分析代码时间序列分析

2.多套再分析数据的气候趋势分析

2.1对比NCEP/NCAR、ERA5、CRU等均值 2.2趋势分析

3.风能资源评估

3.1计算研究区域内多年的平均风速

3.2计算风速的季节性变化和年际变异性

3.3计算空气密度

3.4计算盛行风

3.5计算风功率

3.6计算weibull分布

3.7基于站点和WRF模式的分析

3.8基于ERA5计算风功率

4.太阳能资源评估

4.1计算每天的平均太阳辐射量

4.2分析日、月和季节性气候态时空格局

4.3计算趋势

专题八 CMIP6未来气候专题

1.数据预处理

1.1使用NetCDF工具(xarray)读取数据 1.2裁剪时间范围和空间范围

2.计算区域平均温度

2.1对于全球平均温度加权平均 2.2对于特定区域,直接计算平均值

3.趋势分析:使用统计方法(如线性回归)分析温度随时间的变化趋势

4.可视化

4.1绘制时间序列图显示温度趋势

4.2使用地图可视化工具(basemap)展示空间分布的变化

专题九 基于机器学习方法判断天气晴雨

1.预处理

1.1缺失值处理:使用适当的策略填充或删除数据中的缺失值

1.2数据探索:通过统计摘要、可视化方法(如直方图、箱线图)来理解数据的分布、异常值情况和变量之间的关系

1.3数据标准化/归一化

1.4数据类型转换:将分类变量转换为数值型,使用独热编码(One-Hot Encoding)或标签编码(Label Encoding)

2.数据采样

2.1均衡采样:对不平衡的数据集进行重采样,确保各类别样本数量大致相同 

2.2分层抽样:确保训练集和测试集中各类别样本的比例与原数据集相同,使用分层采样技术。

2.3交叉验证分割:采用交叉验证的方法来进行更可靠的模型评估,如K折交叉验证,保证每个样本被用于训练和验证。

2.4时间序列分割:对于时间序列数据,使用时间顺序分割数据,确保训练集中的数据点时间上早于测试集中的数据点。

3.特征工程

3.1特征选择:使用统计测试、模型系数或树模型的特征重要性来选择最有信息量的特征

3.2降维:使用主成分分析(PCA)、线性判别分析(LDA)等方法减少特征的维度

3.3多项式特征:生成特征的多项式组合,如平方项、交互项,以捕捉特征之间的非线性关系

4.模型建模与堆叠

4.1单模型训练:如决策树、SVM、随机森林。

4.2模型堆叠:使用mlxtend库或自定义方法实现模型堆叠,结合不同模型的预测结果作为新的特征,训练一个新的模型。

4.3调参:使用网格搜索(GridSearchCV)或随机搜索(RandomizedSearchCV)等方法优化模型参数。

4.4集成学习:除了堆叠,还可以探索其他集成方法,如Bagging和Boosting,以提高模型的稳定性和准确性。

5.模型评估

5.1性能指标:根据问题类型(分类或回归)选择合适的评估指标,如准确度、召回率、F1分数、AUC值、均方误差

5.2模型解释性:使用SHAP对模型的预测进行解释,提高模型的可解释性


★ 点 击 下 方 关 注,获取海量教程和资源!

↓↓↓

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/86953.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/86953.shtml
英文地址,请注明出处:http://en.pswp.cn/pingmian/86953.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

STM32给FPGA的外挂FLASH进行升级

STM32给FPGA的外挂FLASH进行升级 一、电路方案设计二、软件写FLASH三、解决第一次烧录后FPGA无法启动的问题 前言: 一个复杂的嵌入式中,如果对某些实时性要求极高的情况下势必会使用到FPGA来保证,这里面牵扯到给FPGA的程序升级问题&#xff0…

Python 数据分析与可视化 Day 9 - 缺失值与异常值处理技巧

✅ 今日目标 熟练处理数据中的缺失值(NaN、None)学会识别和处理异常值(outliers)掌握常用的处理方法:填充、删除、替换、标准差法、箱型图法等为后续机器学习建模打好数据清洗基础 📚 一、缺失值处理&…

概述-1-数据库的相关概念

数据库的相关概念 用户通过SQL操作数据库管理系统,再通过数据库管理系统操作数据库以及数据库中的数据。 数据库 数据库是存储数据的仓库, 数据是有组织的进行存储, DataBase简称(DB) 数据库管理系统 操纵和管理数据库的大型软件, DataB…

可视化大屏展示

可视化大屏是一种将大量数据进行整合、分析,并以直观、形象的可视化方式展示在大屏幕上的信息展示系统。主要组成部分分为2个:硬件设备、软件系统。 一、大屏价值 1、数据可视化:将复杂的数据转化为直观的图形、图表和地图等,使数…

服务器被入侵的常见迹象有哪些?

🚨 服务器被入侵的常见迹象 🟢 一、系统和资源异常 CPU、内存或网络流量异常飙高 即使没有业务负载,资源长期占满。 磁盘空间突然被写满 可疑大文件或日志暴涨。 系统负载显著升高 uptime、top 显示 load average 异常。 🟡…

日本生活:日语语言学校-日语作文-沟通无国界(5)-题目:我的一天

日本生活:日语语言学校-日语作文-沟通无国界(5)-题目:我的一天 1-前言2-作文原稿3-作文日语和译本(1)日文原文(2)对应中文(3)对应英文 4-老师评语5-自我感想&…

前端领域的技术热点与深度解析

🔥 一、框架革新:React、Vue、Svelte 的进化方向 React 19 实验版 Server Components 深化:支持流式渲染与异步状态管理,SSR 性能提升40%。 并发模式优化:减少渲染阻塞,复杂交互场景延迟降低35%。 Vue 3…

【unity游戏开发——网络】网络游戏通信方案——强联网游戏(Socket长连接)、 弱联网游戏(HTTP短连接)

注意:考虑到热更新的内容比较多,我将热更新的内容分开,并全部整合放在【unity游戏开发——网络】专栏里,感兴趣的小伙伴可以前往逐一查看学习。 文章目录 一、联网游戏类型划分二、核心通信协议对比三、开发选择指南专栏推荐完结 …

Java-60 深入浅出 分布式服务Paxos 算法优化 如何保证Paxos算法的活性

点一下关注吧!!!非常感谢!!持续更新!!! 🚀 AI篇持续更新中!(长期更新) 目前2025年06月16日更新到: AI炼丹日志-29 - 字节…

一阶线性双曲型偏微分方程组的特征值与通解分析

问题3 求系统 U u + A U x = 0 U_u + A U_x = 0 Uu​+AUx​=0 的特征并写出通解,其中矩阵 A A A 如下: A 1 = ( 3 2 1 0 2 1 0 0 1 ) , A 2 = ( 3 2 1 0 2 1 0 0 − 1 ) , A_1 = \begin{pmatrix} 3 & 2 & 1 \\ 0 & 2 & 1 \\ 0 & 0 & 1 \end{pmatr…

解锁AI无限潜能!景联文科技数据产品矩阵再升级:多语言题库、海量语料、垂域代码库,全面赋能大模型训练

景联文科技持续聚焦AI数据需求前沿,全新发布包含中文题库数据集、英文题库数据集、算法代码数据库、英文语料、中文语料、垂直领域数据、小语种数据在内的七大高质量数据集产品系列。 此次发布的数据集覆盖广泛的应用场景,通过严格的清洗与结构化处理&am…

OSPF(开放最短路径优先)

一、ospf简介 OSPF是基于链路状态的内部网关协议,与距离矢量协议不同,链路状态协议通告的是链路状态而不是路由表。OSPF是用于自治系统(AS)内部的路由决策,特点有,收敛速度快,安全性好,避免环路…

全面拥抱vue3

Vue 3 性能全面解析:为何性能飞跃提升 Vue 3 在性能方面实现了质的飞跃,相比 Vue 2 在多个维度都有显著提升。以下是 Vue 3 性能优化的全面解析: 一、核心架构优化 1. 响应式系统重写(Proxy 替代 defineProperty) …

C#最佳实践:考虑为类重写ToString()方法

C#最佳实践:考虑为类重写ToString()方法 在 C# 编程的日常开发中,ToString()方法是一个既基础又容易被忽视的重要成员。它是System.Object类的虚方法,所有类都继承自System.Object,这意味着每个类都拥有ToString()方法。然而,默认的ToString()方法往往无法满足实际需求,…

从0开始学习计算机视觉--Day05--优化

除了得到最小的W之外,如何节省这个探索最优W的过程,也是很重要的一点。假如把这个过程比作从山上的顶点开始下山,把图中必定游玩的经典比作最优权重,那么节省的过程,就是找到下山的最短路径的过程。而在下山的过程中&a…

OpenCV计算机视觉实战(14)——直方图均衡化

OpenCV计算机视觉实战(14)——直方图均衡化 0. 前言1. CLAHE 自适应均衡1.1 应用场景1.2 实现过程 2. 直方图反向投影2.1 应用场景2.2 实现过程 3. 基于颜色的目标追踪小结系列链接 0. 前言 在图像处理与计算机视觉领域,直方图技术是最直观且…

基于uniapp的老年皮肤健康管理微信小程序平台(源码+论文+部署+安装+售后)

感兴趣的可以先收藏起来,还有大家在毕设选题,项目以及论文编写等相关问题都可以给我留言咨询,我会一一回复,希望帮助更多的人。 系统背景 近年来,我国人口老龄化进程不断加快,据国家统计局数据显示&#…

MySQL(106)如何设计分片键?

设计分片键(Sharding Key)是数据库分片的核心,它决定了将数据分配到不同分片的方式。一个好的分片键应该能够均衡地分布数据,避免热点问题,提高查询性能。下面将详细介绍如何设计分片键,并结合代码进行说明…

汽车一键启动升级手机控车

汽车一键启动升级手机控车实现手机远程启动,不改变原车任何功能且全部免接线。升级后原车遥控器能在有效范围内启动车辆。移动管家手机控车一键启动系统用手机远程控制,完美兼容原车遥控器。支持长安、别克、宝马、奥迪等众多系列车型,市场99…

【开源项目】「安卓原生3D开源渲染引擎」:Sceneform‑EQR

「安卓原生3D开源渲染引擎」:Sceneform‑EQR 渲染引擎 “那一夜凌晨3点,第一次提交 PR 的手在抖……”——我深刻体会这种忐忑与激动。 仓库地址:(https://github.com/eqgis/Sceneform-EQR)。 一、前言:开源对我意味着什么 DIY 的…