基于spark的澳洲光伏发电站选址预测

项目概况

[👇👇👇👇👇👇👇👇]
点这里,查看所有项目
[👆👆👆👆👆👆👆👆]

数据类型

光伏发电站数据

开发环境

centos7

软件版本

python3.8.18、hadoop3.2.0、hive3.1.2、spark3.1.2、mysql5.7.38、scala2.12.18、jdk8、sqoop1.4.7

开发语言

python、Scala、Java

开发流程

数据上传(hdfs)->数据清洗(spark)->数据分析(spark)->机器学习(spark)->数据存储(mysql)->后端(springboot)->前端(vue)

可视化图表

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

操作步骤

启动MySQL


# 查看mysql是否启动 启动命令: systemctl start mysqld.service
systemctl status mysqld.service
# 进入mysql终端
# MySQL的用户名:root 密码:123456
# MySQL的用户名:root 密码:123456
# MySQL的用户名:root 密码:123456
mysql -uroot -p123456

创建MySQL库


CREATE DATABASE IF NOT EXISTS recommendation CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;

启动Hadoop


# 离开安全模式: hdfs dfsadmin -safemode leave
# 启动hadoop
bash /export/software/hadoop-3.2.0/sbin/start-hadoop.sh

准备目录


mkdir -p /data/jobs/project/
cd /data/jobs/project/# 解压 "16个地点完整光伏数据.zip"
# 上传 "16个地点完整光伏数据" 目录下 "所有" csv文件 到 "/data/jobs/project/" 目录# 5-Site_1.csv
# 6-Site_3-C.csv
# 8-Site_5.csv
# 10-Site_2.csv
# 11-Site_4.csv
# 52-Site_33-REC.csv
# 56-Site_30-Q-CELLS.csv
# 78-Site_2-eco-Kinetics.csv
# 79-Site_7-First-Solar.csv
# 87-Site_1B-Trina.csv
# 89-Site_5-Kyocera.csv
# 91-Site_1A-Trina.csv
# 93-Site_8-Kaneka.csv
# 212-Site_25-Hanwha-Solar.csv
# 213-Site_24-Q-CELLS.csv
# 218-Site_9A-Solibro.csv

上传文件到hdfs


cd /data/jobs/project/hdfs dfs -mkdir -p /data/input/
hdfs dfs -rm -r /data/input/*
hdfs dfs -put 5-Site_1.csv /data/input/
hdfs dfs -put 6-Site_3-C.csv /data/input/
hdfs dfs -put 8-Site_5.csv /data/input/
hdfs dfs -put 10-Site_2.csv /data/input/
hdfs dfs -put 11-Site_4.csv /data/input/
hdfs dfs -put 52-Site_33-REC.csv /data/input/
hdfs dfs -put 56-Site_30-Q-CELLS.csv /data/input/
hdfs dfs -put 78-Site_2-eco-Kinetics.csv /data/input/
hdfs dfs -put 79-Site_7-First-Solar.csv /data/input/
hdfs dfs -put 87-Site_1B-Trina.csv /data/input/
hdfs dfs -put 89-Site_5-Kyocera.csv /data/input/
hdfs dfs -put 91-Site_1A-Trina.csv /data/input/
hdfs dfs -put 93-Site_8-Kaneka.csv /data/input/
hdfs dfs -put 212-Site_25-Hanwha-Solar.csv /data/input/
hdfs dfs -put 213-Site_24-Q-CELLS.csv /data/input/
hdfs dfs -put 218-Site_9A-Solibro.csv /data/input/
hdfs dfs -ls /data/input/

程序打包


cd /data/jobs/project/# 对 "project-spark-station-prediction" 目录下的项目 "project-spark-station-prediction" 进行打包
# 打包命令: mvn clean package -Dmaven.test.skip=true# 上传 "project-spark-station-prediction/target/" 目录下的 "project-spark-station-prediction-jar-with-dependencies.jar" 文件 到 "/data/jobs/project/" 目录

spark数据清洗


cd /data/jobs/project/# 上传 "脚本" 目录下的 "data_clean.sh" 文件/ 到 "/data/jobs/project/" 目录sed -i 's/\r//g' data_clean.sh
bash data_clean.sh

spark数据分析


cd /data/jobs/project/# 计算不同地区有效功率大于指定值的数量
# 计算各地区的分位数
spark-submit \
--master local[*] \
--driver-memory 512m \
--executor-memory 512m \
--num-executors 4 \
--executor-cores 1 \
--class org.example.StationAnalysisApp \
/data/jobs/project/project-spark-station-prediction-jar-with-dependencies.jar

机器学习


cd /data/jobs/project/spark-submit \
--master local[*] \
--driver-memory 512m \
--executor-memory 512m \
--num-executors 4 \
--executor-cores 1 \
--class org.example.StationPredictModelApp \
/data/jobs/project/project-spark-station-prediction-jar-with-dependencies.jar# 同样的特征,在不同位置,预测的结果对比,可以体现出哪个地区位置更加优越
spark-submit \
--master local[*] \
--driver-memory 512m \
--executor-memory 512m \
--num-executors 4 \
--executor-cores 1 \
--class org.example.StationPredictOneApp \
/data/jobs/project/project-spark-station-prediction-jar-with-dependencies.jar

启动后端


# 已安装 "jdk8" 和 "maven" 环境# 启动springboot
# 打包命令: mvn clean package -Dmaven.test.skip=true
# 入口类: org.apophis.Application

启动前端

使用hdfs dfs -rm -r /user/example/test删除目录后,立刻上传,不一定能成功,因为文件流未完全关闭,需要等一会儿


# 已安装 "node" 环境# 启动前端
npm install --registry=https://registry.npmmirror.com
npm run dev

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/922383.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/922383.shtml
英文地址,请注明出处:http://en.pswp.cn/news/922383.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Kibana 双栈网络(Dual-Stack)支持能力评估

#作者:Unstopabler 文章目录一.测试目标二.测试环境三.Kibana1、查询 Kibana pod信息2、查询Kibana service信息3、Kibana service 设置四.验证测试1、Kibana 监听参数设置2、Kibana节点IPv4状态检查3、Kibana节点IPv6…

标准CAN帧介绍

标准CAN帧介绍标准CAN(Controller Area Network)结构1.帧起始(SOF-Start Of Frame)2.仲裁段(Arbitration Field)3.控制段(Control Field)4.数据段(Data Field&#xff09…

easyPoi实现动表头Excel的导入和导出

easyPoi实现动表头Excel的导入和导出 Maven依赖 !-- EasyPoi 核心依赖 --><dependency><groupId>cn.afterturn</groupId><artifactId>easypoi-base</artifactId><version>4.4.0</version></dependency><!-- EasyPoi Web…

疯狂星期四文案网第67天运营日记

网站运营第67天&#xff0c;点击观站&#xff1a; 疯狂星期四 crazy-thursday.com 全网最全的疯狂星期四文案网站 运营报告 今日访问量 今日搜索引擎收录情况

CAS理解

CAS&#xff08;Compare And Swap&#xff09; 是非阻塞同步的实现原理&#xff0c;它是CPU硬件层面的一种指令&#xff1b; CAS制定操作包含三个参数 内存值&#xff08;内存地址&#xff09;v预期值E新增值N 当CAS指令执行时&#xff0c;当且仅当预期值E和内存值V相同时&…

【SQL】指定日期的产品价格

目录 题目 分析 代码 题目 产品数据表: Products ------------------------ | Column Name | Type | ------------------------ | product_id | int | | new_price | int | | change_date | date | ------------------------ (product_id, chang…

《突破Unity+腾讯云联机瓶颈:多人游戏同步延迟与数据安全的双维度优化》

在Unity开发的多人联机游戏中&#xff0c;腾讯云的云服务器&#xff08;CVM&#xff09;、游戏多媒体引擎&#xff08;GME&#xff09;与云数据库&#xff08;CDB&#xff09;共同构成了联机体验的核心支撑。但随着玩家并发量提升与游戏玩法复杂度增加&#xff0c;“实时同步延…

BisenetV1/2网络以及模型推理转换

BisenetV1/2网络以及模型推理转换 文章目录BisenetV1/2网络以及模型推理转换1 BiSenetV11.1 Contex Path1.2 Spatial Path1.3 ARM1.4 FFM1.5 backbone2 模型推理代码流程分析2.1 加载模型2.2 模型推理① 转换张量② 输入尺寸调整③ 模型推理④ 输出尺寸还原⑤ 类别预测⑥ 保存绘…

Android开发-文本输入

一、EditText 基础&#xff1a;不仅仅是输入框EditText 是 TextView 的子类&#xff0c;允许用户输入和编辑文本。1. 基本布局<EditTextandroid:id"id/et_username"android:layout_width"match_parent"android:layout_height"wrap_content"an…

数据化存储菜单,国际化方案

djangoclass Menu(models.Model):parent_id models.BigIntegerField(default0, verbose_name父菜单ID)name models.CharField(max_length50, verbose_name菜单名称)icon models.CharField(max_length50, blankTrue, nullTrue, verbose_name菜单图标)path models.CharField(…

SQL-用户管理与操作权限

在 SQL 中&#xff0c;用户管理和权限操作是数据库安全管理的核心组成部分&#xff0c;用于控制 “谁能访问数据库” 以及 “能对数据库做什么”。它们共同保障数据库的安全性、完整性和合规性。一、用户管理&#xff1a;控制 “谁能访问数据库”用户管理是指对数据库用户的创建…

计算机视觉案例分享之答题卡识别

目录 一、基本流程 二、代码实现 1. 导入工具包和定义常量 2. 辅助函数定义 2.1 坐标点排序函数 2.2 透视变换函数 2.3 轮廓排序函数 2.4 图像显示函数 3. 主程序处理流程 3.1 图像预处理 3.2 轮廓检测与透视变换 3.3 阈值处理与选项检测 3.4 答案识别与评分 我们…

Java面试问题记录(四)

四、设计模式1、设计模式6大原则1&#xff09;单一职责(一个类和方法只做一件事)、2&#xff09;里氏替换(多态&#xff0c;子类可扩展父类)、3&#xff09;依赖倒置(细节依赖抽象&#xff0c;下层依赖上层)、4&#xff09;接口隔离(建立单一接口)、迪米特原则(最少知道&#x…

高等教育学

高等教育学第一章 高等教育与高等教育学第二章 高等教育发展史2-1西方高等教育发展史2-2中国高等教育发展史第三章 高等教育理念3.1-王一军-高等教育理念的构成要素3.2-王一军-高等教育理念的主要流派第四章 高等学校教育4.1 高等学校教育制度4.2-陈何芳-高等教育办学体制 &…

unordered_map使用MFC的CString作为键值遇到C2056和C2064错误

文章目录unordered_map使用MFC的CString作为键值遇到C2056和C2064错误问题出现的背景解决方案总结unordered_map使用MFC的CString作为键值遇到C2056和C2064错误 问题出现的背景 在我的一个老工程项目中&#xff0c;使用C的std::unordered_map时&#xff0c;使用了MFC的CStrin…

Maven 本地仓库的 settings.xml 文件

本地仓库目录位置&#xff1a;C:/用户/用户名/.m2/repository 需要修改配置&#xff0c;具体的修改方法请看 ↓↓↓ 2024版 IDEA 用 Maven 创建 java 项目&#xff08;Maven 安装和配置&#xff09; <?xml version"1.0" encoding"UTF-8"?><!…

vue动画内置组件

文章目录vue动画的官方类名EnterLeaveTransition组件注意事项触发实例TransitionGroup组件注意事项触发机制实例拓展vue动画的官方类名 如下来自vue官方文档&#xff0c;提供了dom元素&#xff0c;插入Enter和删除Leave的类名 Enter v-enter-from&#xff1a;进入动画的起始…

软考中级信息安全与病毒防护知识点

### 一、核心知识点梳理这部分内容可以大致分为三个方面&#xff1a;**信息安全基本概念**、**加解密技术** 和 **恶意代码&#xff08;病毒&#xff09;防护**。#### 1. 信息安全的基本目标&#xff08;CIA三元组&#xff09; 这是所有信息安全问题的基石&#xff0c;必须熟练…

数组存储 · 行主序与列主序 | 应用 / 基地址 / 选择策略

注&#xff1a;本文为 “数组存储 行主序与列主序” 相关合辑。 英文引文&#xff0c;机翻未校。 中文引文&#xff0c;略作重排。 未整理去重&#xff0c;如有内容异常&#xff0c;请看原文。 Row major and Column Major Address calculations 按行主序和按列主序的地址计算…

在 CentOS 中安装 VirtualBox 增强功能的步骤

很好&#xff0c;你看到 /run/media/asfor/VBox_GAs_7.2.2&#xff0c;这说明你已经在 VirtualBox 中挂载了“增强功能&#xff08;Guest Additions&#xff09;”光盘&#xff0c;接下来只要手动安装就可以启用共享剪贴板、全屏分辨率、鼠标无缝移动等功能。&#x1f4dd; 在 …