目录
- 专栏导读
- 项目简介
- 功能特性
- 📊 数据处理功能
- 📈 统计分析功能
- 🎨 可视化功能
- 📋 报告生成
- 项目结构
- 安装和使用
- 环境要求
- 安装步骤
- 使用自己的数据
- 依赖包说明
- 输出文件说明
- 静态图表(PNG格式)
- 交互式图表(HTML格式)
- 分析报告
- 核心类和方法
- ProductAnalyzer类
- 自定义和扩展
- 添加新的图表类型
- 修改分析指标
- 常见问题
- Q: 运行时出现中文显示问题
- Q: Excel文件读取失败
- Q: 图表不显示
专栏导读
🌸 欢迎来到Python办公自动化专栏—Python处理办公问题,解放您的双手
🏳️🌈 博客主页:请点击——> 一晌小贪欢的博客主页求关注
👍 该系列文章专栏:请点击——>Python办公自动化专栏求订阅
🕷 此外还有爬虫专栏:请点击——>Python爬虫基础专栏求订阅
📕 此外还有python基础专栏:请点击——>Python基础学习专栏求订阅
文章作者技术和水平有限,如果文中出现错误,希望大家能指正🙏
❤️ 欢迎各位佬关注! ❤️
项目简介
-
本项目是一个完整的商品数据分析系统,能够读取Excel格式的商品数据,进行数据清洗、统计分析和可视化展示。项目包含了多种图表类型和交互式可视化功能,适用于电商、零售等行业的商品数据分析需求。
功能特性
📊 数据处理功能
- Excel文件读取和解析
- 数据清洗和预处理
- 缺失值和异常值检测
- 数据类型转换和格式化
📈 统计分析功能
- 描述性统计分析
- 相关性分析
- 分类变量统计
- 数值变量分布分析
🎨 可视化功能
-
静态图表:
- 柱状图(商品类别分布、平均价格对比)
- 饼图(类别占比)
- 散点图(价格与销量关系)
- 热力图(变量相关性)
- 水平柱状图(品牌销量对比)
- 直方图(评分分布)
-
交互式图表:
- 交互式散点图(支持缩放、筛选)
- 交互式柱状图(动态数据展示)
- 交互式箱线图(价格分布分析)
📋 报告生成
- 自动生成Markdown格式分析报告
- 包含基本统计信息和类别分析
- 支持自定义报告内容
项目结构
7-Python实现商品读取Excel进行可视化分析/
├── requirements.txt # 项目依赖包
├── create_sample_data.py # 示例数据生成脚本
├── product_analysis.py # 主要分析脚本
├── 商品数据.xlsx # 示例商品数据
├── README.md # 项目说明文档
├── 商品分析报告.md # 生成的分析报告
├── 静态图表/ # 生成的PNG格式图表
│ ├── 商品类别分布.png
│ ├── 价格销量关系.png
│ ├── 各类别平均价格.png
│ ├── 相关性热力图.png
│ ├── 各品牌销量对比.png
│ └── 评分分布.png
└── 交互式图表/ # 生成的HTML格式交互图表├── 交互式价格销量图.html├── 交互式类别销量图.html└── 交互式价格分布图.html
安装和使用
环境要求
- Python 3.7+
- Windows/macOS/Linux
安装步骤
-
克隆或下载项目
git clone <项目地址> cd 7-Python实现商品读取Excel进行可视化分析
-
安装依赖包
pip install -r requirements.txt
-
生成示例数据(可选)
python create_sample_data.py
-
运行分析
python product_analysis.py
使用自己的数据
-
准备Excel文件,确保包含以下列:
- 商品ID
- 商品名称
- 类别
- 品牌
- 价格
- 销量
- 库存
- 评分
- 上架日期
- 成本
- 利润
- 利润率
-
修改
product_analysis.py
中的文件路径:analyzer = ProductAnalyzer('你的数据文件.xlsx')
-
运行分析脚本
依赖包说明
包名 | 版本 | 用途 |
---|---|---|
pandas | >=1.5.0 | 数据处理和分析 |
matplotlib | >=3.6.0 | 静态图表绘制 |
seaborn | >=0.12.0 | 统计图表美化 |
numpy | >=1.24.0 | 数值计算 |
openpyxl | >=3.1.0 | Excel文件读写 |
xlrd | >=2.0.0 | Excel文件读取 |
scipy | >=1.10.0 | 科学计算 |
plotly | >=5.15.0 | 交互式图表 |
jupyter | >=1.0.0 | Jupyter Notebook支持 |
输出文件说明
静态图表(PNG格式)
商品类别分布.png
- 展示各类别商品数量和占比
价格销量关系.png
- 分析价格与销量的相关性
各类别平均价格.png
- 对比不同类别的平均价格
相关性热力图.png
- 显示数值变量间的相关系数
各品牌销量对比.png
- 比较各品牌的总销量
评分分布.png
- 展示商品评分的分布情况
交互式图表(HTML格式)
交互式价格销量图.html
- 可交互的价格销量散点图
交互式类别销量图.html
- 可交互的类别销量柱状图
交互式价格分布图.html
- 可交互的价格分布箱线图
分析报告
商品分析报告.md
- 包含完整统计信息的Markdown报告
核心类和方法
ProductAnalyzer类
class ProductAnalyzer:def __init__(self, excel_file) # 初始化分析器def load_data(self) # 读取Excel数据def data_cleaning(self) # 数据清洗def descriptive_statistics(self) # 描述性统计def correlation_analysis(self) # 相关性分析def create_visualizations(self) # 创建静态图表def create_interactive_charts(self) # 创建交互式图表def generate_report(self) # 生成分析报告def run_complete_analysis(self) # 运行完整分析流程
自定义和扩展
添加新的图表类型
在 create_visualizations()
方法中添加新的图表代码:
# 示例:添加新的图表
plt.figure(figsize=(10, 6))
# 你的图表代码
plt.savefig('新图表.png', dpi=300, bbox_inches='tight')
plt.show()
修改分析指标
在 descriptive_statistics()
方法中添加新的统计指标:
# 示例:添加新的统计指标
custom_stats = self.df.groupby('类别')['新字段'].agg(['mean', 'std'])
print(custom_stats)
常见问题
Q: 运行时出现中文显示问题
A: 确保系统安装了中文字体,或修改代码中的字体设置:
plt.rcParams['font.sans-serif'] = ['SimHei', 'Microsoft YaHei']
Q: Excel文件读取失败
A: 检查文件路径是否正确,确保Excel文件未被其他程序占用
Q: 图表不显示
A: 如果在服务器环境运行,可能需要设置matplotlib后端:
import matplotlib
matplotlib.use('Agg')
注意:本项目仅供学习和研究使用,请根据实际需求进行调整和优化。
-
希望对初学者有帮助;致力于办公自动化的小小程序员一枚
-
希望能得到大家的【❤️一个免费关注❤️】感谢!
-
求个 🤞 关注 🤞 +❤️ 喜欢 ❤️ +👍 收藏 👍
-
此外还有办公自动化专栏,欢迎大家订阅:Python办公自动化专栏
-
此外还有爬虫专栏,欢迎大家订阅:Python爬虫基础专栏
-
此外还有Python基础专栏,欢迎大家订阅:Python基础学习专栏