二手车交易价格预测
- 数据来源
- 数据特征探索
- 构建模型
- 参考
数据来源
天池 https://tianchi.aliyun.com/competition/entrance/231784/information
数据特征探索
目标特征工程做好之后,能同时进行 lightgbm catboost 神经网络等模型,所以尽量都转换为数值类特征。 如果仅仅是使用catboost模型,则直接保留类别类特征。
-
使用ydata_profiling 生成数据探索报告
虽然快速,但是个人还是偏向自己写代码逐步探索 是否有缺失 数据分布情况 等 -
逐步探索
加载数据
import pandas as pd
train_data =