数据集网盘下载:
链接:https://pan.quark.cn/s/0e577858dba3?pwd=FJnb
提取码:FJnb
代码仅供参考
具体可打开ipynb文件进行学习和练习:
链接:https://pan.quark.cn/s/8efbe3061fad?pwd=T47B
提取码:T47B
import pandas as pd
df = pd.read_csv('data/LJdata.csv')df.columns = ['district', 'address', 'title', 'house_type', 'area', 'price', 'floor', 'build_time', 'direction', 'update_time', 'view_num', 'extra_info', 'link']df.head()df.shapedf.info()# 需求1:找到最低的租金
df.sort_values('price', ascending=True).head(1)df.sort_values('price', ascending=False).head(1)# 需求2:找到面积最大的房源
df.sort_values('area', ascending=False).head(2)# 找到最近上新的房源
df.sort_values('update_time', ascending=False).head(3)
# 把看房人数不同的房源转换成图形显示
import matplotlib.pyplot as plt
plt.hist(df['view_num'], bins=30) # bins:分段数
plt.show()# 查看看房人数最多的朝向
df.groupby('direction')['view_num'].sum().sort_values(ascending=False)# 绘制房源类型的数量
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
df.groupby('house_type')['price'].count().plot(kind = 'bar', figsize=(10,5))