1、数据初步了解

2.数据清洗
2.1 重复值处理
直接删除重复值。
2.2 缺失值处理
通过上面观察数据发现sale_count,comment_count 存在缺失值,先观察存在缺失值的行的基本情况
存在的缺失值很可能意味着售出的数量为0或者评论的数量为0,所以我们用0来填补缺失值。
2.3 数据挖掘寻找新的特征
给出各个关键词的分类类别
由title新生成两列类别
3.数据分析及可视化
接下来考虑各个类别的销售情况
接下来用seaborn包给出每个店铺各个大类以及各个小类的销量销售额
关于性别
对评论数进行分析