Python怎么爬取美团烤肉商家数据
本篇内容主要讲解"Python怎么爬取美团烤肉商家数据",感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习"Python怎么爬取美团烤肉商家数据"吧!
数据获取
美团网很明显是动态网页,需要通过解析接口或用Selenium爬取,本文通过解析接口的方法爬取数据。
找到真实URL
美团网URL:https://sz.meituan.com/
分析真实URL
主要参数:
30:城市id(30代表深圳)
limit:每页店铺数量
offset:翻页参数(每增加32翻页一次)
q:关键字(本例为烤肉)
按上述接口爬取只能获得1024个店铺数据,为了获得更全面数据,还需找到areaId参数(子地区),然后遍历子地区,即可获得完整数据。限于篇幅,仅给出核心代码。
删除重复数据
df = df.drop_duplicates()
缺失值处理
由上文可知,仅联系方式字段含有缺失值,用文本填充。
df = df.fillna('暂无数据')
店铺地址清洗
通过店铺地址字段截取所属区县,另外,"南澳大"属于龙岗区,直接用replace()方法替换。
描述性统计
1.查看基本统计量
df.describe()
3.绘制回归图
通过绘制回归图,我们发现人均消费与店铺评分具有正相关,评论人数和店铺评分具有正相关。这与我们的常识也较为接近。
数据分析
本文数据可视化主要用到pyecharts库,它能轻松实现酷炫的图表效果。
地区分布
深圳烤肉店主要分布在龙岗区、龙华区、南山区和福田区,盐田区和坪山区烤肉店较少。烤肉店的选址一个重要因素就是人流量,龙岗区和龙华区为深圳主要的生活居住区,而南山区和福田区为深圳的核心商业聚集地,巨大的需求为烤肉店的布局奠定了基础。
所在商圈
仅仅知道烤肉店行政区分布,对于烤肉店选址作用其实不大。于是,我们进一步细化到商圈,看看哪些商圈的烤肉店较多。在深圳所有商圈中,龙华区的民治和龙华、光明区的公明烤肉店数量都超过了150家。
到此,相信大家对"Python怎么爬取美团烤肉商家数据"有了更深的了解,不妨来实际操作一番吧!这里是网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!