Python怎样爬取上万条大众点评数据
今天就跟大家聊聊有关Python怎样爬取上万条大众点评数据,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。
中国的快餐市场竞争一直都很激烈,关于各种品牌江湖上也流传着各种神奇的故事,那么你知道
一线城市最多的快餐品牌是哪家? 沙县小吃真的是中国餐饮巨头吗? 每一家肯德基边上都有一家麦当劳是不是真的? 星巴克VS瑞幸咖啡,谁的热度更高?
本文使用Python爬取了上万条大众点评商家数据,告诉你答案!
一线城市快餐品牌店铺数量大PK
首先我们来看一下一线城市中沙县小吃、兰州拉面、星巴克、瑞幸咖啡、肯德基、麦当劳的店铺数量分布情况
从上方的堆叠图中可以看到,沙县小吃在上海、广州、深圳都占有最多的市场,而北京则是兰州拉面拥有最多的店铺。并且在四个一线城市中,沙县小吃加兰州拉面都占有了70%以上的市场,妥妥的餐饮巨头!
除去沙县小吃和兰州拉面,我们继续来看麦当劳和肯德基这两家西式快餐店,可以看到,这两家快餐店在四个一点城市中的店铺数量基本持平,果然有肯德基的地方就有麦当劳并非传言!
最后来看看星巴克和瑞幸这两家咖啡店,我们可以发现,在上海,光星巴克的店铺数量就超越了其余任何一个城市的两家咖啡店总和!看来魔都星巴克门店数量全球第一也不是在吹牛!
肯德基 VS 麦当劳,真的那么近吗?
江湖上一直传言有肯德基的地方就有麦当劳,那么事实如此吗?我们爬取一线城市大众点评搜索肯德基和麦当劳关键字下的全部搜索页面,并将地址进行可视化如下图
我们可以看到,不论在哪个城市,肯德基和麦当劳的店铺位置重叠度都非常高,就连在上海的崇明岛上,两家也有开在一起的店铺!
并且当我们调用geopy通过经纬度对两家店铺计算距离时发现,在每个城市肯德基与麦当劳之间的最短距离是0km!所以当你看到一家肯德基店时,大胆的往前走,一定能再找到一家麦当劳!
而其他品牌,比如上海市的瑞幸咖啡就没有插手崇明区,而在广州市兰州拉面占领更多市中心店铺,外围区域更多的则是沙县小吃。
沙县小吃 VS 兰州拉面,谁的价格更低?
沙县小吃和兰州拉面,作为市场占比最高的快餐品牌,与其低廉的价格离不开关系,那么在一线城市中,他们的价格是怎样的?我们来看看
以北京为例,我们可以看到,虽然是市场占有第一第二的快餐店铺,但是其价格差距却是明显的,沙县小吃基本上能控制在20元以内,而兰州拉面大多数店铺人均消费在20-50元,在北京一碗兰州拉面可以整两顿沙县小吃了,难怪三和大神最爱沙县大酒店。
进一步,我们将全部一线城市的快餐品牌均价进行可视化。
从图中我们可以看出,不论哪个快餐,北京的店铺均价基本是最高的,而广州的价格大多是最低的,同为一线城市,部分快餐品牌的人均价格竟然相差一倍(兰州拉面),是北京的兰州拉面中的牛肉更厚吗?
另外值得关注的是,星巴克的均价是这六个品牌中最高的一家,而作为其竞争对手的瑞幸咖啡价格则低了近一半,当然看到我瑞幸咖啡卡包中的优惠券还是能够理解的,不过一杯星巴克约等于三份沙县小吃,你怎么选?
星巴克 VS 瑞幸咖啡,谁的热度更高?
从上一节的结果来看,星巴克的均价比瑞幸高出近一倍,那么是贵一点星巴克受欢迎还是优惠券多多的瑞幸咖啡更得人心,我们以店铺下面的评价数量作为店铺热度,对数据进行可视化
从上面的散点图中我们可以看到,在四个一线城市中,大多数瑞幸咖啡的店铺评价数量集中在0-500,而星巴克店铺的评价数量整体略高一点,所以并不是价格高就没有人喝,当然在很多情况下,去星巴克不是为了喝咖啡。
看完上述内容,你们对Python怎样爬取上万条大众点评数据有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注行业资讯频道,感谢大家的支持。