如何用Python做疫情数据分析
本篇文章为大家展示了如何用Python做疫情数据分析,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。
最近在这个全民抗疫情的非常时期,每天在家除了远程办公之外,也不由得随时刷新下疫情信息,关心一下有什么最新的消息。
特别是我刷新每天的疫情地图数据,可以看到新增确诊、疑似病例、死亡率、治愈率等数据的时候发觉了一定的规律。
虽然有时候等不到官方确切的好消息,也可以从数据中发觉一些乐观的数据便于排解我长期不能出门的抑郁心情。
今天我就借助Python对已知的一些疫情数据做些分析,给大家做参考。
首先我们来选一个疫情地图数据源,以百度的为例,所有数据均来源于国家及各省市卫建委公布数据。
通过对全盘数据来看,我对未来对情况是保持乐观心态的,毕竟每天确诊数在慢慢下降,治愈率在上升,希望更多的人能及时得到救治。
各省治愈率和致死率情况分析
拿到这些数据之后,我想得到两个更详细的数据,那就是每个省的治愈率和致死率。
先把这些数据导入到CSV文件里,确定四个列的数据(省份、确诊数、治愈率、死亡数)。
现在开始来写代码导入CSV文件吧。
通过以上代码我们可以发现pandas的read_csv() 方法默认会返回一个DateFrame对象。
现在我们来对DateFrame的数据做一下分析统计治愈率和致死率,代码内容就不详细讲了,都比较简单,尽可能是让没有编程基础的人都能看懂。
从以上代码示例来看,宁夏,甘肃治愈率是最高的,分别为26.42%和24.42%,可能是确诊数相对比较少,症状也比较轻的原因吧。
另外湖南和浙江确诊人数很多,治愈率比较高,当地的医疗水平高应该也是原因之一吧。
至于湖北的治愈率是有7%左右,这跟它是疫区中心有很大的关系,医疗资源不够用,希望随着火神雷神山和方舱医院的建立,情况能得到好转。
接下来我们来分析下致死率,和分析治愈率的方法一样,我们只需要多添加一个列的数据即可。
依旧是湖北最高,其次是香港、甘肃、海南、黑龙江,湖北的致死率高还是老原因,集中爆发加上医疗资源的挤兑造成的。
香港和甘肃估计是因为基数的原因导致的致死率较高。
至于海南和黑龙江,我个人觉得比例高有三个原因。
响应速度,因为离疫区相对较远,在消息及时性上有一定影响。
流入人口数量,海南是春节大家常去的独家胜地,可能很多人疫区的人民拖家带口的就去了,导致集中爆发。
医疗资源,当地医疗条件可能比不上一些大型城市和沿海发达城市,医疗资源不足导致。
当然致死率跟病人的具体情况有很大的关系,病人如果入院时已经是重症或者是有其他并发症,那么致死率肯定会上升。
值得一提的是广东的致死率,在那么多确诊人数(1177人) 的情况下,居然致死率在0.08%,不得不说是一个值得鼓励和称赞的事情。
治愈率和致死率在数据体现上只能说是一定程度反映了当地的感染情况、响应速度、医疗条件等。我们可以从另一个角度来分析下疫情数据。
从整体致死率来讲,我觉得情况是乐观的,这次的疫情烈度其实没有非典(SARS)来得那么猛烈,只是因为其潜伏期长导致传播面积和人数特别广,所以需要我们坚持更长的时间来让它消失。
人口的迁入比例
首先我们通过百度地图的迁移数据来看看春运期间武汉迁出到各个城市的情况。
通过对2020年1月10号到1月24号春运期间武汉迁出各省对比例图我们可以看到,这些数据和确诊人数比例大部分是对等的。
浙江、河北、山东 等地被迁入人口较多,因此确诊人数也很多。
至于确诊人数最多的几个省湖南、河南等地之所以迁入数据不明显我的估计是湖北距离湖南、河南特别近,在1月10之前一直就有大量的人口流动,各地还没有引起特别的重视,加上潜伏期长的原因,一下就爆发了。
重庆和四川迁入人数比例较大,但是确诊病例没那么高的原因应该在于得到确切防控消息的时间和迁入时间节点重合,做出了快速响应,尽快的隔离了疫情来的群众。
因为我身在成都,所以就以成都的迁入数据,确诊数据来分析比对一下。
成都流入的武汉市民排在29位,占0.44%,如果按流出人口数量500万来算,那就是2.2万余人,一个月平均每天要流入7,800人。
成都今天的确诊病例是124例,其中1/3病例是外部输入型,剩下的是本地人被感染上的,差不多7,80人的样子。成都也是一个2000万人口的大城市,从防控的角度来说,做的很不错了。
另外成都今天的确诊人数为124例,治愈人数为41,治愈率达到三分之一,不得不说是一个振奋人心的数字。
虽然治愈率病人的自身身体素质也有很大的关系,但从另一个角度来讲,消息的及时性通达对于防控来说很有必要。
就我而言,当得到有必要要带口罩的消息时应该是1月19号的时候,这时感觉大家都已经开始重视起来了,并且药店不怎么买得到口罩了,有意识的做好防控准备,越早一天做好防控重症病人数就会比较少,治愈率自然就提高了。
总结
从最近几天的情况来看,每一天的新增疑似病例和确诊人数都在下降的,治愈人数也远远超过了死亡人数,从总体趋势来说,情况在慢慢的好转。
今天仅仅是用Python的pandas做了些简单的数据分析工作,我会在之后的时间里详细的对已知的数据做不同角度的分析,挖掘出更多隐藏在数据之后的细节,也相信随着全民的重视与努力,我们终将坚持到春暖花开的时节、阳光灿烂的那天。
衷心希望大家少出门、勤洗手、尽量减少与外人的接触、发现身体异常及时告知当地疾控中心,虽然我平时开车讨厌堵车,但是在这个连续大半个月都不堵车,街头冷清的时节里,我还是宁愿街头拥堵一些,热闹一些,那样才算是国泰民安。
上述内容就是如何用Python做疫情数据分析,你们学到知识或技能了吗?如果还想学到更多技能或者丰富自己的知识储备,欢迎关注行业资讯频道。