English / 中文
博客:
USCET第一届数据新闻大赛参赛作品:国人防疫指南

中美教育基金(USCET)于2014年底举办第一届数据新闻大赛。比赛对各院校各专业的大学生开放,通过奖励优胜者的方式鼓励数据新闻的发展,并向业内提供优秀作品…

中美教育基金(USCET)于2014年底举办第一届数据新闻大赛。比赛对各院校各专业的大学生开放,通过奖励优胜者的方式鼓励数据新闻的发展,并向业内提供优秀作品。是次大赛主题为《平衡当下中国社会的信任与创新》。

参赛作品介绍系列之二:国人防疫指南

作者:吴羚琦、黄子健、黎璞(复旦大学新闻学院新媒体传播专业硕士)

Screen Shot 2015-04-16 at 3.08.41 PM

点此进入

 

同学分享:

“埃博拉疫情”被多家新闻单位选为2014年国际十大新闻之一。在西非,埃博拉病毒从年初开始肆虐,直到年底才被控制住。而中国由于及时采取了防疫措施,使得埃博拉没有传入中国。然而在这期间,有关埃博拉已经登录中国的流言不断,在人民群众中引起不同程度的恐慌。尤其是对于在此期间从国外归来经过健康安全检查的中国人,大家对他们依然采取警惕的态度,有些地区的人们甚至以更激烈的手段孤立周围从国外归来的同胞。这些都加剧了人与人之间的不信任,而失去对真实疫情情况了解的机会。与此同时,美国东北大学MOBS实验室却根据从西非出发的所有航班路线来预测埃博拉可能在其他国家发生的几率,以求能真实反映出与疫情有关的一些状况。

因此,我们团队认为在中国,我们也急需用已有的相关数据来向大众反映他们目前所关心的具有强传染性的疾病在中国的真实疫情状况,从而改变以往流言四窜,人们根本不知道应该相信哪条信息的状况,以达到增强人们对目前新闻报道的信任,甚至说通过“用数据说话,而非用人云亦云的方式来增强在社会团体中,人与人之间的信任。

而在2014年,埃博拉虽然被挡在了中国的国门外,但夏季伊始,随着登革热疫情突然在南方爆发,国内法定甲乙类传染病中的某些病种又陆续发作,网上各种言论猜测不断,比如说由于中国同性恋人数的增多,艾滋病患者也随之激增;明年登革热还会有一个小爆发等等。那么这些中国人民最关心的疾病在2015发展趋势究竟如何,而各种疾病发病数的季节分布和地区分布又是否和其他研究得出的结论相同,身处不同地区的人们该如何防范疾病、保护自己?

为了解答这个问题,我们团队从中国国家统计局、中国国家卫生和计划生育委员会下载了从2009年1月到2014年11月的中国甲乙类法定报告传染病数据,包含发病人数、死亡人数的月度和年度数据以及各省份地区发病率数据,来分析中国传染病疫情情况和预测2015年传染病发病人数。

首先,我们利用从中国国家数据网下载的2013年甲乙类法定报告传染病发病率和病死率数据制作了28种传染病的发病率和病死率对比散点图,并且以颜色区分每种传染病的主要传播途径(通过维基百科搜索疾病介绍)。

再者,我们通过“百度指数”筛选出在2013年12月至2014年12月期间,在百度搜索(中国最大的搜索引擎)次数最多的10种法定传染疾病,来分析其发病趋势、月度分布和地区分布。发病趋势由从中国国家卫生和计划生育委员会下载的甲乙类法定传染病数据中获得的2009年至2014年(前11个月加总)每年的总发病人数制作的堆积图可以看出。而从月度数据中,我们选择这十种病在2013年的发病人数制作了南丁格尔玫瑰图,可以看出10种传染病的月份分布,并初步归纳出其季节分布。另外,我们把从中国国家统计年鉴获得的中国各省市传染病发病率数据制作了10种病的发病率地图,以颜色深浅标注这十种病在不同省份发病率高低。最后,我们根据2009年到2014年法定甲乙类传染疾病每月的发病人数,并利用tableau提供的指数平滑法计算模型预测了它们在2015年的可能发病人数。但是预测模型也有一定的局限性,对于登革热这种最近爆发的传染病,预测模型并不能够很好地预测趋势。

通过以上步骤,我们发现了一些有趣的结论。
1、二月份是中国最安全的月份,大多数传染病发病人数最少的月份都是二月份。
2、新疆是中国传染病最猖獗的省份,这跟当地的经济水平和医疗情况有关,国家应该加大在新疆的建设力度,加大医疗投入。
3、人们通常认为艾滋病发病无季节性,但根据历年数据分析,七月份艾滋病的发病人数明显多于其他月份,夏秋季节是艾滋病的多发季节。
4、人们通常只知道狂犬病病死率很高,但对它并没有深入了解。我们发现,狂犬病病死率高达95.51%,多发于夏秋季节,在我国西南部和中部的山西省发病率较高。
5、麻疹近年来呈爆发态势,在春季多发,且上海的发病率很高,需要加强防范。

财新数据可视化实验室 | Caixin Data Visualization Lab联系我们财新网 caixin.com