English / 中文
博客:
提高数据素养,你也可以动手写报道!

Nicolas 提到“数据素养”这个概念,指的是在数据里提取知识、对数据做出批判性思考,以及条理清晰地表达数据资讯的能力。

请关注微信公众号:“财新数据可视化实验室”或“caixinvislab”

这周大家看到最多的新闻热词应该是“GDP”和 “7%”,搓搓手,热爱数据新闻的同学们应该“感应”到一大波数据正向你冲过来。周三公布的国内一季度经济数据中,除了国内生产总值GDP外,还提供各行业的明细数据。虽然看到这么多数据让人无比兴奋,可是我没受过严格的统计学训练,演绎数据这一项高难度动作我该如何完成,那我又该如何从数据里找到有趣的故事?

下文节录自法国数据新闻记者、Journalism++ 共同创始人Nicolas Kayser-Bril在数据新闻手册里的文章“Become Data Literate in 3 Simple Steps”。简单三步,助你脱盲(数据方面)。

Nicolas 提到“数据素养”这个概念,指的是在数据里提取知识、对数据做出批判性思考,以及条理清晰地表达数据资讯的能力。看看他是如何提高“数据素养”的:

1. 理解数据是如何、从何得来

案例:罪案数字为什么总在上升?

“今年西班牙的罪案率升近3%”,这些有关罪案数字的新闻通常基于警方提供的数据。虽然没有人会想罪案率增加,但如果这些数字跟警方自己的表现有关,例如与警方已处理的案件数挂钩,当局统计时,有可能会尽量提高数字,因为这样能间接显示他们的灭罪力度。这或许能说明,法国毒品罪案数字在这15年间大幅攀升4倍,然而毒品消耗量则没录得大幅度上升。

该怎么办?

  • 检查数遍
  • 查查其他公众人物、官员的是否也援引过相关数字
  • 其他研究数据:除了警方数据,其实许多社会学家也会有对同主题作相关研究。尝试多比较不同数据。

2. 杜绝定义含糊的数据

案例一:通宵工作使多样性硬化发病率翻倍

报道耸人听闻,但却未曾说明发病率有多高。如果在德国,多样性硬化发病率是1比1000,发病率翻倍即代表每1000人中就会有2位多样性硬化病患,但文章竟然漏掉这项重要的信息,读者无从知通宵工作的风险有多高。

案例二:欧洲每15个人中就有一位文盲

这可是真实的数据:欧洲5亿人口,当中3千6百万人不识字,但原来数字包含7岁以下的小朋友。

该怎么办?

  • 看到平均数时,立即问清楚总数是多少
  • 再找下中位数、众数是多少

3. 资料是否可信

案例:喝茶降低中风机率

大量研究指出喝茶可以降低患上中风、心脏病等疾病的风险,但Nicolas指出许多报告都没有把其他生活习惯,如运动量、饮食等变量对研究结果的影响剔除,这样的研究其实没有太高价值。这类人群喜欢喝茶,所以比较健康?不一定,他们健康可能只是因为他们常运动,跟喝不喝茶关系不大。

该怎么办?

  • 不要轻易相信眼前的数字,要问清楚研究员是否已将其他影响剔除(设定控制变量)?研究的样本数是否足够?

Nicholas奉劝诸位,对所有事物保持批判性思考。

版权条款按“Creative Commons Attribution-ShareAlike”

图为作者2014年度的行事历

财新数据可视化实验室 | Caixin Data Visualization Lab联系我们财新网 caixin.com