2655
需用时 05:18
人人都该知道的20个科学事实(上篇)

(文/William J. Sutherland,David Spiegelhalter,Mark Burgman)近几十年来,关于政治决策与科学更紧密融合的呼吁已经成为老生常谈。然而,无论是从能源到健康,还是从环境到教育,要将科学应用到政策中,仍存在许多严峻的问题。

在此背景下,我们认为当务之急是让政策制定者认识科学那不完美的本质。能够明智地对专家顾问进行问询,能够正确理解证据的质量、局限性和偏差,这些都是政策制定者必需的素质。我们把这些素质称为解读科学的能力(interpretive scientific skills)。这些技能比理解基础科学本身更易掌握,并且可以成为大多数政治人物广泛技能的组成部分。

鉴于此,针对公务员、政治人物、政策顾问、记者以及其他与科学或科学家打交道的非专业人士,我们提出了20个在培养自身科学素养时需要掌握的概念。一个倡导科学的、具有怀疑精神的政治人物,一定会希望用这些重要的知识武装自己。当然,其他人也许会列出略有不同的清单。重点是,我们认为如果社会对这20个概念有了更广泛理解,将标志着社会的一大进步。

1.条件差异和几率都会引起变化

现实世界的变化是不可预测的,而科学想探究是什么造就了这些变化。为什么现在比过去十年更热?为什么某些地区的鸟比其他地方的多?关于这些趋势有很多解释,科学研究的最大挑战是从无数的其他来源的变化中,梳理出我们感兴趣的过程所起到的作用(比如,要研究气候变化对于鸟类数量的影响,就要把“气候变化”这个因素,从农业集约化、入侵物种的传播这类大范围变化,以及偶然的个体出生和死亡这些本地小规模事件中剥离出来)。

我们看到的现象通常是许多因素共同影响的结果。 图片来源:masterpassioncreed.deviantart.com 

 

2.没有绝对准确的测量

事实上,所有测量都存在误差。每一次重复试验都可能得到不同的结果。在某些情况下,与实际变化相比,测量误差也许会很大。比如,如果你得知上个月的经济增长了0.13%,那么实际上缩减的可能也是存在的。提出结果时应该给出结果的误差范围,以避免不合理精确度的出现。

即使用所能达到的最完善的方法进行测量,误差也还是会存在,而不会达到绝对精确。图片来源:3quarksdaily.com

 

3.偏倚是很普遍的

实验设计或测量装置可能会对实验结果造成影响,在某一特定的方向上产生非典型结果。比如,同样是想知道投票行为情况,分别进行当街采访、电话采访和网上调查,因为样本的成分不同,就可能会得到不同的结果。而因为那些有“统计上显著”的结果更可能会被报道和出版,只看文献会让人产生错觉——问题的严重性或者解决方案的有效性会被夸大。实验中的偏倚很可能这样产生:实验的参与者知道自己接受的是不同的治疗,所以会尝试表现的不同;调查者们对结果的收集会受“知道谁接受了治疗”的影响。其实理想实验应该是双盲的(Double-Blind),即参与者和收集数据的研究者都不知道哪些参与者接受了什么处理。这在药物试验中是很容易做到的,但是对于社会问题就不可能。科学家们在希望找到数据来补充之前的调查结果,或者想反驳一个观点的时候,比较容易产生确认倾向(confirmation bias)。

单盲实验和双盲实验的示意漫画。而在实际情况下,并不是所有研究都能采用理想的双盲实验方法,容易产生偏倚。图片来源:intro2psych.99k.org

 

4.样本量通常越大越好

大的样本量得到的平均观测结果往往比小样本量的更有益。换言之,当我们积累证据的时候,我们的理解也在加深。这对那些变量多、容易产生测量误差的复杂体系尤其重要。一种药物的有效性在每个个体间都存在差异,因此为了在药物测试中更可靠、准确的估计药物的平均功效,一个有数以万计的样本的实验要比一个只有数百个样本的实验好得多。

当看到一个吸引眼球的研究结论时,在奔走相告之前,不妨先了解一下这个研究的样本量。图片来源:explorable.com

 

5.相关关系不代表因果关系

假定一件事物可以导致另一事物固然是很诱人的。然而,相关关系的得出有时候是出于偶然,又或者某两种看似相关的因素的关系,其实是由复杂的或潜在的第三因素决定的。比如,生态学家曾一度认为有毒的藻类杀死了一条河流入海口处的鱼;但后来发现是因为鱼死了所以藻类繁盛起来。并不是藻类本身导致鱼类死亡。

相关不等于因果,而不代表相关就不可能是因果关系。图片来源:guokr.com

 

6.回归均值效应可能造成误导

单次测量中,至少有一部分极端的数据是由于偶然或误差造成的,进行另一次测量,数据可能就没有那么极端(或显著)了。比如,在经常发生车祸的地方放置一个测速相机,但随后事故率的减小并不能归因于放了测速相机,因为原来的高事故率本身可能是偶然,无论是否放测速相机,事故率都很可能向减少的方向发展。

在设计科学实验、解读实验结果时,研究者必须考虑统计回归效应(向均数回归效应)带来的影响,以避免推论错误。图片来源:tabmathletics.com

 

7.数据范围之外的推断存在风险

在某一范围得到的模型可能出了这个范围就不适用了。所以,如果现在的气候变化速率比现存物种在进化史中所经历过的任何时期都要快,或是出现一个全新的极端天气系统时,评价生态系统对于气候变化的反馈就十分困难了。

试着体会这个梗:“这个世界上只有两种人,一种人能用不完备的数据进行推论。”图片来源:ksonico.blogspot.hk

 

8.注意基础比率谬误

一个不完美的检验到底有多准?这不但和检验本身好坏有关,还和我们要检测的状态本身发生的概率(基本比率)有关。比如,一个人做了有99%准确度的血液测试来检测一种罕见疾病,结果呈阳性,但其实他健康的可能性比生病的可能性更大。如果10001个人来参加这个测试,其中只有一个人有病,此人的结果几乎肯定呈阳性,但还有100个健康人(1%的人)测试结果也会呈阳性。这种类型的计算在任何筛查工作中——比如机场安检——都相当重要。

假设一个机器人能够以99%的正确率区别金币的真假,并且判断出了一堆假币。那么当你从假币堆中拿出其中一枚,这枚硬币的确是假币的几率是多少?如果你直觉地回答“99%”,那么就陷入了基本概率谬误之中。图片来源:balance-today.org

 

9.对照很重要

除了待测变量之外,对照组与实验组要保持一样的条件。没有对照组,就很难知道实验处理究竟对结果有没有影响。它可以帮助科学家确保没有额外的因素在干扰结果。有时人们在药物测试中表现出阳性可能是因为环境、提供测试的人甚至只是因为药丸的颜色。在这种情况下,设置对照组(例如安慰剂组)就非常重要。

“亲爱的,去跟他谈谈吧,他刚刚发现自己是个安慰剂。”当前在新药开发等研究中,安慰剂对照实验发挥着重要作用。图片来源:mrsaverettsclassroom.com

10.随机化能够避免偏倚

实验应该尽可能采集随机样本。例如直接比较有参与健康计划的家庭和没有参与健康计划的家庭中孩子的学习成绩,是很容易带上偏倚的(因为受教育程度较高的家庭也许本来就更可能参与健康计划)。因此,好的实验设计应当随机选择一些家长让他们参与健康项目,随机选另一些不让他们参与。

样品的选择也会影响实验结果,随机取样能帮助研究者避免偏倚的结论。图片来源:ccelearn.csus.edu

 

我们并不会天真到相信有了这些提示,政策方针就会自动得到改进。我们十分清楚科学判断本身是有价值负载的,也了解偏差和语境跟数据的采集及阐述方式息息相关。我们提供的只是一些简单的想法,以帮助政策制定者理解科研证据对决策的作用,避免潜在既得利益者造成的不正当影响。然而难点在于,社会公众对不同政策的接受程度,仍取决于政治人物本身和更广泛的政治过程。

编译自:William J. Sutherland, David Spiegelhalter, Mark Burgman.Twenty tips for interpreting scientific claims.Nature.

文章题图:DAWID RYSKI. Nature.

如果你已经充分理解了这10条提示,敬请关注《解读科学观点时,你应该知道的20个事实(下篇)》,那里将有另外10个重要的事实。

 

相关的果壳网小组

The End

发布于2013-11-28, 本文版权属于果壳网(guokr.com),禁止转载。如有需要,请联系果壳

举报这篇文章

akprussia

八国语言习得中的实验室系小提琴手

pic