科学界最大造假者落网记| 果壳科技有意思

Adam Marcus、Ivan Oransky
观点
社会

3452字
需用时 06:54

科学界最大造假者落网记

Adam Marcus、Ivan Oransky

（Cuscoasimo /译）2000年4月，《麻醉与镇痛（Anesthesia & Analgesia）》杂志刊发了一封致编辑函，彼得·克兰克（Peter Kranke）与2位同事所写的这封信里满含讽刺。这3位麻醉学者把矛头指向了一篇日本同行发表的文章，作者是藤井善隆（Yoshitaka Fujii）。他们认为，藤井所发文章中有关一种手术后恶心呕吐预防药物的数据“好看得不可思议（incredibly nice）”。

日本研究者藤井善隆图片来源：arstechnica.com

在科学行话里，说研究结果“好看得不可思议”可不是一种赞赏——这等于指责研究者漫不经心，甚至是伪造结果，可是《麻醉与镇痛》杂志没注意到其中的警告意味，而是采取了放任不管的态度。在致编者函之后，《麻醉与镇痛》杂志附上了藤井的解释；他问道：“究竟什么样的证明才能算充分证据？”换句话说就是：“你们不信我？那就不信好了。”此后，《麻醉与镇痛》杂志还继续发表了藤井的其他11份论文。

德国维尔茨堡大学（University of Würzburg）的克里斯蒂安·阿普费尔（Christian Apfel）是致编者函的作者之一。他曾前往美国食品药品监督管理局（FDA），提请该机构注意他与同事发现的问题。不过，他从来没得到任何回复。

也许是认识到自己的好运气来源于审核的宽松，藤井自2005年前后就几乎不再发表麻醉学文献。他转向了眼科学和耳鼻喉学。在这些领域里，他的那些侥幸之作不太会引起别人的注意。截至2011年，他已经发表了200多项研究成果，这对于他所在的领域算得上是多产了。2011年12月，《麻醉学杂志》（Journal of Anesthesia）发表了藤井的一篇论文，这是他的最后一篇论文。

在接下来的两年中，一个事实变得日趋明显，藤井的许多（实际上是绝大多数）研究成果是伪造的。他是当今单个作者被撤稿记录的保持者，总数高达惊人的183篇，约占1980年至2011年间全部撤稿数的7%。藤井不仅是个从声名卓著到声名狼藉的典型，他的经历还开启了学术出版的新纪元：一个属于检测学术欺诈的统计工具，以及乐意使用这些工具的学术“警察”的时代。

在从2009年起担任《麻醉》（Anaesthesia）期刊的总编辑前，史蒂夫·延蒂斯（Steve Yentis）就有着相当深厚的科研伦理背景。他担任过一个麻醉学学术委员会的委员及主席，甚至利用业余时间取得了医学伦理学硕士学位。此外，延蒂斯还为出版伦理委员会（Committee on Publication Ethics，COPE，一个位于英国的国际组织，致力于修订学术出版标准）工作。

但他在履新后还是没有“预感到天快要塌下来了”。与十年前的《麻醉与镇痛》杂志一样，《麻醉》在2010年刊登了一篇关于藤井论文的编辑意见。意见作者们不相信藤井研究成果的真实性，号召全学科对藤井所发论文进行审核并，清除造假的结果。

后来，延蒂斯在一篇题为《谎言、弥天大谎和统计学》的文章中说，这篇由他约稿发表的编辑意见引来了洪水般的来信，其中一位来信读者表示“为这种研究者在论文中歪曲证据基础的情况感到惋惜”，并强烈要求麻醉学期刊杂志编辑对此有所行动。这封信的作者是英国麻醉医生约翰·卡莱尔（John Carlisle）。

在某种意义上，这篇编辑意见的刊发恰逢其时。在此之前，麻醉学领域接连了遭受两次重大打击，刚开始慢慢恢复。第一次打击来自一名美国马萨诸塞州（Massachusetts）的疼痛医师斯科特·鲁本（Scott Reuben），他伪造了临床试验数据。不到一年之后，一位多产的德国研究人员乔基姆·博尔特（Joachim Boldt）就制造了第二次打击：人们发现他篡改了研究论文，并且还有其他违反学术伦理的行为，这些不端行为总共导致博尔特被撤稿90篇。

斯科特·鲁本（左）和乔基姆·博尔特（右）图片来源：tovima.gr 与www.cbsnews.com

如果事情看起来好得让人难以置信，那么数学会告诉你真相

《麻醉》发表过博尔特的6篇论文，这使延蒂斯感觉有些难堪。因此，当看到卡莱尔的来信后，他发现了机会。延蒂斯明确告诉卡莱尔，他不能只当键盘侠， “我反过来要求写信人对藤井的研究进行分析。” 卡莱尔承认自己当时既没有统计学专长，也不是特别有名的麻醉学家，说的话在同行中间也没有什么分量。但他的结论十分简单，也无法忽视：藤井的研究数据基本上不可能是从一组真实实验中获得的。

临床医学中的最佳证据来自随机对照试验，本质上来说，就是靠统计学把“偶然的随机反应”和“药物或其他治疗手段的真实效果”区分开来。卡莱尔解释说：“通常来说，实验里有治疗组和安慰剂组，分析的是接受治疗后和接受安慰剂后的两组数据；而我所做的不寻常之事就是分析在接受治疗之前或给予安慰剂之前，这两组变量之间的差异（比如说体重），并计算出这些差异小于，而不是大于观察结果的概率有多大。”

藤井善隆在1991年至2011年间曾进行过 168次满足“黄金标准”的临床试验（这使得他每年发表的论文数达到令人瞩目的8篇）。卡莱尔将藤井的实验结果与其他研究人员先前取得的数据，以及随机因素可能造成的影响进行了比较，并查看了从研究开始时病人的身高、血压，到藤井所测试的药物发生副作用的频率等各项因素。

利用这些方法，卡莱尔在他2012年发表于《麻醉》杂志的论文中得出结论，藤井善隆在实验中获得这些研究结果的概率约在10^-33这个数量级，一个小得可怜的数字。在这篇论文中，卡莱尔用晦涩的术语解释道，藤井的数据中存在“不正常的模式”，说明“这些数据偏离随机样本的程度足以将它们排除在证据基础外”换句话说就是：如果事情看起来好得难以置信，那么数学可能会告诉你那确实不可置信。

卡莱尔的结论与那些在2000年呼吁对藤井进行审核的麻醉学家所持观点很像——只是这次得到了人们的关注。卡莱尔的研究结果发表后不久，日本的一项研究结论显示，藤井善隆发表的212篇论文中仅有3篇包含明确可靠的数据，38篇论文无法被确定是否为欺诈，171篇论文最终被认定完全伪造。这份日本调查报告总结道：“这就像是他坐在书桌前，写了一部关于自己的研究假说的小说。”

“警察”：《麻醉》（Anaesthesia）总编辑史蒂夫·延蒂斯（Steve Yentis），曾要求一位读者开展对藤井善隆研究论文的统计学分析。图片来源：nautil.us

卡莱尔的统计学分析方法不仅适用于麻醉，甚至不仅适用于和人有关的科学。卡莱尔说：“我用的方法可应用于任何事物、植物、动物或矿物等。它只要求把人、植物或事物随机分成不同的组。”这对于其他学术刊物来说也“相当容易”实行。

至少有一位期刊编辑同意卡莱尔的说法。斯坦福大学麻醉学家、《麻醉与镇痛》现任总编辑史蒂文·谢弗（Steven Shafer）说：“虽然它还在发展，但是约翰·卡莱尔的基本方法已经被作为一种检测研究欺诈的工具推广开来。”谢弗、延蒂斯以及其他人都在为此而努力。卡莱尔计划最近发表一种改进后的方法。谢弗表示，他们的目标之一就是使这个过程自动化。

谢弗表示，他曾经亲自运用卡莱尔的方法鉴别出一篇2012年投给《麻醉与镇痛》的欺诈性论文。谢弗拒收了此论文，后来得知它被投递给了其他期刊。谢弗说：“同一篇论文，数据重新编过了！我在拒稿信中暗示那是一篇欺诈性论文，论文作者看到之后就编造了新的数据。”谢弗与同事向该论文作者所在院系负责人写了一封提示信，对方回复说：“这些人以后不会再搞研究了。”

而且，这种方法也不仅可以用于鉴别欺诈者。卡莱尔表示，科克伦协作组织（Cochrane Collaboration，一家开展医学文献审核与元分析的英国组织）等团体可以利用此技术检查任意合作成果的可靠性。这类元分析会把特定干预手段（例如药物或手术等）的许多研究结果汇集起来，因此被视为制定治疗规范的强大循证工具。然而，如果各项研究的数据基础有问题，那结果就是“输入的是垃圾，输出的还是垃圾”，毫无用处。

不过，这种方法要求期刊编辑参与其中——而目前，许多编辑并不愿意。有人认为有理由不对论文进行修正。而作者则从自身利益出发，宣称自己是“莫须有迫害”的牺牲者。更常见的情况是，允许对已发表论文匿名评论的网站（如PubPeer.com）上出现大量批评声音之后，媒体报道跟进，人们才会进一步采取行动。

例如在2009年，布鲁斯·艾姆斯（Bruce Ames）——因名字被用来命名致癌物测试而出名的那位——与同事一起开展了一项与卡莱尔研究类似的分析研究。研究的对象是3篇由帕拉尼纳森·瓦莱拉克什米（Palaninathan Varalakshmi）所领导团队撰写的论文。与后来卡莱尔的研究成果形成鲜明对比的是，在这次调查中，3位研究者回击了，他们声称，艾姆斯的方法是“不公平的”，是对因果关系和相关性的混用。瓦莱拉克什米的编辑同意他们的看法。直至今天，在发表过这些受指控的研究者的论文的期刊中，还没有任何一家对他们的论文采取任何行动。

可悲的是，这种情形才是学术欺诈调查的典型结论。难于对欺诈者追责的部分原因就在于学术出版本身。延蒂斯认为，学术出版“一直依赖于人，而不是体系；同行评审过程有其自身的优缺点，但欺诈检查真的不是它的强项”。

发表的基础是信任，而就算能获取原始数据，同行评审者也往往会匆忙略过。例如《自然》（Nature）执行编辑维罗妮卡·基尔默（Veronique Kiermer）就表示，该杂志要求作者“采用适当的统计学测试，并着重说明数据是否符合统计学测试的假设”。她认为，编辑“在评价论文时，应当考虑上述要求，而不需要系统地检查论文涉及的全部数据的分布。”类似地，同行评审者也并不被要求检查数据集的统计情况。

去年，《自然》发生了一次惨痛的干细胞论文撤稿事件，并导致一位主要研究人员自杀。但他们依旧认为：“我们和评审者不可能发现那些严重削弱论文质量的问题所在。”该杂志社表示，他们进行了出版后同行评审，以及制度性调查。《自然》刊登的另一篇编辑意见中写道，查得太严会产生真正的问题。期刊杂志社“可能发现自己会仅仅因为要求撤稿这个行为就惹上官司，更别说在撤稿声明中提到学术不端了。”

《自然》或许仍然满足于将繁重的审查工作留给学术机构，但延蒂斯已经得到了教训。虽然在他2010年授权发表的那篇社论中，藤井善隆论文中的问题引起了读者关注，但是他也几乎忽略了那篇社论传达的信息。直到来来往往好几轮通信后（包括最终破案者卡莱尔写给他的信），他才行动起来，直到2012年才刊出了那篇决定性的分析文章。延蒂斯说：“如果现在的编辑意见中出现那样的指控，我绝不会再让它从身边溜走。”（校对：Stellasun；编辑：游识猷）

利益相关声明：谢弗是科学诚信中心（Center for Scientific Integrity）董事会成员，本文作者共同创建的网站“撤稿监察”（Retraction Watch）驻地为科学诚信中心。

本文由 Nautilus 授权果壳网（guokr.com）编译发表，严禁转载。

The End

发布于2015-07-02，本文版权属于果壳网（guokr.com），禁止转载。如有需要，请联系果壳。

举报这篇文章

Adam Marcus、Ivan Oransky

亚当·马库斯（Adam Marcus）是《肠胃病学与内窥镜新闻》（Gastroenterology & Endoscopy News）的主管编辑，伊万·奥兰斯基（Ivan Oransky）是MedPage Today网站全球编辑主任。在约翰·D与凯瑟琳·T·麦克阿瑟基金会（John D. and Catherine T. MacArthur Foundation）的支持下，他们二人合作创建了Retraction Watch网站。