3763
需用时 07:31
一手交钱一手挂名:《科学美国人》调查论文贩卖造假问题

VeraS/译)克劳斯·凯泽(Klaus Kayser)从事电子期刊的出版工作已经多年,他甚至记得当初给订户邮寄存有电子期刊的软盘。19年来的出版经验,让他对学术造假问题相当敏锐。他认为自己采用了不同寻常的方式以保护自己正在编辑出版的电子杂志《诊断病理学》(Diagnostic Pathology)。举例来说,为了避免作者冒名使用网络上的显微镜图片,他会要求作者发给他玻片原本。

尽管他的警觉性很高,但还是有些疑似不端的文章偷偷潜入了《诊断病理学》。比如,在2014年5月刊上,14篇文章中有6篇有着可疑的重复段落和其他不合常理之处。在《科学美国人》告诉他之前,凯泽显然并不知情,他对我们表示:“没人跟我说过这个,真是太感谢了。”

《诊断病理学》由德国施普林格出版社出版,一般认为这是一本声誉良好的期刊,在主编凯泽的管理下,其期刊影响因子为2.411,这使得它在汤森路透的《期刊引文报告》(Journal Citation Reports)中,稳居所有学术期刊排名的前25%,在76本病理期刊中位居第27名。期刊影响因子是根据文章被获得出版的学术文献所引用的次数来计算的,是衡量期刊声誉的粗糙标准。

凯泽的期刊并非特例。在过去几年中,在学术出版界的同行评议文献中,类似这样的违规信号时有出现,包括威立出版社(Wiley)、公共科学图书馆(Public Library of Science)、泰勒弗朗西斯集团(Taylor & Francis),以及出版《科学美国人》的自然出版集团(Nature Publishing Group)这样的大型出版社,都有涉及。

在学术出版界(和研究界)快速变化的同时,明显的不端行为时有发生。对于将发表论文当作晋升升职的敲门砖,或是获得资金支持的研究者来说,谋得同行评议期刊上的一席之地的竞争相较以往已变得更加激烈。尽管互联网上的学术期刊数量激增,但供给仍旧赶不上数量庞大的学术产出所带来的不断增长的需求。人们担忧,这种压力会滋生剽窃行为。

可疑的论文并不容易被辨识出来。单独来看,每篇研究论文似乎都没什么问题,但是在《科学美国人》的一项调查中,通过对100多篇学术文献的遣词进行分析,我们发现了一些令人担忧的模板痕迹——这是一种信号,表明目前有一场大规模的对同行评议系统进行戏弄的尝试。

尽管本文涉及的很多期刊都有严格的同行评议制度,但显然这种制度无法阻止论文造假问题的泛滥。图片来源:physicsworld.com

举例来说,发表在2014年《诊断病理学》5月刊上的一篇论文,表面上来看是一篇典型经过同行评议的荟萃分析论文,其作者为中国广西医科大学的8名研究者。在文中,作者评估了XPC基因的不同变种与胃癌之间是否有关联。他们发现这两者之间并无关联,并表示这不是该问题的最终定论:

“However, it is necessary to conduct large sample studies using standardized unbiased genotyping methods, homogeneous gastric cancer patients and well-matched controls. Moreover, gene–gene and gene–environment interactions should also be considered in the analysis. Such studies taking these factors into account may eventually lead to our better, comprehensive understanding of the association between the XPC polymorphisms and gastric cancer risk.”
“然而,运用标准化的无偏的基因分型方法,对同类型胃癌病人和相应的治疗手段进行大样本研究是很有必要的。此外基因与基因、基因与环境的相互作用也应该在分析报告中有所考虑。综合这些因素的研究,可能最终会让我们更好、更全面地理解XPC基因多态性与胃癌风险之间的关联。”

对于一篇极为普通的论文来说,这是一个极为普通的结论,并不应当引发任何警报信号。但是,将其与《欧洲人类遗传学杂志》(European Journal of Human Genetics ,自然出版集团下属杂志)中,早些年发表的一篇关于CDH1基因的变种是否可能与前列腺癌(PCA)相关的荟萃分析论文进行对照的话:

“However, it is necessary to conduct large trials using standardized unbiased methods, homogeneous PCA patients and well-matched controls, with the assessors blinded to the data. Moreover, gene–gene and gene–environment interactions should also be considered in the analysis. Such studies taking these factors into account may eventually lead to our better, comprehensive understanding of the association between the CDH1−160 C/A polymorphism and PCA risk.”
“然而,在评估者对数据单盲的情况下,运用标准化的无偏基因分型方法,通过对同类型的前列腺癌病人和相应治疗手段进行大量实验是很有必要的。此外基因与基因、基因与环境的相互作用也应该在分析报告中有所考虑,综合这些因素的研究,可能最终会让我们更好、更全面地理解CDH1-160C/A基因多态性与前列腺癌风险之间的关联。”

整段的措辞几乎完全相同,甚至包括“让我们更好更全面的理解”(lead to our better, comprehensive understanding)这个不怎么流畅的短语,唯一实质性的差别就是具体的基因(CDH1而不是XPC)和疾病(胃癌而不是前列腺癌)。

这并非一起简单的抄袭事件。很多看似独立的研究团队一直都在抄袭同一段文章——《公共科学图书馆·综合》(PLOS ONE)上的一篇论文中写的是可能最终会让“我们更好、更全面地理解”XRCC1基因突变和甲状腺癌风险之间的关联;另一篇在《国际癌症杂志》(International Journal of Cancer ,由威立出版社出版)上的论文则是可能最终会让“我们更好、更全面地理解”XPA基因突变与癌症风险之间的关联,诸如此类。有时候措辞之间的变化是很轻微的,但是在十几篇论文之中,我们都能找到几乎一模一样的语句,只是嵌入了不同的基因和疾病名称——就像是“疯狂填词”游戏一般,游戏参与者们在一段文章中填入缺失的字眼。

我们还找到了其他像这样“填空研究”的样例。搜索短语“由于显然不相关而被排除在外”(excluded because of obvious irrelevance),我们找到了超过十几篇各式各样的研究论文。除了其中一篇外,其他均由中国研究者撰写;搜索“使用标准形式,公开发表的研究中的数据”(Using a standardized form, data from published studies),也找到了超过十几篇研究论文——依然,全部来自中国;搜索“贝格尔漏斗图”(Begger's funnel plot)则对应着几十篇文章——再一次,全部来自中国。

“贝格尔漏斗图”尤其能够说明问题,因为实际上,并没有贝格尔漏斗图这种东西。西班牙巴塞罗那基因调节中心的生物学家吉拉姆·菲利翁(Guillaume Filion)表示:“它不存在,这是关键。”一位名叫科林·贝格(Colin Begg)的统计学家和另一位名叫马提亚·埃格尔(Matthias Egger)的统计学家,各自发明了测试工具来寻找综合分析中的偏差——“贝格尔漏斗图”似乎只是这两个名字的意外杂交体。

“贝格尔”这一检测抄袭的方法是菲利翁偶然发现的。他在医学期刊文章中寻找行业动态时,发现这些论文有着几乎完全相同的标题、类似的图表、以及相同的奇怪错误,就像“贝格尔漏斗图”。他猜测这些论文有同一个来源,尽管它们表面上是由不同的作者团队撰写的。“很难想像这28个人都是自己独立发明了一个统计测试的名字。”菲利翁说道,“所以我们非常震惊。”

通过在网上快速检索,我们可以发现有现成的成套服务提供,只需支付一定费用即可成为作者,在同行评议期刊上发表论文。研究者寻找在有声望的国际科学期刊上发表论文的捷径,而这些服务商们正是为了迎合这种需求。

今年11月的时候,《科学美国人》要求一位讲中文的记者与MedChina联系。MedChina是一家提供许多“论题出售”和学术期刊“文章所有权转让”服务的公司。记者假装想要购买学术论文的作者资格,与MedChina的代表商商谈。该代表解释说,这些论文已经基本算是被同行评议期刊接受,唯一需要做的只是一点编辑和润色工作,而价格则取决于目标刊物的影响因子,以及论文是实验性质的,还是荟萃分析性质的。在这次会谈中,MedChina的代表提供了一篇蛋白质与乳头状甲状腺癌的相关性进行荟萃分析的论文。这篇论文计划将要发表在一本期刊影响因子为3.353的期刊上,该论文的作者署名售价为人民币9.3万元。

MedChina出售的这篇论文最可能打算投稿的就是《临床内分泌学》(Clinical Endocrinology),这是5本影响因子为3.353的期刊之一,命题上也最吻合。这本期刊的高级编辑约翰·贝文(John Bevan)表示:“显然,这是一个极受关注的问题。想到这类事情一直在发生,并且越来越泛滥,我深感悲痛。”在《科学美国人》与他联系大约两周后,贝文确认了一篇可疑的论文,题目是关于乳头状甲状腺癌生物指标的,并且论文在修订过程中新加了一名作者。这篇论文最终被鉴定有问题,并被拒绝。

这些可疑的论文中,相当部分的资金支持来自中国政府。第一批被《科学美国人》辨识出来的100篇论文中,就有24篇收到过中国国家自然科学基金会(NSFC)的资金支持;而另有17篇承认收到了其他政府来源的资金支持。中国国家自然科学基金会的主任杨卫确认,有24篇被《科学美国人》认定为可疑的论文,后来被交付到基金会的纪检监察审计局,该局每年调查几百起针对不当行为的指控。杨卫在邮件中写道:“每年NSFC都要执行几十起针对学术不端行为的处罚,但代笔行为则没有那么常见。”去年,该机构其中一起处罚案例涉及了一名从互联网上购买申请拨款提案的科学家。杨卫强调,NSFC正在采取措施对抗不端行为,包括近期安装的“相似检索”功能,以针对申款提案中可能发生的剽窃内容进行检索。(杨卫表示,该系统上线后的一年以来,已经从15万申款请求中检出了几百个“相当雷同”的内容)。但是一旦到了论文工厂层面,杨卫表示:“我们对于这个问题并无太多经验,十分乐意听取你们的建议。”

这次《科学美国人》公布的100篇可疑论文中,绝大多数都出自中国的研究团队。图片来源:scientificamerican.com

一些出版商到现在才意识到中国的论文工厂问题。“我并不清楚还有一个买卖论文署名权的市场存在。”英国生物医学中心(BioMed Central)负责科研诚信的副主编洁吉莎·帕特尔(Jigisha Patel)表示,但他们中心(隶属于德国斯普林格出版社,发行《诊断病理学》期刊)已经开始注意并警惕这个问题。帕特尔说:“我们现在会调查并着手解决这个问题。”在《科学美国人》联系他们之后的不到两周,生物医学中心宣布,约有50篇手稿是谎称接受过同行评议的。出版商向撤稿监察(Retraction Watch)博客表示,“可能有第三方卷入,并影响了同行评议程序”,这些手稿很可能就来自论文工厂。我们可以看到大约6篇论文的标题和作者。所有这些论文在形式和主题上都非常相似,这意味着其他论文工厂的存在——制作荟萃分析性质的论文,这些论文全都来自中国的作者团队。

其他出版商也已经开始着手对抗可疑论文的泛滥。《公共科学图书馆·综合》的编辑部主任达米安·帕廷森(Damian Pattinson)表示,去年四月,期刊就已经创立了安全措施。他们收到的每一篇荟萃分析论文都必须经过特殊的编辑检查强制作者提交附加信息,包括他们开展研究的目的。“基于以上原因,论文被提交给评议者的比率已经下跌了90%。我们已经非常清楚地意识到这个问题。”尽管如此,《科学美国人》提供的列表中,仍旧包括4篇可疑的论文,它们均在《公共科学图书馆·综合》执行安全措施之后发表。而MedChina上仍有即将被《公共科学图书馆·综合》收录的论文的作者署名权在明码标价地贩卖。当我们询问帕廷森这一问题时,他回答说:“如果有不端行为的指征,我们会修正并撤销这些论文。这是一个麻烦的问题,我们对此十分了解。”

英国医学委员会(BMC)、公共科学图书馆以及其他出版商都在使用剽窃检测软件,以试图减少剽窃现象。但是,软件并不是总能解决文章的剽窃问题。帕特尔告诫说,论文工厂“令问题的复杂性更进了一层”,这令人十分忧心。

目前,出版商们正在进行一场艰苦的战斗。《临床内分泌学》的贝文表示:“由于缺少内幕消息,监管非常困难。”《临床内分泌学》及其出版商威立出版社试着堵住编辑流程中的漏洞,如作者署名后期更改,以及其他不端行为。贝文表示:“你必须承认,大部分人提交的内容还是以诚信为本的。”

这是非常严重的威胁。由于许多公司已经想到了如何从学术不端行为中牟取利益,所以假定别人都是诚实的就不再符合时代,是一种很危险的做法。“同行评议的整个机制是建立在信任基础上的。”帕廷森表示,“一旦这点被摧毁,同行评议机制就很难应对了。”

菲利翁指出:“我们面临着问题。”他认为,泛滥才刚刚开始,“压力如此巨大,而且涉及了巨额的金钱利益,因此将来必然会有各种各样,更为过分的行为。”(编辑:球藻怪)

文章题图:indiamart.com

The End

发布于2014-12-20, 本文版权属于果壳网(guokr.com),禁止转载。如有需要,请联系果壳

举报这篇文章

Charles Seife

美国作家、记者,纽约大学教授

pic