Retraction Watch 的 Ivan Oransky 谈到论文工厂时说,“他们就像许多隐藏的犯罪集团一样,很多时候我们不知道他们会做什么。” 他们是在科学期刊史上发生过的规模最大并有组织的造假行为,损害了科学家与出版商之间的相互信任。

虽然剽窃和造假并不是什么新鲜事,个别研究人员也被抓到使用软件PS图像或篡改数据,但论文工厂为他们的客户提供产业链式的专业造假服务,影响更大,破坏力更强。买家可以选择任何主题的论文或论文的作者身份,而这些论文的结论都是虚假的,然后投给期刊。这不仅使他们更难被发现和打击,而且他们可能造成的破坏也成倍增加。

该运作模式在 2020 年初开始初见端倪。两个独立的图像专家小组发现了许多文章,它们来自不同机构的不同作者,从事不同的生物医学领域研究,似乎有奇怪的一致之处,即他们好像都使用过相同的库存图片。该系列出现在近 600 篇文章中。几个月后又发现了另一系列 125 篇文章。据科研“打假专家” Elisabeth Bik 估计,尚未发现或可能永远也不会发现的经过专业处理的论文数量可能是已发现数据的 10 倍。

不为人知的一面

shadowy outfits

论文工厂是科学出版界的论文加工厂。这里所进行的并不是学生们花费几百英镑买一份代写的学期论文来提高他们的分数那样简单,而是学者们花费比这高出 100 倍的价钱来购买一篇研究论文,并假装这是他们自己的作品,而且还可以保证出版。这些论文中的研究完全是编造的,是从真正的研究中抄袭的还是通过某种方式篡改的,目前尚不清楚。这是论文工厂的众多未解之谜之一。

寻找论文工厂看似简单实则很难。Elsevier出版服务总监Catriona Fennell发现了一家疑似出售作者身份的公司。根据他们的网站可以判定他们位于英国伦敦。“但电话号码却来自越南,服务器在巴基斯坦。你甚至都不知道该向哪国政府举报?”芬内尔想起某些研究人员曾说过,“其中一些论文工厂甚至都没有网站,他们行走在大学里面对面招揽生意”。

2013 年,《科学》和《经济学人》都首次报道了大规模的作者身份销售业务。“你可能不会相信:你可以在不做实验的情况下发表 SCI 论文 ”。这是被《科学》发现的某个企业的网站上的一条广告。

当记者联系时,许多公司声称他们只提供校对、编辑和翻译等合法服务。“在某些时候,这些公司或其他公司都意识到自己出售论文可以比表面业务赚更多的钱,” Oransky阐述道。

打开网易新闻 查看精彩图片

库存论文

stock paper

论文工厂如此难以察觉的原因在于,他们的操作非常微妙,几乎不可能通过查看单个文章就能发现。他们的区别通常只有在比较几篇论文后才会变得显而易见。“如果我们回到大约 10 年前,最常见的是论文中的图像本身被改动,例如图像被翻转了或者对比度被改变了。” Alam说。通常,这种造假来自同一个研究人员或同一机构。

T&F 第一次面对论文工厂时,他们调查了数百篇论文,最终发现有好几篇论文中出现了类似的而且超乎完美的图像,而这些文章都来自不相关的作者,涵盖不同的主题。“我们认为这些可能是库存图片,”Alam 解释道。

这种操作手法可以让论文工厂在编辑所知的图像信息以及基本的查重软件下肆虐发展。“他们避免明显的文字剽窃之类的事情,”芬内尔说。“举个例子,相类似的图片可以出现在不同的作者之间,甚至出现在不同主题的文章中,而只是对数轴或数据进行了变更。” 英国皇家化学学会期刊 RSC Advances 的执行主编LAURA FISHER解释说, “就其本身而言,图表看起来是合理的,但当你开始在一系列不同的论文中看到几乎相同的图表时,就会开始怀疑了。”

2020 年初发现的大型论文工厂的案例中,第三方公司发现了可疑的Western blot图像。Western blot是检测细胞或组织中特定蛋白质的常用技术。“这不是我们所能理解的复制,他复制的不是Western blot条带本身,而是它的背景,”Bik 说到。这应该是出现在数百篇专注于癌细胞中各种蛋白质和 RNA 调节的生化论文中随机噪声因子的复制模式。

打开网易新闻 查看精彩图片

Source: Retracted 2017 & 2018 Royal Society of Chemistry papers

The two western blots here come from unrelated papers with different authors but the bottom GADPH row appears to be identical in both

但仅仅依靠怀疑是不能撤稿的。“撤稿是非常严肃的一步,也是不可逆的,” RSC 质量和道德出版经理 Nicola Nugent 说。“我们必须做到理由充分。” 大多数出版商都遵循出版道德委员会 (COPE) 关于调查潜在造假行为的严格指导方针—尽管如此, Alam 指出 COPE 的标准不一定涵盖如此大规模的涉嫌造假操纵。

出版商要求作者提供原始数据以确认文章的结论,无外乎以下两种方式:要么作者根本没有回应,要么即使在 Covid 时期,他们也以惊人的速度做出回答。“另一个奇怪的是,我们得到的所有回答都有相似的措辞,尽管从技术上讲,它们来自不同的作者,” Alam说到。出版商设法获得的原始数据要么是混乱的,几十份文件都没有一个没有清晰分类,要么只是文章中图像的副本

期刊撤稿的决定很少受到争议。一些作者从未打破沉默,而另一些作者则同意撤回,因为他们发现了可能存在的“数据问题”。在 T&F 的案例中,这个消息似乎已经传开了。“我们从未联系过的作者开始主动联系我们,而他们的文章类似论文工厂的作风,” Alam说。“他们联系我们说他们在论文中发现了一些问题,他们需要撤回。”