顶尖科学家预警:AI“幻觉”正侵蚀生物医学研究根基
News2026-06-21

顶尖科学家预警:AI“幻觉”正侵蚀生物医学研究根基

阿明说
457

近期,一项发表于权威医学期刊的研究报告在科研界引发了持续关注与讨论。该报告指出,生物医学领域的学术论文中,参考文献造假的比率在近年出现了惊人的增长。更值得深思的是,这项研究的牵头人,哥伦比亚大学护理学院的Maxim Topaz副教授,本人就曾险些被人工智能生成的虚假文献所误导。

一次个人遭遇引发的系统性调查

作为全球前2%的顶尖科学家,Topaz长期耕耘于医疗人工智能领域。然而,即便是这样一位经验丰富的专家,也未能幸免于AI工具的“幻觉”陷阱。在一次为期刊评论文章进行润色的过程中,他使用了一款人工智能辅助工具。尽管他对AI可能产生虚构内容的特性了如指掌,并进行了反复核查,但最终期刊编辑还是发现了一条被悄然植入的、完全虚构的参考文献。这次“惊险经历”让他意识到,问题的严重性可能远超学界想象。如果专业人士都难以辨别,那么整个科研体系的基石——参考文献的可信度,将面临前所未有的挑战。正是这次事件,促使他决定启动一项大规模的系统性调研,以摸清虚假引文在正式发表文献中的真实渗透情况。

海量数据揭示触目惊心的趋势

Topaz的团队将目光投向了PubMed Central生物医学文献数据库。通过对其中收录的约250万篇开放获取论文、超过1.25亿条参考文献进行自动化筛查与人工校验,他们勾勒出了一幅令人担忧的图景。数据显示,生物医学论文中伪造参考文献的发生率,从2023年每万篇约4条,飙升至2026年初的每万篇56.9条,涨幅超过12倍。这一增幅曲线与大型语言模型(LLMs)在科研写作中的普及时间线高度吻合。研究团队强调,他们构建的多层级核验系统准确率达到了91%,这为数据的可靠性提供了坚实保障。这一发现彻底颠覆了学界过往的认知——引文造假不再被看作是个别疏忽或品行问题,而已演变为一个广泛存在且急速恶化的系统性风险。

AI造假与传统错误存在本质区别

Topaz在分析中指出,由人工智能生成的虚假引文,与此前因粗心导致的引文错误存在根本性差异。传统的错误往往是引用了一篇真实存在的文献,但页码、作者或观点表述有误;而AI“幻觉”所产生的则是彻头彻尾的虚构作品:它们拥有格式规范、标题合理、作者署名往往是该领域的真实知名学者,发表年份也看似恰当,极具迷惑性。这意味着,问题的性质已经从“证据质量不佳”恶化为“证据链断裂”。当研究人员试图追溯和验证某个结论的依据时,可能会发现自己面对的是一个根本不存在的学术源头。这种造假不仅污染单篇论文,更会通过引用关系像病毒一样在学术网络中扩散。例如,研究团队曾发现一篇2025年的肿瘤学论文,其30条参考文献中竟有18条为伪造;更有甚者,同一署名作者在短期内于不同前沿领域发表的多篇论文中均发现了虚假引文。

综述类论文成为重灾区,威胁临床证据链

进一步的细分研究揭示了一个尤为严峻的现象:综述类论文的引文造假率比其他类型论文高出约57%。Topaz解释,这背后有多重原因:综述需要引用大量文献,造假内容更容易隐藏;同时,梳理海量文献正是研究者最常求助于AI的环节,从而大幅增加了风险。然而,综述论文在整个科研证据体系中占据着承上启下的关键位置。它们是系统评价的基础,而系统评价又直接指导着临床诊疗指南的制定。因此,综述中的虚假引文并非静止的污点,其危害会沿着证据链向上传导,最终可能影响医生对患者的诊疗决策,潜在地威胁患者安全。Topaz对此深感忧虑,他指出,目前绝大多数(98.4%)被查出含有虚假引文的论文,既未被更正,也未被撤稿,仍然在数据库中作为“可信”证据被广泛引用和参考。

多方因素叠加,呼唤行业协同应对

当被问及造假率飙升的主要原因时,Topaz认为不能简单归咎于人工智能。他指出,这是一个多重因素叠加的结果:AI工具让编造逼真的虚假引文变得异常便捷;同时,早已存在的论文代写产业链也在利用新技术;而最为关键的是,现有的期刊出版与同行评审流程,并未建立针对此类新型造假的有效筛查与防御机制。三者结合,导致了问题的爆发。面对这一挑战,Topaz的团队开发并开源了他们的自动化核验系统,为学术界提供了一把自查的利器。但他也坦言,技术工具只是解决方案的一部分。从根本上,需要期刊出版商、数据库管理者、学术机构以及每一位科研工作者共同提高警惕,修订和完善学术规范与审核流程,重建对学术引用体系的信任。这场由技术便利性带来的诚信危机,最终需要依靠科学共同体的集体责任与智慧来化解。