ICLR高分论文险遭拒,只因未引用“造假”研究???作者怒喷:对方论文用Claude生成

日期:2025-04-14 21:13:34 / 人气:6


一、论文拒稿与反转
拒稿原因
ICLR 2025 Spotlight论文因未引用一篇名为《Is Model Collapse Inevitable? Breaking the Curse of Recursion by Accumulating Real and Synthetic Data》(发表于2024年10月的COLM 2024)的论文而险些被拒稿。按照ICLR要求,应引用并适当讨论2024年7月1日之前密切相关的先前研究,但该论文作者表示知道这篇论文却故意不引用。
反转情况
论文作者对未引用情况进行回应,称与对方有过交流,认为对方技术贡献薄弱且结论有误导性。同时指出COLM 2024论文发表于2024年10月,按照ICLR审稿要求,2024年7月1日之后的相关论文若已知可不必引用。专家组讨论后一致投票决定作者无需引用该COLM论文,由于被拒主要原因是缺少引用且论文其他方面评价积极,最终论文被接收并被选为Spotlight。
二、模型崩溃成果争议
新细节曝光
这件事原本是去年的瓜,近期被网友翻出后,ICLR原作者抛出更多细节,称拒绝引用是因为对方论文存在严重不当行为,如抄袭他们之前的工作,还将他们的论文塞进大模型让AI生成另一篇论文,违反IRB等,并表示上诉时已提供详细证据,且这不是首次指出对方不当行为。
双方争论历程
去年7月的争论:合成数据导致模型崩溃这一发现登上Nature后引发热议。Rylan Schaeffer提及他们的COLM 2024论文,而纽约大学教授Julia Kempe站出来说明对方的各种不当行为,包括给她们看的初始版本未充分讨论一些关键研究,结论有误导性,理论基于对方工作的微不足道推论,符号公式相似,甚至她们的实验被用于生成对方论文等。
此次争议焦点:Rylan Schaeffer抱怨不是因为未被引用,而是原论文选择性地省略之前研究,制造出任何数量合成数据都有害的误导性说法。今年3月他还发表立场文章,谷歌科学家也认为若论文结论涉及合成数据问题,应先看数据如何生成。而原论文作者将之前合成再合成的数据集拿来训练模型并添加大量数学证明理论依据。
三、事件引发的思考
学术规范与争议处理
此事件引发了对学术规范的思考,在引用先前研究方面,应遵循怎样的标准。是严格按照时间要求,还是需要综合考虑研究的实际情况,如是否已知、是否存在误导性等。同时,在出现争议时,如何在保证学术公正的前提下妥善处理也是值得探讨的问题。
科研成果的真实性与可信度
涉及到论文成果是否存在抄袭、数据造假等行为,这对科研成果的真实性和可信度提出了挑战。在学术界,如何确保研究成果的可靠性,防止类似不当行为的出现,是需要重视的问题。

作者:新航娱乐




现在致电 xylmwohu OR 查看更多联系方式 →

COPYRIGHT 新航娱乐 版权所有