arXiv開始拒收綜述論文了？「論文DDoS」這事，這篇NeurIPS論文早有討論

近日，全球人工智慧和電腦科學學術圈被一條訊息刷屏：arXiv，這個領域內最重要的預印本伺服器，突然宣佈了一項重大的實踐更新論文。

即日起，所有投稿至 arXiv 電腦科學分類的綜述性文章（review/survey）和立場性文章（position paper），必須首先透過期刊或正式會議的同行評審，並附上已獲接收的證明，否則很可能會被拒絕論文。

訊息一齣，科研圈一片譁然論文。arXiv 明確指出，這場風波的源頭正是生成式 AI 與大語言模型。

然而，就在 arXiv 官方拉響警報的前幾周，一篇中稿 2025 年 NeurIPS Position Paper Track 的立場性文章恰好也登上了 arXiv論文。它的標題精準地概括了這場危機：《Stop DDoS Attacking the Research Community with AI-Generated Survey Papers》。來自上海交通大學的研究團隊精準地預見、識別、量化並命名了這場由大模型引發的學術界危機。該論文的作者團隊來自上海交通大學，第一作者為安泰智慧計算研究院助理教授林江浩，通訊作者為計算機學院張偉楠教授。

論文標題：Stop DDoS Attacking the Research Community with AI-Generated Survey Papers

論文連結論文：

AI 綜述不僅是洪水漫灌論文，更是 DDoS 攻擊

這篇論文的核心貢獻，在於提出了一個極度精準的隱喻：“綜述論文 DDoS 攻擊”（Survey Paper DDoS attack）論文。這個概念的精妙之處在於，它點明瞭問題的本質遠非 “論文太多、大水漫灌” 那麼簡單。

展開全文

什麼是技術上的 DDoS 攻擊？在計算機網路安全領域，拒絕服務攻擊（Denial-of-Service Attack，DDoS）是指駭客利用大量 “殭屍電腦”，向一個目標伺服器傳送海量的無意義請求流量，耗盡伺服器的處理能力，導致真正的使用者無法訪問服務論文。

什麼是 “綜述論文 DDoS 攻擊”？它指的是不受控制地擴散那些表面上全面，但實際上冗餘、低質量，甚至包含幻覺的 AI 生成綜述論文，透過預印本平臺大規模進入學術界論文。這些大批次 AI 綜述的攻擊目標不是伺服器，而是學術界最稀缺的資源：研究人員的有限注意力和同行評審的有限容量。

這導致的後果和 DDoS 攻擊一樣，它構成了事實上的 “拒絕服務”論文。當有價值的、深刻的見解被海量的 AI 生成內容所淹沒時，研究人員（尤其是新手）就等於被 “拒絕訪問” 到真正的學術洞察，研究者的有限注意力也將被無限分散。

arXiv 的緊急措施，就是這臺 “伺服器” 在不堪重負時，被迫切斷部分流量的無奈之舉論文。

量化證據鏈論文：“後 2022 時代” 的資料激增

這篇論文中，作者們透過實證與資料分析，精準量化、驗證並揭示了這場 “綜述論文 DDoS 攻擊” 的規模和來源論文。

他們收集並分析了 2020 年至 2024 年間 arXiv 上共計 10,063 篇 CS 領域的綜述論文論文。研究結果（如下圖）揭示了一個清晰無誤的轉折點 ——“後 2022 年激增”（Post-2022 Spike）。

論文從三個維度進行量化分析：

1. CS 綜述論文總量：呈爆發式增長，尤其在 2022 年以後，論文數量激增，研究者已不堪重負論文。

2. 平均 AI 生成分數：AI 內容檢測分數翻了一倍多，清晰表明 AI 是這場增長的核心驅動力論文。

3. 可疑的發表行為：那些在短期內（一個月內）以極少合作者（少於 2 人）發表超過 3 篇綜述的異常作者數量激增，指向 AI 輔助下的批次生產論文。

而 2022 年底，正是 ChatGPT 釋出並引發全球生成式 AI 浪潮的時刻論文。這映證了學術界正在經歷的不是正常的學術增長，而是一場由 AI 工具驅動的、混雜著大量可疑動機的內容衝擊。

為了確保量化分析結論的穩健性，該團隊還使用了多種不同的 AI 內容檢測器（如 DeTeTeCtive, MAGE）和規則式方案（如引用重複度、語義相似性）進行交叉驗證，結果均顯示了同樣的後 2022 年激增趨勢論文。

危害：不只是 “噪音”論文，更是 “文獻投毒”

如果 AI 生成的綜述只是數量多，那它們僅僅是噪音論文。但這篇論文指出，真正致命的是其質量參差不齊、重複冗餘的特性，這正在對學術生態造成系統性破壞。

傳統的、由專家撰寫的綜述是學術的燈塔，它們提供深刻的洞見、批判性的分析和高屋建瓴的分類論文。而 AI 生成的綜述，往往存在以下四種典型缺陷：

1. 結構性空洞（Structural Differences）：它們通常只是 “無組織的主題列舉”，缺乏清晰的敘事流程和邏輯結構論文。讀起來就像是一份沒有靈魂的文獻清單。

2. 缺乏創新的分類法（Lack of Novel Taxonomy）：高質量綜述的核心價值是提出全新的視角和分類體系論文。而 AI 綜述只會 “模仿現有的分類”，有時甚至只是拙劣地複述維基百科的詞條。

3. 引文與內容錯漏（Citation and Content Inaccuracy）： AI 綜述極有可能出現捏造的或不正確的參考文獻與內容論文。這就是 LLM 的幻覺問題，它正在被不加鑑別地複製貼上到本應嚴謹的學術記錄中，並且在下一輪 AI 深度調研中被進一步廣播。

4. 高度冗餘和極低的邊際效用（Redundancy and Low Marginal Utility）：AI 極大地降低了 “灌水” 成本論文。論文作者觀察到，某個新興主題在短短一個月內就出現了超過五篇的綜述預印本。這絕對是多餘的，當 “第 N 篇關於 X 的綜述” 發表時，其 “邊際學術價值幾乎為零”。

當這四個要素結合在一起論文，由 “綜述論文 DDoS 攻擊” 產生了 “文獻投毒”（Literature Poisoning）現象：

綜述論文是新入行的研究生和跨領域學者的 “第一站” 和 “入門指南”論文。如果這些指南本身就充滿了 AI 的幻覺、錯誤的引用和膚淺的分類，那麼下一代的研究人員從一開始就可能被植入了錯誤的學術前提。

更糟糕的是，這些低質量的 AI 綜述開始互相引用，在學術搜尋引擎（如谷歌學術）上製造虛假繁榮，形成自我強化的迴圈論文。最終，垃圾文獻看起來引用量很高，而真正奠基性的工作反而被埋沒。這不僅扭曲了學術評價體系，更從根本上侵蝕了整個學術界的信任根基。

出路論文：從封堵到新機制構建

面對如此嚴峻的 “DDDoS 攻擊” 和 “文獻投毒”論文，我們該怎麼辦？

例如 arXiv 的新規正是一種防禦性的緊急熔斷措施論文。

該論文的作者也給出了自己的解決方案，分為兩部分：近期的務實策略和長期的願景革新論文。論文在文中提出了一系列政策建議，包括：

作者透明度要求：作者必須明確披露在寫作過程中對 LLM 的使用情況論文。

對綜述提交進行更嚴格的審查：例如，為綜述分配資深審稿人，並在審稿表格中增加特定問題，如本綜述是否引入了新的洞見或有意義的分類法論文。

在審查中引入 AI 檢測和驗證：使用工具進行篩查，並抽查參考文獻的真實性論文。

激勵高質量綜述：例如，設立最佳綜述論文獎，獎勵質量而非數量論文。

更進一步，作者們認為，在 AI 時代，僅僅依靠 “封堵” 和 “提高門檻” 是被動的，我們必須主動擁抱變革，用更先進的正規化來解決問題論文。由此，作者們提出了一種構想：動態即時綜述（Dynamic Live Surveys， DLS）。

簡單來說，不要再寫那種一次性的、靜態的、存在過時風險的 PDF 綜述了論文。我們應該借鑑維基百科、GitHub、甚至 Google Doc 的平臺，為每個研究領域建立一個由社羣共同維護的、版本可控的線上知識庫，並構建 “人 - AI 協作的策展迴圈”（Human-AI Curation Loop）：

AI 做它擅長的：一個 LLM 代理每天自動掃描 arXiv、頂會等，抓取最新的論文、摘要、圖表和關鍵結果論文。它負責聚合和初步總結。

人做人擅長的：真正的領域專家介入，提供 AI 無法給予的深度見解論文。他們負責提煉分類法、協調衝突的觀點、提供批判性分析和把握方向。

這種模式從根本上解決了現有問題：它能解決冗餘（一個主題或分類方法只需要一個 DLS），能保證質量（由人類專家掌舵），也能解決時效性（即時更新）論文。

這種模式不再將 AI 視為洪水猛獸，而是將其轉變為強大的科研助手，讓人類專家從繁瑣的文獻整理中解放出來，專注於最高價值的思考和洞察論文。

結語

arXiv 的新規是一個重要的訊號，它標誌著學術界對 AI 衝擊波的被動防禦已經開始論文。這是一個必要的 “止血帶”。

而上海交大團隊的這篇論文，不僅精準預言、量化並概括了這場危機（綜述論文 DDoS 攻擊和文獻投毒），更指明瞭一條可能的路徑措施論文。即，我們不能永遠停留在 “提高圍牆” 的防禦姿態上，在 AI 時代，我們必須主動進化，從靜態的、孤立的 “論文發表” 模式，轉向動態的、協作的 “知識策展” 模式。

arXiv開始拒收綜述論文了？「論文DDoS」這事，這篇NeurIPS論文早有討論

上海偉傑國際貨物運輸代理有限公司

熱門標籤

相關詞彙