AI 代寫重要學術會議稿件評審引發爭議


在發現一場國際人工智能(AI)會議21%的稿件評審是由AI生成后,爭議爆發了。
據《自然》報道,許多學者對提交給明年“國際學習表征會議”(ICLR)的稿件和同行評審表示擔憂。他們在社交媒體上指出,其稿件評審中出現了臆造的參考文獻,以及對其工作給予了異常冗長且模糊的反饋。ICLR是一場機器學習專家的年度聚會。
美國卡內基梅隆大學的AI研究員Graham Neubig收到疑似由大型語言模型(LLM)生成的同行評審報告。他說,這些報告“非常冗長,有很多要點”,其要求進行的分析也不是“通常針對典型的AI或機器學習論文,審稿人會要求的標準統計分析”。
但Neubig需要幫助來證明這些報告是由AI生成的。于是,他在社交媒體上發帖,懸賞能掃描所有會議投稿及其同行評審的人,以檢測AI生成的文本。第二天,他收到美國科技公司潘格拉姆實驗室(Pangram)首席執行官Max Spero的回復,該公司開發了檢測AI生成文本的工具。Pangram掃描了所有提交給將于明年4月在巴西里約熱內盧舉行的ICLR 2026會議的19490篇研究和75800份同行評審。Neubig和其他超過1.1萬名AI研究人員將出席此次會議。
Pangram的分析顯示,約21%的ICLR同行評審完全由AI生成,超過一半含有使用AI的跡象。Pangram已將分析結果發布在網上。“人們原本只是懷疑,但沒有具體證據。”Spero說,“在12小時內,我們編寫了一些代碼來解析這些投稿中的所有文本內容。”
ICLR組織者表示,他們現在將使用自動化工具來評估提交的稿件和同行評審是否違反了AI使用政策。美國康奈爾大學的計算機科學家、ICLR 2026高級項目主席Bharath Hariharan表示,這是大會首次大規模地面對這一問題。
Pangram團隊使用了其自行開發的一款工具,該工具可以預測文本是否由LLM生成或編輯。Pangram的分析標記出15899份完全由AI生成的同行評審。但它也識別出許多提交給會議的、疑似含有AI生成文本的稿件:199份稿件(占1%)被發現完全由AI生成;61%的投稿主要由人工撰寫;9%的稿件含有超過50%的AI生成文本。Pangram在一篇預印本論文中描述了該模型。
對于許多收到ICLR評審意見的研究人員來說,Pangram的分析證實了他們的懷疑。丹麥哥本哈根大學的計算機科學家Desmond Elliott說,他收到的3份評審中,有一份似乎“沒有抓住論文的重點”,并且包含了一些奇怪的表達。
ICLR 2026團隊允許作者和審稿人使用AI工具修改文本、生成實驗代碼或分析結果,但要求必須公開此類用途。同時,會議還禁止任何可能會違反稿件保密性或產生偽造內容的AI使用。會議組織者現在將使用Pangram的分析以及其他自動化工具,來評估投稿和評審是否違反了這些政策,并將處罰違規的作者和評審員。
“監督同行評審過程的研究人員將被要求標記低質量的評審,而不僅僅是LLM生成的評審。”Hariharan說,“鑒于這些自動化工具可能存在誤報,我們不會完全依賴它們。”
一些作者已經撤回了他們的ICLR投稿,因為其稿件的同行評審中包含虛假陳述。其他人仍在思考如何回應收到的評審意見。
ICLR 2026的情況凸顯了同行評審員為跟上快速發展的領域而面臨越來越大的壓力。Neubig說:“目前在AI和機器學習領域,我們在評審方面面臨危機,因為過去5年該領域呈指數級擴張。”
Hariharan說,平均每位ICLR評審員被分配了5篇論文,必須在兩周內完成評審,這是一個非常巨大的負荷,遠高于過去的工作量。
Pangram開發的AI檢測工具發現,同行評審員越來越多地使用AI來起草對作者的回復。
本文鏈接:http://www.albanygandhi.com/news-3-4574.htmlAI 代寫重要學術會議稿件評審引發爭議
聲明:本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。