伴隨著生成式人工智能(GAI)的爆發式發展,變化正悄悄滲入全球學術體系的每個角落,從留學申請的個人文書再到國內外課堂上的學術論文,ChatGPT、DeepSeek等工具正悄然嵌入學生的創作過程,成為他們的“學術助手”。
這種新力量既為學習帶來了前所未有的效率,也引發了各大高校對于學術誠信的深切憂慮。校方正在加速升級反制措施,日益精湛的檢測技術成為AI“攻防戰”的核心武器。
禁止AI寫作
2022年11月,ChatGPT一經推出便迅速在社交媒體上走紅,不到一周用戶數便突破100萬,月訪問量達到2100萬次。兩個月后的2023年1月底,其月活躍用戶就已突破1億,成為史上用戶增長最快的消費級應用程序。
隨著ChatGPT的功能和潛力被不斷挖掘,其在技術、安全與教育領域引發的爭議也持續升溫。
在美國,賓夕法尼亞大學沃頓商學院、哥倫比亞大學、布朗大學等15所Top 30高校已明確將AI代寫申請文書認定為學術欺騙,并規定違者將被取消申請資格。與此相比,耶魯大學的態度相對開放,鼓勵學生將AI作為完善想法的輔助工具,但前提是保持學術誠信。招生辦公室建議將AI用于頭腦風暴,而非生成過于精致的成品內容,以免引發對申請者真實性的質疑。紐約市教育部發言人詹娜·萊爾(Jenna Lyle)則指出,部分限制措施源于AI對學生學習產生負面影響的擔憂,以及對內容安全性和準確性的顧慮。
在學術出版領域,ChatGPT等AI的出現同樣引發了規則調整。據《經濟時報》(ET)報道,《自然》(Nature)雜志已明確規定,在其期刊發表的論文中,ChatGPT等人工智能軟件不能被列為作者,以維護學術署名的規范與責任。
如何檢測
早在AI出現之前,高校就一直在應對抄襲問題,并建立了多種方法來核查學生作品的原創性。
隨著GAI的興起,傳統的抄襲檢測手段面臨新的挑戰,促使高校引入更復雜的工具,例如Turnitin和The Checker AI,以應對AI代寫帶來的風險。
據Turnitin亞太地區副總裁詹姆斯·索利(James Thorley)介紹,該公司的技術會將學生論文與全球最大的學術內容數據庫進行比對,包括過往學生作業、學術出版物以及當前和已歸檔的網頁內容。這一數據庫基于公司超過25年的積累而建立。
索利補充道,這類工具并非衡量學術不端行為的唯一、無可爭議的指標。不過,AI檢測技術確實在一致性、可靠性和透明度方面都存在明顯缺陷。
首先,在準確性上,許多檢測器容易出現誤報與漏報,即既可能將人工撰寫的文本誤判為AI生成,也可能漏掉真正由AI代寫的內容。研究顯示,人工撰寫作品的分類結果往往不穩定,尤其在面對經過人工編輯或翻譯的AI文本時,檢測器的識別能力會明顯下降。
其次,在透明度方面,目前外界普遍不了解AI檢測器的訓練方式及其具體的判定邏輯。雖然“突發性”(句子長度和結構變化的可預測性)與“困惑度”(句子下一個詞的可預測性)是檢測中常用的技術參數,但這些系統依然如同一個“黑匣子”,因為平臺既不公開其訓練數據,也不解釋模型在檢測AI痕跡時具體依賴哪些特征。
最后,在適應性上,由于多數檢測器基于較舊的AI模型或數據集訓練,它們很難跟上更新、更復雜的生成式AI平臺的寫作風格。不僅如此,AI生成的內容經過人工潤色或技術處理后,還可能成功繞過檢測工具,使其更難與人類創作區分。
因此,人工檢測依然發揮著重要作用。“它應該被視為教師的‘助手’,以補充現有的檢測抄襲和非原創作品的方法。”索利解釋道。
一項國際研究已表明,大學教授能夠較為準確地區分學生原創論文與ChatGPT生成的論文。學生自己的寫作往往包含更多參與度特征,該特征的平均數量是AI生成文本的近三倍。這些特征包括個人敘述、反問句、直接與讀者交流的語句,以及用于支持文章論點或觀點的說服性語言。相比之下,AI的寫作更傾向于堆砌事實,缺乏個性化和對話感。研究者指出,除非給出額外而具體的提示,否則AI很難將枯燥的主題寫得引人入勝,更無法完全模擬人類寫作的獨特風格賦予文章個性化的閱讀體驗。