當學生為避免AI誤判,得自行用檢測軟體掃描作業再修改,教育現場已出現本末倒置的怪象。美國教育界近期因AI檢測工具大量誤判引發爭議,專家直言這些系統根本不符合學術倫理要求,本文深入探討人工智慧如何重塑教學現場的信任關係。
17歲的艾爾莎望著電腦螢幕上的30.76%警示數字,這是她第五次被指控用ChatGPT完成作業。這份關於音樂賞析的報告,明明是她花了整個週末撰寫的成果。
「我熱愛音樂創作,怎麼可能用AI代筆?」就讀華盛頓特區郊區高中的艾爾莎向NPR展示教師寄來的指控信,截圖顯示檢測軟體認為她的文字有AI生成嫌疑。即便她透過線上學習平台申訴,教師卻未讀訊息直接扣分。
這場誤判風波反映全美教育困境:從猶他州到阿拉巴馬州,各學區正投入數千美元採購Turnitin、GPTZero等檢測系統。英國大學越南分校學術誠信專家麥克・帕金斯直指核心:「這些工具根本不具備判斷學術誠信的專業性。」他的研究顯示,主流檢測系統誤判率驚人,當學生刻意改寫AI文字使其更人性化時,系統準確率更直線下降。
全美第六大學區布羅沃德郡的創新學習主任雪莉・威爾森坦承,他們清楚檢測工具並非100%準確,但仍提供教師使用Turnitin系統。威爾森強調:「這只是開啟教學對話的參考工具,最終判斷權仍在教師。」該學區的國際文憑課程(IB)與劍橋國際教育都證實,並未強制要求使用AI檢測系統。
在克里夫蘭郊區的謝克海茨高中,英文教師約翰・格雷迪將所有學生作文送進GPTZero檢測,當AI生成機率超過50%就會個別約談。「四分之三的學生被約談時會坦承使用AI,」格雷迪說明他的處理流程:「我們會要求重寫並扣除部分分數。」但他也承認系統會誤判非母語學生的作業,像是華裔學生施子曦就因重複用詞被誤認AI寫作。
GPTZero創辦人田濤不諱言系統存在局限,但他認為50%以上的機率值確實能幫助教師發現異常。不過克里夫蘭都會學區的英文教師凱莉・科費博士將自己的博士論文章節輸入檢測系統,竟出現91%的AI生成判定:「這證明系統有多荒謬!」她正協助學區制定AI政策,堅決反對採購檢測工具:「與其浪費錢買不可靠的系統,不如重新設計評量方式。」
如今艾爾莎養成特殊習慣:每份作業完成後,她會用三種不同檢測系統自我檢查,再重寫被標記的句子。「每次得多花半小時,」這位高中生無奈表示:「我只想證明這些文字確實出自我的腦袋。」隨著人工智慧深度介入教育現場,這場關於信任與科技的角色拉鋸戰,才正要開始。
手機巴士






