德州將用人工智慧取代數千名試卷批改人員
本週,德州的學生將參加州規定的考試,他們正被用作一種新的人工智慧評分系統的小白鼠,該系統將取代該地區大部分的人工評分員。根據《德州論壇報》報道,德州教育署(TEA)正在推出一個”自動評分引擎”,該引擎利用自然語言處理技術(該技術使OpenAI 的ChatGPT 等聊天機器人能夠理解用戶並與之交流)為德州學術準備評估(STAAR)考試中的開放式試題評分。
德克薩斯州各地的STAAR 測試於週二開始
該機構預計,透過減少對臨時人工評分員的需求,該系統每年可節省1500 萬至2000 萬美元,併計劃在今年僱用不到2,000 名評分員,而2023 年需要6,000 名。
“我們希望盡可能保留開放式回答,但這些回答需要花費大量時間來評分”。
STAAR 考試測驗三年級至八年級學生對核心課程的理解,去年重新設計了考試,並減少了選擇題。現在,它包含的開放式問題增加了七倍,TEA 學生評估主管Jose Rios 說,該機構”希望盡可能保留構建式開放式回答,但它們需要花費大量的時間來評分」。
根據TEA 網站上的幻燈片顯示,新的評分系統是使用3000 份已經過兩輪人工評分的考試答案卷進行訓練的。此外,也實施了一些安全網–例如,電腦評分結果的四分之一將由人類重新評分,令人工智慧系統感到困惑的答案(包括使用俚語或非英語作答)也將由人類重新評分。
雖然TEA樂觀地認為人工智慧將使其節省大量現金,但一些教育工作者卻並不熱衷於看到它的實施。路易斯維爾獨立學區校長洛里-拉普(Lori Rapp)說,2023 年12 月,當自動評分系統在有限範圍內使用時,她所在的學區發現,得零分的建構式回答”急劇增加”。拉普說:”目前,我們還無法確定是試題出了問題,還是新的自動評分系統出了問題。”
人工智慧論文評分引擎並不新鮮。 Motherboard2019 年的一份報告發現,至少有21 個州正在使用這種引擎,並且取得了不同程度的成功,不過TEA 似乎決心避免重蹈覆轍。 TEA 幻燈片上的小字也強調,它的新評分引擎是一個封閉系統,與人工智慧有本質區別,因為”人工智慧是電腦使用漸進式學習演算法來適應,讓數據來做編程,本質上是自學” 。
試圖在兩者之間劃清界線並不令人驚訝–網路上不乏教師對人工智慧生成服務如何被用來在作業和家庭作業中作弊感到絕望。被這新評分系統評分的學生可能很難接受,他們認為”只許州官放火,不許百姓點燈”在這裡是如何被應用的。