close

機器可以批高考作文?至少能有桃園靜電機出租效禁止背作台中靜電機出租文和套作文

在高考評分中,作文往往是最耗費工作量,也最具爭議的一項。近年來,由於高考作文評價體系屢遭質疑,相關領域的專傢學者開始思考運用機器評分,來取代準確度不高且耗時耗力的人工批改。11月26日,華東師范大學中文系副教授徐默凡,在華東師范大學一場有關“應試作文寫作質量的計量和計算”的研討會上,就機器在作文評分中的實現可能性進行瞭探討,並對當下的應試作文評分進行瞭反思。
研討會現場。
通過數據統計可找出背題套題的作文
據徐默凡介紹,目前有望運用於機器評分的自然語言處理模型有三類,分別是基於規則識別、數據統計和神經網絡的自然語言處理。
所謂基於規則識別的自然語言處理,是基於一定的規則對作文進行句法分析和語義分析,從而掌握對語言的理解和表達。徐默凡認為,這條路對於作文機器評分是走不通的。因為首先,人類自身並未建構起準確的作文評分標準;其次,作文評價標準涉及到的因素比句子理解更多,思想、邏輯、結構、語言等要素難以規則化。
第二種模型則是基於神經網絡的自然語言處理。它的原理在於運用腦科學和仿生學,模仿人腦對信息的處理方式。然而在徐默凡看來,這種模型也不適合用於機器評分。除瞭訓練復雜度高,費時費力之外,無法對它的信息處理過程進行探測和評估,因而結果的可解釋性差。
更重要的是,這種模型牽涉到瞭關鍵的智能倫理問題。AlphaGo的橫空出世令人驚詫,而相比圍棋,作文更是人類智能的體現。如果將作文評分交給人工智能,很容易引起倫理上的反感甚至恐慌。高考這一事關很多人前途的重大考試,若完全交由人工智能去判斷評分,很有可能會造成“機器將會主宰人類社會”的聯想。
於是相比之下,基於數據統計的自然語言處理才是更適合機器評分的模型。這種數據統計的基本原理是,一個句子是否合理,不必瞭解它的句法語義,隻需要考察它在人類說過的話中出現的可能性大小如何:出現的可能性越大,即越合理;可能性越小,則越不合理。理論上,進行這種自然語言處理時,需要把人類講過的所有話都統計一遍;然而在現實中,進行詞頻統計就已綽綽有餘。“詞頻統計現在已經是比較成熟的研究成果瞭,”徐默凡說,“在實際中,也可以考慮到前後文的關聯和影響。隻是考慮的詞越多,意味著計算也會越復雜。”
徐默凡指出,數據統計可以有效禁止背作文和套作文的行為。如今中高考已成為瞭背作文和套作文的重災區,同一個教師教出的學生背誦瞭一樣的范文,因而考試時寫出相似的作文,這一普遍現象若依靠人工力量是很難被察覺的。這裡就是機器大顯身手的地方瞭。它可以通過統計給出重復率百分比,並自動摘要出不同考生所寫的相同事例,再由人工鑒定是否是作弊。
此外,作文的語言規范度也可以使用統計測量。通過計算每篇作文的概率值,概率值越高說明語言用法越常規,以此就可以識別不規范的語言用法。“當然,概率低也有一種可能,那就是作文在語言上進行瞭創新,使用瞭一些新穎的表達。在此使用統計法,至少可以挑出概率低的表達,進而進行人工篩查,重點關註,再根據不同類型的作文要求賦分。”徐默凡說。
作文能否代表語文水平
在對現有的技術成果在實現機器評分的可行性上進行分析討論後,徐默凡又引入瞭一個話題:作文真的可以測量考生的語文水平嗎?
高中語文老師主要將精力用在瞭總結應對高考作文的技巧上,隻教學生應付考試的方法,而疏忽瞭真實語文能力的培養。因為學生隻要掌握瞭應試技巧,就能夠在高考作文中拿到高分,然而這並不足以證明其語文能力的優秀。從另一方面看,這也證明瞭現今的高考作文命題與評分機制在衡量考生語文水平的高低上存在一定的困難。因而作文能否體現語文水平,又是怎樣測量語文水平的,成為瞭一個值得深思的話題。
徐默凡表示,很多人認為作文水平隻能整體感知,因此機器無法勝任,人類也無法公正。但這一問題並非無解。他犀利地指出,既然目前的作文評價量表可以將考生的作文水平分解為語言表現、思想內涵等等,為何不為每一項能力的評估專門設計一套試題?讓作文從繁瑣而模糊的評分體系中解脫開來,換以更清晰也更有針對性的試題,豈不更好?
對於這一頗具革命性的提議,現場專傢學者不盡贊同。“能寫出一篇篇幅較長的文章,就是對考生能力的最大肯定。並且中國有漫長的寫文章的傳統,不可輕易中斷。”在場的一位學者說。看來,有關應試作文的命題評分體系的改革,還有很長的路要走。台北靜電油煙機出租


特朗普上任兩周簽8條行政命令

號外號外,特朗普又出行政命令啦!行政命令有多強,買不瞭吃虧,買不瞭上當,是XX你就堅持60秒!
arrow
arrow
    全站熱搜

    fwki8im23i 發表在 痞客邦 留言(0) 人氣()