计算机普通话水平测试有用吗,计算机辅助普通话水平测试的优点与问题
計算機輔助普通話水平測試(以下簡稱“機輔測試”)是指國家普通話水平智能測試系統(tǒng),部分代替人工測評,通過考生上機方式參加測試。機輔測試主要由數(shù)字化信息采集、計算機輔助網(wǎng)絡評測、評測過程網(wǎng)絡監(jiān)控 3 個環(huán)節(jié)組成, 讓考生在計算機前完成測試,對考生測試語音進行智能評測,相對于傳統(tǒng)的測試員評分來說, 從技術上解決了人工測試效率相對較低的問題, 在一定程度上體現(xiàn)了測試成績評判的科學、公正。[1]河北省機輔測試自 2007 年開展試點,到 2010 年在全省范圍內(nèi)推廣應用以來,從測試規(guī)模、技術應用等方面得到了長足的發(fā)展,成熟度不斷提升。 總體來說,機輔測試有一定的優(yōu)點,但也存在不足。
一、機輔測試的優(yōu)點
機輔測試適應了全面推廣普通話、 開展普通話測試的時代發(fā)展需要,和以往的人工測試相比較,機輔測試推動了普通話水平測試工作得以跨越式的發(fā)展,使普通話水平測試走向科學化、規(guī)范化,其優(yōu)勢主要體現(xiàn)在以下幾個方面:
(一)降低測試成本,提高測試數(shù)量。機輔測試不需要像過去那樣組織大規(guī)模的考場, 可以降低組織的難度和測試成本, 并在一定程度上解決了測試員不足的問題。 另一方面,利用機輔系統(tǒng)進行測試,每天測試的人數(shù)從幾十人次提高到了上百甚至幾百人次,測試效率顯著提高。
(二)減輕測試員工作量,提高測試公正性。計算機智能測試引擎可以完成對前三題的評測, 由系統(tǒng)采集考生的聲音,對照標準語音進行評分,其評分尺度全國統(tǒng)一,測試員只需要對第四題進行評測,大大減輕了測試員的工作量,提高了測試效率。測試員和考生不直接見面,杜絕了測試中“人情分”現(xiàn)象,使測試更公正。
(三)測試標準一致,時間控制統(tǒng)一。人工測試過程中,全部流程都是由測試員來完成,聽音、辨音、打分由測試員一人操作完成。長時間、高密度的集中測試會導致測試員判斷力的下降, 再加上測試員之間的聽音、識音和辨音能力的差異,身體狀況的差異,針對不同考生的心理反映不同等因素, 從而影響測評結果的一致性。[2]
運用機輔測試,計算機智能系統(tǒng)對前三項自動打分,評判標準是一致的。 另外,機輔測試系統(tǒng)對各試題的時間控制比人為控制更準確。
二、機輔測試存在的問題
機輔測試在給我們帶來諸多便利的同時, 在某些方面也存在一些有待解決的問題,需要完善。
(一)目前的機測系統(tǒng)還有待完善
1.機輔測試軟件對語音評判差強人意計算機測試評分對語調(diào)和協(xié)同發(fā)音現(xiàn)象識別不足。[3]漢語的聲調(diào)調(diào)值是相對的,同時漢語的語調(diào)不是簡單的音節(jié)聲調(diào)的堆疊,在重視音高的同時,也要注意停頓、音強、音長等因素。 在聲學上,語調(diào)與音高、音長、音強有密切關系,在不同的語境中其主要作用的因素也有所不同。[4]
很多語調(diào)是為了區(qū)別語言意義的, 應試者的發(fā)音各不相同, 引起語調(diào)多種多樣,這與音質(zhì)本身無關。而機輔測試模式無法識別這一現(xiàn)象。 此外, 語音環(huán)境中的音素受前后語音的影響,體現(xiàn)協(xié)同發(fā)音的效果,聲學參數(shù)和生理參數(shù)都會產(chǎn)生擾動,協(xié)同發(fā)音不僅體現(xiàn)在音節(jié)之間,還體現(xiàn)在詞與詞之間,這也是機輔軟件無法做到的。
在以往的一級復審和偏差復審過程中, 我們發(fā)現(xiàn), 計算機對前三題的打分判定與人工打分存在著一定程度的偏差,經(jīng)過研究與推測,在一些細節(jié)標準的把握上,機器與人工存在著判別差異。 具體表現(xiàn):
(1)單音節(jié)字詞:上聲音調(diào)值軌跡不準確造成語音缺陷,個別考生發(fā)出“3-2”調(diào)值軌跡、“2-1”調(diào)值軌跡或“3-2-4”調(diào)值軌跡,缺陷存在但不明顯;因考生方音或發(fā)聲習慣等原因造成讀單音節(jié)詞出現(xiàn)兒化發(fā)音,造成語音錯誤但不明顯;陰平音調(diào)值不夠造成缺陷等。
(2)多音節(jié)字詞:輕聲、兒化發(fā)音不到位造成缺陷但不明顯; 因考生方音發(fā)音習慣引起的語調(diào)問題不易被發(fā)現(xiàn)。
(3)朗讀:非兒化字的兒化讀音錯誤,不易被察覺,部分考生朗讀過于流利以至于忽略標點符號,產(chǎn)生停連不當問題;普通話發(fā)音較為標準,但語氣過于僵硬或過于富有感情,也會產(chǎn)生語調(diào)偏誤問題,但又不易被察覺。這些情況在人工測試中容易被測試員人腦神經(jīng)反射功能察覺并鎖定, 但計算機的程序指令設計可能無法達到人腦的主觀判定效果,造成評定偏差。[5]
2.機輔測試系統(tǒng)與計算機硬件之間的矛盾現(xiàn)階段, 用于普通話水平測試的計算機系統(tǒng)已經(jīng)經(jīng)歷過多次改進和完善, 其適應程度在不斷地提高,為普通話測試發(fā)揮著重要作用,測試界面的“人性化”程度也逐步顯著,但是測試系統(tǒng)在實際運用過程中仍然存在一些不盡如人意的地方。例如,在調(diào)試過程中,計算機硬件不能適應測試軟件的更高要求。
出現(xiàn)這一狀況后, 測試中心如果需要提高計算機硬件對測試軟件的適應程度, 必然要大幅度提高經(jīng)費的投入,但實際上,絕大多數(shù)測試中心的經(jīng)費都十分緊張。 此外,現(xiàn)階段使用的測試系統(tǒng)對耳麥、聲卡等語音采樣設備的兼容性不夠, 從而導致測評失敗的現(xiàn)象, 這些因素都影響到普通話測試工作的順利開展,影響到測試結果的準確性、公正性。 解決這個問題的方法,只能是加大對測試中心經(jīng)費的投入,逐步改進和提升計算機硬件能力。
(二)機輔測試機制導致測試員之間的合作聯(lián)系割裂
由于采用機輔測試, 測試員單獨測評, 自主評分,測試員之間缺乏必要的了解、交流和協(xié)商,評分尺度寬緊不一。在沒有計算機參與測試的評測中,我們還可以通過召開測前會議培訓、 交流和現(xiàn)場討論來解決此類問題。 但在機測環(huán)境下, 測試時間不統(tǒng)一、測試地點不一致,測試員各自為戰(zhàn),通過網(wǎng)絡打分,無法有效互相監(jiān)控對方的測試效果,測試中的偏頗處自己無從得知,失誤會因此而加大。
(三)機輔測試導致考生應試的極端功利性無法及時控制
《普通話水平測試大綱》(以下簡稱《大綱》)中規(guī)定:“說話的目的是考查應試人在沒有文字憑借的情況下,說普通話的能力和所能達到的規(guī)范程度。 ”在普通話水平測試中,唯一不需要機輔測試的就是“說話”測試。 “說話”測試是唯一沒有文字憑借的測試項,最能反映出一個人的綜合語言素質(zhì),最能衡量出一個人的口頭語言水平, 是普通話水平測試中分值最高的一項, 在分值中 “說話” 占了整個測試的40%. 因此,也成為普通話測試中存在問題最多的一項, 從而導致測試結果與應試者的實際語音面貌不一致。[6]
然而事實上,河北省的機測試題沿用多年,內(nèi)容已不再成為秘密, 考生可以通過一些渠道提前獲得試題甚至答案,尤其最后“說話”測試,很多時候測試員在評分中可以反復聽到同一話題下的同一內(nèi)容的標準答案。 考生應試的極端功利性表現(xiàn)在對普通話水平測試的誤解,從而產(chǎn)生“為了考試而考試、考試就是為了得到證書”的心理。這主要體現(xiàn)在測試前集中培訓、提前準備稿子、背誦選題等,所以好多考生在這個題中說話內(nèi)容千篇一律、一字不差。考生的應試心態(tài)致使考試完全背離了普通話測試工作的目的,背離了考試的初衷,失去了普通話測試的實際意義。如果是人工測試,背稿子等情況就能夠被測試員及時制止,而機輔測試卻不能做到這一點。
(四)機輔測試的人性化不足影響測試準確性
機輔測試中錄音方式和絕對的測評分離, 不能客觀反映出應試者的語音面貌, 考生的生理和心理問題也可能導致語音錄制的缺陷, 但從實際上講考生的發(fā)音并不是完全錯誤的, 而機輔測試就無法識別這種現(xiàn)象。如果是人工測試,測試員就會當場發(fā)現(xiàn)考生的這些問題,在一定程度上糾正和提醒考生,給予考生一個比較公正的評測。 例如有些考生因為牙齒缺損等原因?qū)е掳l(fā)音出現(xiàn)缺陷, 測試員就會及時了解原因,調(diào)整考生情緒,測試員也會更加耐心仔細地辨識考生的發(fā)音,給考生一個公正的評價;再例如有的考生因為身體原因,如剛大病初愈、剛失去親人等,身體和心理都比較虛弱,他的發(fā)音必然存在某些缺陷,測試員可以交流引導測試;還有些考生因為緊張導致語言混亂、說不成完整的句子等,測試員可以雙向交流引導其說話。 但機輔測試是非人性化的測試方式,根本無法解決上述問題,也就無法給考生一個客觀公正合理的評價結果。
雖然計算機輔助普通話測試還存在一些需要解決的實際問題,但不可否認,它具有一定的優(yōu)勢,也是信息技術發(fā)展和普通話測試的時代需要, 具有深遠的意義和影響。 我們要客觀地認識機輔測試存在的問題和不足, 任何新生事物的產(chǎn)生和成長不可能是一帆風順的,只要我們在使用過程中集思廣益,不斷探討,不斷完善,相信機輔測試一定會有更加廣闊和光明的前景。
參考文獻:
[1] 毛洪賁,殷德順。信息技術支持下普通話水平測試的實踐與研究[J],現(xiàn)代技術教育,2011,( 06)。
[2] 王麗娜 ,王彩霞。 影響普通話水平測試相關因素分析與思考[Z].http://www.6789.com.cn.
[3]宋欣橋。普通話水平測試中的評分差異[J].語文建設,1 998,(09)。
[4]林燾,王理嘉。語音學教程[M].北京:北京大學出版社,2003.
[5]羅常培,王均。普通語音學綱要[M].上海:商務印書館,2002.
[6]國家語言文字工作委員會普通話培訓測試中心,普通話水平測試實施綱要[M].上海:商務印書館,2004.
總結
以上是生活随笔為你收集整理的计算机普通话水平测试有用吗,计算机辅助普通话水平测试的优点与问题的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 抖音短视频SEO优化排名,抖音SEO搜索
- 下一篇: Python学习之路——12306爬票遇