python高琦_张永伟:语文辞书在异形词规范中的作用——以含有非规范汉字的异形词处理为例...
摘要:《第一批異形詞整理表》附錄中44組含有非規范漢字的異形詞是涉及對錯的問題,但相關研究較少。《現代漢語詞典》對這44組異形詞的處理可概括為三種類型,這些不同的處理方式是辭書語言文字規范功能的體現。《現代漢語詞典》積極遵循語言文字規范,同時對規范做了更為合理的呈現,為規范的修訂提供依據和參考。語文辭書同國家語言文字規范文件一起承擔著語言文字規范功能。
關鍵詞: 語文辭書 非規范漢字 異形詞
一、 引言
異形詞規范是語言文字規范的重要組成部分。為了對異形詞的使用進行規范,中華人民共和國教育部和國家語言文字工作委員會發布了《第一批異形詞整理表》(以下簡稱《一異表》[1]),于2002年3月31日開始試行,是異形詞的國家規范。《一異表》除正文收錄了338組異形詞外,還在附錄中收錄了44組含有非規范字的異形詞。語文辭書,無論是字典還是詞典,都涉及異形詞的收錄和使用問題,是異形詞規范的另一種體現,可以視為異形詞的辭書規范。
《現代漢語詞典》(以下簡稱《現漢》)是一部權威的語文辭書,影響力巨大。許多學者針對《現漢》如何處理異形詞這一議題展開了研究,如白云(2007)、蘇新春(2002)、趙翠陽(2017)等。但是這些研究主要圍繞《一異表》正文部分的338組異形詞展開,對附錄中含有非規范漢字的異形詞研究相對較少。李行健在《異形詞九問》中指出:“表中前面的338組異形詞是取舍問題,‘附錄’中的44組詞是對錯問題,是明確要予以廢除的。”附錄中44組異形詞同時涉及不規范漢字的使用問題,更應該逐漸退出使用,因此它們的處理應該與《一異表》正文338組異形詞的處理有所區別。但由于某些復雜的原因,其中一些非推薦詞形依然在使用。因此含有非規范漢字的異形詞的處理問題同樣值得我們認真研究,從而引導人們正確使用。
2013年,《通用規范漢字表》對《一異表》中近百個漢字的正異關系進行調整[2]。雖然《通用規范漢字表》不是異形詞規范,但這些調整也直接影響到含有非規范漢字的異形詞[3]。因此,《一異表》附錄實際上僅可視為提供了含有非規范漢字的異形詞的原始數據,其異形詞的正確形式還需依據《通用規范漢字表》進行相應調整。《通用規范漢字表》是貫徹《國家通用語言文字法》的配套規范,語文辭書也應該采取有效措施,積極貫徹執行。
從異形詞及相關國家規范的公布和修訂時間、《現漢》的出版時間來看,在過去近20年時間里,異形詞等相關國家規范的試行及修訂與語文辭書的修訂互相引導,但語文辭書在這個過程中起到了哪些作用,還是值得我們總結和思考的。本文將考察《現漢》第5、6版[4]對《一異表》附錄44組含有非規范漢字的異形詞處理的變化。在此基礎上,結合語料庫探討語文辭書在異形詞規范中的作用。
二、 含有非規范漢字的異形詞處理及整體使用情況
(一) 《現漢》對含有非規范漢字異形詞的處理
《一異表》附錄44組含有非規范漢字的異形詞中,《現漢》第5版和第6版均只涉及42組,兩組未涉及的異形詞為“趟地—蹚地”“趟水—蹚水”[5],這是因為它們是一般的動賓詞組,不符合《現漢》的收詞標準,從而未被收錄。不過《現漢》第5版和第6版均收錄了44組異形詞中的“趟渾水—蹚渾水”,因此可以從“趟渾水—蹚渾水”來推斷出《現漢》對“趟地—蹚地”“趟水—蹚水”的處理態度。
44組異形詞中,有許多異形詞的非推薦詞形使用了繁體字。使用了繁體字的詞本身就是不規范、不推薦使用的,因此異形詞規范應該更加關注其簡體形式是否也不被推薦使用。《現漢》在處理含有繁體字的非推薦詞形時,均使用其簡體形式。比如包含繁體字的“輕颺”“椏杈”等詞分別使用“輕飏”“椏杈”等代替。
經過分析我們發現,作為國家規范的《一異表》《通用規范漢字表》與作為辭書規范典型代表的《現漢》第5、6版對含有非規范漢字異形詞的處理差異主要集中在“撅嘴—噘嘴、空蒙—空濛、昆侖—崑崙(
)[6]、渺茫—淼茫、輕揚—輕颺(飏)、趟渾水—蹚渾水”6組異形詞,不同規范對它們處理的一致性如表1所示:
表1 不同規范對含有非規范漢字異形詞處理的一致性
不同規范對異形詞的處理差異可以總結為以下幾點:
(1) 《現漢》第5版與《一異表》一致,《現漢》第6版與《通用規范漢字表》一致,而與《一異表》不一致,如“撅嘴—噘嘴”;
(2) 《現漢》第5版與《一異表》不一致,《現漢》第6版與《通用規范漢字表》一致,也與《一異表》一致,如“空蒙—空濛、昆侖—崑崙(
)、渺茫—淼茫、輕揚—輕颺(飏)”;
(3) 《現漢》第5版與《一異表》不一致,《現漢》第6版維持未修訂,但《現漢》第6版與《通用規范漢字表》一致,如“趟渾水—蹚渾水”。
(二) 含有非規范漢字的非推薦詞形的整體使用情況
本文選擇“《人民日報》圖文數據庫(1946—2019)”(以下簡稱《人民日報》)為語料,使用哈爾濱工業大學LTP工具[7]進行漢語分詞,使用Python編程并按年份統計詞頻。由于《人民日報》使用簡體漢字,因此我們將《一異表》附錄中含有繁體字的非推薦詞形轉換為簡體形式再進行處理,比如將“飛颺”“椏杈”轉換為“飛飏”“椏杈”。
44組含有非規范漢字的異形詞共包括47個非推薦詞形,表2為它們在《人民日報》中的使用情況[8]。《一異表》在2002年試行,因此我們選取1946—2001年和2003—2019年兩個時間段統計《一異表》試行前后不同使用頻次的非推薦詞形的個數和占比。
表2 含有非規范漢字的非推薦詞形頻次統計
表2顯示,含有非規范漢字的非推薦詞形在各個時間段頻次都非常低。在《一異表》試行前后,完全沒有使用的非推薦詞形分別占比61.70%和65.96%,使用頻次在1—5之間的分別占比17.02%和19.15%,使用頻次大于10的均為6個,合計占比約12.77%。這說明含非規范漢字的非推薦詞除少數依然使用外,大部已經不再使用,異形詞國家規范應該及時更新,辭書也可以對這部分內容不再提示。這樣,值得關注的含有非規范漢字的異形詞數量也會大大減少。
三、 三種含有非規范漢字的異形詞的處理分析
《現漢》對表1中6組異形詞的處理可概括為三種類型,“空蒙—空濛”“昆侖—崑崙(
)”“渺茫—淼茫”“輕揚—輕颺(飏)”屬同一類,“趟渾水—蹚渾水”為一類,“撅嘴—噘嘴”為一類。本部分分析《現漢》對這三類含非規范漢字的異形詞的處理方式以及它們在語料庫中的實際使用情況,最終結合異形詞規范的變化來分析《現漢》在這個過程中所起的規范作用。
(一) “空蒙—空濛”的處理分析
《現漢》對“空蒙—空濛”和“昆侖—崑崙(
)”“渺茫—淼茫”“輕揚—輕颺(飏)”的處理方式相同。現以“空蒙—空濛”為例進行分析。《現漢》第5版將“空濛”作為推薦詞形,第6版將“空蒙”改為推薦詞形。“空蒙”和“空濛”在1980—2018年《人民日報》中的使用頻次倍比[9]變化如圖1所示:
圖1 “空蒙”和“空濛”頻次倍比變化[10]
圖1顯示,“空蒙”和“空濛”的頻次倍比變化反映“空蒙”的使用優勢分為三個階段:“空蒙”占優勢,“空蒙”的優勢被“空濛”挑戰,“空蒙”恢復優勢。在2000年以前,“空蒙”的使用頻次整體高于“空濛”;在2000—2013年期間,“空蒙”只有2年使用更占優勢;在2013年以后,“空蒙”恢復絕對的優勢地位。
實際上,從1964年頒布的《簡化字總表》開始,“濛”就一直作為“蒙”的繁體字,《現代漢語常用字表》(1988)也沒有收錄“濛”字。因此《一異表》將“空蒙—空濛”視為一組含有非規范漢字的異形詞,收錄于附錄中。而《現漢》第5版將“濛”和“蒙”進行了分化處理,同時收錄了“蒙”和“濛”。《說文解字》:“濛,微雨也。從水蒙聲。”《現漢》第5版強調“濛”和“雨”有關的字義,用“濛”形容細雨,用“空濛”形容景物迷茫。《現漢》第6版認為這種分化處理不再必要,“濛”不再作為正體字,其意義由“蒙”字承擔,“濛”僅作為“蒙”的“細雨”義繁體字。這樣處理減少了同音字的數量,符合語言經濟性原則,相應地,“空蒙”也就成了推薦詞形。《現漢》第5、6版對“空蒙—空濛”相關條目的處理如下所示:
濛 ménɡ〈書〉
容細雨:細雨其~。
空濛 kōnɡménɡ〈書〉
形容景物迷茫:山色~|煙雨~。(《現漢》第5版)
蒙2(濛)ménɡ〈書〉
容雨點等很細小:細雨其~。
空蒙 kōnɡménɡ〈書〉
形容景物迷茫:山色~|煙雨~。(《現漢》第6版)
從2005年《現漢》第5版到2012年《現漢》第6版出版,經歷了8年時間。這8年中,《現漢》同《一異表》對“空蒙”“空濛”的處理不一致,但《一異表》規定的推薦詞形“空蒙”只有1年使用更占優勢,其余7年均是《現漢》第5版規定的推薦詞形“空濛”更占優勢。我們認為,語文辭書作為國家語言文字規范文件的呈現,直接面對讀者,其影響有時比國家文件規范可能更大。《現漢》第6版將“空蒙”作為推薦詞形,與異形詞國家規范相一致。
“空蒙—空濛”代表了異形詞辭書規范與國家規范處理不同,國家規范不變,語文辭書向國家規范靠攏的情形[11],其處理體現了語文辭書對異形詞國家規范的嚴格遵守、積極落實。雖然“空濛”更符合單字字義,但當語文辭書的收詞與異形詞國家規范標準相左時,語文辭書也應該積極落實國家規范,“單字條目”與“多字條目”協調處理,同國家規范保持一致。
(二) “趟渾水— 蹚渾水”的處理分析
《現漢》第5、6版均將“蹚渾水”作為推薦詞形。“趟渾水”“蹚渾水”在《人民日報》中的使用頻次較少,無法反映二者的實際使用情況,但我們可以借助“趟水—蹚水”來進行統計分析。雖然“趟水”“蹚水”一般為動賓詞組,但漢語信息處理領域的自動分詞工具往往將它們視為一個完整的切分單元。“趟水”和“蹚水”在1980—2018年《人民日報》中的使用頻次倍比變化如圖2所示:
圖2 “趟水”和“蹚水”頻次倍比變化
圖2顯示,從1980年開始,“趟水”的使用從優勢明顯,到逐漸失去優勢,最終徹底失去優勢。在2002年以前,“趟水”的使用頻次整體高于“蹚水”;在2002—2006年期間,“蹚水”使用得更多,與《一異表》的規定不符,直到2010年才短暫地出現“趟水”使用更多的情形。從2012年開始,“蹚水”的使用優勢又開始明顯,遠大于“趟水”。
“蹚水”使用優勢的變化同異形詞相關規范的發布時間密切相關。從1955年發布的《第一批異體字整理表》開始,“蹚”就被視為“趟(tānɡ)”的異體字,《一異表》的規定也符合通用性規則。但是《現漢》第5、6版均將“趟(tānɡ)”和“蹚”作為兩個獨立的正體字出條[12],沒有將“蹚”作為“趟(tānɡ)”的非規范字形。江藍生(2013)介紹《現漢》第6版對異形詞的處理時指出:“‘趟’讀去聲tànɡ,為量詞;‘蹚’讀平聲tānɡ,為動詞,二者分工明確,故只出‘蹚地、蹚渾水’條(‘蹚水’為例詞)。讀作平聲的‘趟’tānɡ是‘蹚’的異體字,注為:舊同‘蹚’。”這樣的分化處理使得“趟”和“蹚”均只有一個讀音,減少了多音字數量,“蹚渾水”也自然成了推薦詞形,這與《一異表》的規定不一致。2013年發布的《通用規范漢字表》也明確“蹚”為規范漢字,用于“蹚水”“蹚地”等,“蹚”不再作為“趟(tānɡ)”的異體字,“趟”也取消了tānɡ音,只保留tànɡ一個讀音。
在國家規范修訂期間,辭書規范同國家規范不一致,“趟水”和“蹚水”均有使用更占優勢的時候,說明這段時期異形詞的使用產生了混亂。但是隨著國家規范的修訂,“趟水”使用優勢的逆轉,異形詞使用混亂的情形得以有效遏制。
“趟水—蹚水”代表了辭書規范與國家規范不同,國家規范進行修訂,最終兩種規范達成一致的情形。語文辭書對待國家規范不能盲目落實,依然需要科學考證,為國家規范的修訂完善提供依據。
(三) “撅嘴—噘嘴”的處理分析
《現漢》第5版將“撅嘴”作為推薦詞形,第6版將“噘嘴”改為推薦詞形。“撅嘴”“噘嘴”在1980—2018年《人民日報》中的使用頻次倍比變化如圖3所示:
圖3 “撅嘴”和“噘嘴”頻次倍比變化
圖3顯示,在2006年以前,“撅嘴”和“噘嘴”各自的使用優勢互相交替,均不明顯;但2006—2013年間,“撅嘴”的使用優勢更為明顯;2014年開始“撅嘴”的使用優勢徹底喪失,被“噘嘴”取代。結合異體字、異形詞規范的發布時間不難看出,雖然1955年發布的《第一批異體字整理表》中將“噘”視為“撅”的異體字,但在《一異表》試行之前,“撅嘴”的使用優勢并不明顯,《一異表》試行后,“撅嘴”才作為推薦詞形,使用更占優勢。《現漢》對“撅嘴—噘嘴”的處理同樣跟對字的處理有關系。《現漢》第5、6版均將“撅”和“噘”作為兩個獨立的正體字出條,承認了“噘”的合法地位。《現漢》第5版認為“撅”和“噘”都有“翹起”的意思,不同的是“撅”可以用于“嘴”和“尾巴”,但“噘”只能用于“嘴”。相應地,《現漢》第5版只收錄“撅嘴”,沒有收錄“噘嘴”,處理方式與《一異表》一致。對此,張書巖(2006)認為,“既然已經承認了‘噘’的合法地位,不如徹底分化,以‘噘’專表噘嘴的意思。”《現漢》第6版確實這樣進行了處理,通過舉例和括注方式說明“撅”用于“尾巴”,“噘”用于“嘴”,相關復音詞由“撅嘴”改為“噘嘴”。“噘嘴”改為推薦詞形后,“撅”“噘”“噘嘴”的表義也更加明確了。《現漢》第6版和《通用規范漢字表》的處理方式一致,它們對推薦詞形重新認定后,“噘嘴”的使用開始更占優勢。
撅1 juē
① 翹起:~嘴|~著尾巴。② ……
撅嘴 juē∥zuǐ
翹起嘴唇,表示生氣或不滿;別老撅著嘴啦,我給你賠不是還不行嗎?
噘 juē同“撅1”①,用于“噘嘴”。(《現漢》第5版)
撅1 juē
① 翹起:~著尾巴。② ……
噘 juē
翹起(嘴唇):~嘴。
噘嘴 juē∥zuǐ
翹起嘴唇,表示生氣或不滿:別老噘著嘴啦,我給你賠不是還不行嗎?(《現漢》第6版)
“撅嘴—噘嘴”代表了語文辭書的處理遵從國家規范,而后又參照新的國家規范進行修訂的情形。《現漢》第6版對“撅嘴—噘嘴”的修訂,同國家規范修訂目的一樣,希望能引導人們對“撅”和“噘”、“撅嘴”和“噘嘴”的使用更加規范,既讓“撅”和“噘”的表義更加明確,也實現了辭書規范同國家規范的一致性。
四、 結語
通過分析《現漢》異形詞的處理和《人民日報》中異形詞的使用情況,我們發現:
(1) 《一異表》附錄的44組異形詞是對錯問題,而且大部分已經棄用,異形詞國家規范應該及時更新。作為一種國家語言文字規范的載體,語文辭書主要用來引導讀者正確使用推薦詞形,摒棄非推薦詞形,因此,對這部分非推薦詞形已經被棄用的異形詞可以不再提示,以免造成干擾。
(2) 語文辭書雖然不是國家規范,但是直接面向普通讀者,對異形詞的使用同樣起著積極的引導作用。
(3) 《現漢》在盡力落實國家規范的同時,也在一些問題上堅持自己的學術觀點,最終為規范的修訂提供了依據和參考。
(4) 當辭書規范和國家規范文件不一致時,會給讀者造成困擾,使得異形詞使用發生混亂。
經過近20年的規范,《一異表》附錄中44組異形詞中大部分非推薦詞形已經漸漸被棄用,人們的用詞越來越規范。在這段時期內也發現異形詞國家規范存在處理不當的地方。因此,語文辭書規范一方面應積極落實國家語言文字規范,另一方面也應對國家語言文字規范進行分析和甄別,不進行任何研究全盤執行,不利于語言健康發展。語文辭書應該在參考國家規范的基礎上,進一步研究,提出處理意見,為更高層面的國家規范的修訂提供實踐經驗。此外,本研究也提醒我們,《通用規范漢字表》間接影響了《一異表》的部分規定,事實上,我們判斷異形詞規范與否已經不能單純地完全依靠《一異表》,還需要參考《通用規范漢字表》中與異形詞相關的漢字的規范,異形詞規范的修訂勢在必行。
附注:
[1]在許多文獻中《第一批異體字整理表》也簡稱為《一異表》,本文主要討論異形詞問題,因此將《一異表》作為《第一批異形詞整理表》的簡稱,為避免讀者混淆,特此說明。
[2]比如將《一異表》中視為其他漢字異體字的“噘、菉、淼、蹚、劄”等確認為規范字,將“椏、飏”等作為“椏”和“颺”的類推簡化字。
[3]比如“噘嘴”“蹚地”“蹚渾水”“蹚水”等原來均含有非規范漢字,含有非規范漢字的詞也不能作為推薦詞形,但包含的非規范漢字可以作為規范漢字使用后,它們就具有了作為推薦詞形的條件。
[4]《現漢》第7版和第6版對異形詞的處理完全一致,因此本文不再對《現漢》第7版進行分析。
[5]經過《通用規范漢字表》的修訂后,一些非推薦詞形改為推薦詞形,比如“蹚地、蹚水”原為非推薦詞形,后成為推薦詞形。為避免混淆,在成組引用異形詞時,本文依然沿用《一異表》中異形詞原有形式,即“趟地—蹚地”“趟水—蹚水”。
[6]涉及非規范漢字的異形詞,必要時會使用括注說明非規范漢字對應的規范漢字。
[7]LTP官方主頁為:http:∥ltp.ai/。分詞時,將非推薦詞形加入自定義詞表,同時先將超長文本切分為短文本再進行分詞處理。使用的LTP版本為3.4.0 版。
[8]“仿佛”“僥幸”“局促”各有2個非推薦詞形,“紅菓兒”的詞頻為兒化和不兒化時的詞頻之和。
[9]倍比為兩個詞的頻次比值,計算方法參見饒高琦(2016)論文,本文計算時采用了加一平滑。倍比值大于1,說明分子詞使用更占優勢,值越大,優勢越明顯。倍比值小于1,說明分子詞使用更占劣勢,值越接近0,劣勢越明顯。倍比值等于1,說明分子詞和分母詞頻次相等。
[10]圖中年份選擇以2002年《一異表》的試行時間為界,向后17年至2019年,向前22年至1980年。為反映數據更長時間的變化,向前比向后多了5年。
[11]“昆侖—崑崙(
)”“渺茫—淼茫”“輕揚—輕颺(飏)”三組異形詞的處理結果也是國家規范保持不變,語文辭書向國家規范靠攏。
[12]“趟”和“蹚”在《現漢》第5版和第6版中的釋義有所區別,具體如下:
趟1 tānɡ 同“蹚1”。(《現漢》第5版)
趟 tāng 舊同“蹚”。(《現漢》第6版)
蹚1(
) tānɡ
從淺水里走過去:~水過河。(《現漢》第5版)
蹚(*
) tāng
① 從淺水里走過去,也指從雪地、草地等走過去:~水過河。② 用犁把土翻開,除去雜草并給苗培土:~地。(《現漢》第6版)
參考文獻:
1. 白云. 兩種版本《現代漢語詞典》對異形詞整理之比較研究——兼及對異形詞規范問題的一些思考.內蒙古大學學報,2007(3).
2. 國家語言文字工作委員會漢字處編.現代漢語常用字表. 北京:語文出版社,1988.
3. 江藍生. 《現代漢語詞典》第6版概述.辭書研究,2013(2).
4. 饒高琦. 基于計算方法的語言規范效力檢測初探——以異形詞整理工作為例.語言戰略研究,2016(6).
5. 蘇新春. 再論異形詞規范的俗成性原則——談異形詞規范中的三個問題.語言文字應用,2002(2).
6. 王寧. 《通用規范漢字表》解讀.北京:商務印書館,2013.
7. 王寧. 《通用規范漢字表》與辭書編纂.辭書研究,2014(3).
8. 溫紅彥. 異形詞九問.《人民日報》,2002.01.20.
9. 許慎(漢). 說文解字.北京:中華書局,2013.
10. 異形詞研究課題組編.第一批異形詞整理表說明. 北京:語文出版社,2002.
11. 張書巖. 從《現漢》對異體字的處理看它的規范觀.語言文字應用,2006(1).
12. 趙翠陽. 異形詞社會使用調查與研究——以《現代漢語詞典》五、六兩版整理規范為例.語言文字應用,2017(3).
13. 中國社會科學院語言研究所詞典編輯室編. 現代漢語詞典(第5、6、7版). 北京:商務印書館,2005,2012,2016.
14. 中國文字改革委員會編.簡化字總表. 文字改革出版社,1964.
15. 中華人民共和國教育部,國家語言文字工作委員會. 第一批異形詞整理表. 北京:語文出版社,2002.
16. 中華人民共和國教育部,國家語言文字工作委員會. 通用規范漢字表. 北京:語文出版社,2013.
17. 中華人民共和國文化部,中國文字改革委員會. 第一批異體字整理表. 北京:人民教育出版社, 1956.
本文系國家社科基金項目“基于《現代漢語詞典》的詞匯計量研究”(項目編號20BYY170)階段性成果。
原文刊于《辭書研究》2020年第6期
總結
以上是生活随笔為你收集整理的python高琦_张永伟:语文辞书在异形词规范中的作用——以含有非规范汉字的异形词处理为例...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 同花顺股票交易接口怎样执行量化挂单策略?
- 下一篇: window防火墙端口映射_Window