我們每天都在說漢語,大量的詞匯在各種各樣的環境中頻繁使用,到底什么詞使用頻率高?無論是語言學家還是普通大眾往往全憑感覺。近日,商務印書館出版的《現代漢語常用詞表》(草案)面世,頭一回全面披露常用詞語家底:當今社會,經常使用的詞共有56008個。
這56008個常用詞中,包括單音節詞3181個,雙音節詞40351個,三音節詞語6459個,四音節詞語5855個,五音節和五音節以上詞語162個。
常用詞表誕生歷時10年
早在1998年7月,《現代漢語常用詞表》研制項目啟動,這是一個龐雜而艱難的項目,由國家語言文字工作委員會組織實施。該詞表是作為國家已經公布的《現代漢語常用字表》等的配套規范,是我國語言文字規范化、語文教育和研究方面的基本建設項目。
課題組負責人李行健說:“大家知道現代漢語有常用字表,共收入常用字3500個;有通用字表,收入通用字7000個。但長期以來,一直沒有常用詞表,常用詞有多少?是哪些?一直是個謎。”而推廣常用詞,對于中小學語文教學、掃盲教育、漢語教育、中文信息處理和辭書編纂等都是急需的。
研制工作中大多是白發退休專家,他們不需要國家經費,迎難而上。他們中有語言學家、有大學教授,今年74歲的李行健說:“完全是出于對語言的興趣和社會責任感,我們這些老頭兒才樂此不疲。”可是誰也沒想到,這一路走來,竟然走過了10年。增補、修訂,再增補、再修訂,最后才有了放在人們面前的《現代漢語常用詞表》。李行健介紹,常用詞檢測詞頻的語料庫有三種:一是國家語委研制的“現代漢語通用語料庫”核心語料庫,這個通用語料庫收有4500萬字語料,缺點是有的詞年代久遠,如今已不經常使用。二是《人民日報》2001年至2005年約1.35億字的分詞標注語料;第三種是廈門大學研制的現當代文學作品語料庫,約7000萬字語料,總共2.5億字。
目前我們看到,在《現代漢語常用詞表》中使用頻率越高的詞排序越靠前,使用頻率越低的詞排序越靠后,這種降序排列讓人一目了然。李行健說,研制過程中采取了課題組獨創的“詞頻頻級排序法”。由于詞語的來源比較廣泛、各自不同,各種語料都有自己的覆蓋面和構成特點,詞表中的詞語不能在每種語料中都得到全面顯現。比如,同一個詞,在三種語料庫中的詞頻就會不同,有的還差別很大。為了科學反映每個詞較真實的詞頻,采用了頻級的統計方法,即將每個詞語的三種語料的頻級之和除以三的辦法。這樣就能較好反映出一個詞現實生活中的綜合的常用度,在此基礎上,再由專家進行人工審核篩選,“也就是說,這些常用詞的出籠是客觀和有科學依據的。”
一個時代有一個時代的關鍵詞
從56008個常用詞中,我們很容易觸摸到我們所處這個時代的關鍵詞、熱點詞。
李行健舉例說,在熱點詞中,新中國成立前,“看相、抽簽、算命”,可能是相當活躍的詞語,現在已不是常用詞了。解放初期,“土改、統購統銷、合作社、互助組”詞頻相當高,如今在常用詞中已不見蹤影了。曾經在“文革”中紅紅火火的詞,如“斗爭、階級、樣板戲、走資派、臭老九”等等很常用、很熱鬧的詞語,現在已經退出了常用詞的舞臺,其生命力也隨之走向衰落了。
而如今,“法律、汽車、市場、資金、責任、成功、精神、文化、價值觀”等等則變成了出現頻率相當高的常用詞。民間詞語收藏家黃集偉認為,這些詞與老百姓的生活密切相關,它所涉及的領域一定是社會的熱點,也一定是我們社會生活變化最快的那部分。比如“價值觀”,黃集偉就認為,這個詞是常用的中性詞。改革開放后,我們現實生活中發生了很多價值觀的大討論,這個時代發生的許多爭論、爭吵,比如對與錯、道德與情感,種種社會矛盾等,總的來說都隱含著價值觀的不同。
詞匯是隨社會發展變化的,它是社會變化的一面鏡子。社會中出現新的事物,如“宇宙飛船、電視、手機、股票、證券”等等,人們就會創造出新詞來記錄反映它們。詞語使用的頻度決定于它同人們社會關系的程度,所以一個時代有不同的常用詞表。
新詞折射社會生活巨大變化
“真正的語言是活的,它潛伏或奔突于我們生活的方方面面,它不會像新聞那樣被正式發布,卻像血液一樣彌散在我們生活的每根血管中。”黃集偉說。正如此言,在《現代漢語常用詞表》中,大量與社會生活變遷同步的新詞,反映了社會點點滴滴的變化。
《現代漢語常用詞表》責任編輯余桂林和記者一起總結了涉及社會生活的方方面面變化的一些新詞。
反映政治生活變遷的有“三個代表、鄧小平理論、三農”等。
1978年高考恢復后,與考試有關的詞匯多了起來,“自考、電大、函授、博士點、會考、考級”等等天天與大家見面。
隨著市場經濟的發展,房地產業帶動起詞匯的飛速發展,“房市、商品房、期房、現房、房改、房貼、租房、房源、業主、二手房”等等,都是許多年前從未見過的新詞。
跟網絡有關的詞匯表現最為活躍,新詞呈逐年上升的趨勢。“網吧、上網、互聯網、局域網、計算機網絡、網管、網卡、網絡化、網警、網絡游戲、網民、網頁、網站、網址、發帖”等,在過去簡直是聞所未聞。
跟金融有關的詞匯也很多,比如“銀行卡、信用卡、刷卡、按揭、理財、基金”等。
有關職業、身份的新詞非常多,如“白領、藍領、單身貴族、工薪族、上班族”,不過,這幾年時興的“金領、粉領”等還未收入,專家分析,可能是因為它們還不穩定的原因。
和股票有關的詞語,比如“飄紅、飄綠、熊市、牛市、參股、股市、股利、股民、股息”等足有一大串。
隨著明星對社會生活的影響力加大,由明星生發出了諸多詞匯,如“丑星、歌星、球星、童星、舞星、笑星、新星、影星”等。
這些年,在新聞中出現頻率很高的詞匯,如“艾滋病、非典、禽流感”也是常用詞。
而一些大家熟悉的俗語,如“暴發戶、二百五、三陪”等也被收入其中。
“的”使用頻率最高
56008個常用詞中,“的”使用頻率最高。
民間詞語收藏家黃集偉集詞歷史足有10年,他認為“的”這個語言文化現象很值得探究。“在現代漢語里,‘的’屬結構助詞,我相信,經過很多年,這個詞依然會是詞頻很高的詞。”他接著解讀道,“的”字詞組也相當常見,比如,打醬油的、撐船的、唱歌的,這時“的”代指人。
黃集偉曾注意到一個有趣的現象,江蘇作家程庸寫《官窯美人》,這部25萬字的長篇小說拒絕用“的”,一度為人關注。黃集偉認為,生活中去掉“的”可以,但是會很不習慣,一定要換一種表達方式才行。比如,“這是一個漂亮的杯子”,去掉“的”就變成了“這個杯子很漂亮”。 而實際上表達的意思已經走了樣。
過去許多語言學家如呂叔湘、王力等,也曾多次創導漢語言要簡潔生動,臺灣作家余光中曾作過測試,要看語言簡潔與否,只要看為文,通常20個字里只能出現一個“的”,超過兩個則是啰嗦。
但語言學家也認為,可有可無的“的”完全可以不要,但“的”畢竟是一個很有用的助詞。《現代漢語常用詞表》同其他詞表一樣,漢語中第一高頻詞就是“的”。助詞在漢語中表示的語法意義非常重要,如果不用“的”是不可能的,不是表達不清,就是表意混亂或產生歧義。
常用詞表將每5至10年修訂一次
李行健說,現代漢語常用詞將每5年至10年修訂一次,應與時俱進。否則,常用詞表很容易邊緣化。
語言是不斷變化的,幾年之后,很多詞會從常用詞里隱退出來,又有許多表現穩定的新詞會出現,因此要密切跟蹤語言的發展。“我們此次發布的《現代漢語常用詞表》,雖然詞語統計用了三種語料庫,但畢竟還有局限,收入的詞語也可能有缺漏,不可能一下做到盡善盡美。所以必須5至10年修訂一次。”
語言專家認為,當今社會語言處于飛速發展期,這與經濟社會環境、新觀念、新思想、新事物不斷出現有關。與過去相比,因為有網絡的出現,新詞的產生和傳播也更加迅猛,新詞往往開始在小圈子傳,但有不少詞很快在大眾范圍內傳播。“不過,大多數新詞僅是曇花一現。真正有生命力的新詞,需要時間的檢驗。”李行健說。
有人很關注《現代漢語常用詞表》中收了多少網絡詞。李行健說:“網絡詞語能否進入常用詞表,有兩道門檻必須逾越。首先它必須進入社會大眾的語言中,其次還要為人們廣泛使用具有很高的使用度,達到常用詞的標準后才可能進入詞表。如”網民、網吧、網址“等就經過了上述過程才得以進入常用詞表的。
本報記者 路艷霞
銆?a href="/common/footer/intro.shtml" target="_blank">鍏充簬鎴戜滑銆?銆? About us 銆? 銆?a href="/common/footer/contact.shtml" target="_blank">鑱旂郴鎴戜滑銆?銆?a target="_blank">騫垮憡鏈嶅姟銆?銆?a href="/common/footer/news-service.shtml" target="_blank">渚涚ǹ鏈嶅姟銆?/span>-銆?a href="/common/footer/law.shtml" target="_blank">娉曞緥澹版槑銆?銆?a target="_blank">鎷涜仒淇℃伅銆?銆?a href="/common/footer/sitemap.shtml" target="_blank">緗戠珯鍦板浘銆?銆?a target="_blank">鐣欒█鍙嶉銆?/td> |
鏈綉绔欐墍鍒婅澆淇℃伅錛屼笉浠h〃涓柊紺懼拰涓柊緗戣鐐廣?鍒婄敤鏈綉绔欑ǹ浠訛紝鍔$粡涔﹂潰鎺堟潈銆?/font> |