一、總貌
2007年的中國語言生活,總體上健康和諧,生動活潑,諸多領域多彩靚麗,語言資源理念逐步建立,非英語外語語種教學和漢語國際傳播持續升溫。國家語言文字工作委員會提出的“構建和諧語言生活”的新世紀工作目標,得到廣泛認同和呼應。
(一) 語言資源理念逐步建立
國家語言資源監測與研究中心及其六個分中心自2004年陸續建立以來,將學界提出的“語言資源”概念移升到國家語言規劃層面。中心利用大規模動態流通語料庫,對平面媒體、有聲媒體、網絡媒體、教育教材等領域的語言使用狀況進行“實態”監測與統計分析,向社會發布年度數據,對構建和諧語言生活起到了不小作用。2007年9月,“國家語言資源與應用語言學高峰論壇”在北京舉行,海內外學者從理論到實踐多角度討論語言資源問題。11月,舉辦“中國民族語文工作成就展暨少數民族語文國際學術研討會”,教育部副部長、國家語委主任趙沁平等領導同志及一些學者的發言,都涉及“珍愛中華語言資源,構建和諧語言生活”的話題。科學保存、保護和開發利用中華語言資源,已成為當今中國一項重要、急迫的任務。
(二) 語言生活生動活潑
移民語言 長江三峽工程移民,截止2007年下半年,已搬遷安置128萬人。遷入廣東、江蘇兩省的三峽移民,與同鄉交際主要使用原方言,與外鄉人交往大多使用帶有一定口音的“地方普通話”。
新疆生產建設兵團有很多職工是上世紀50年代的戍邊移民。北疆地區主體交際語言是“準河南話”,第二代移民會說“準河南話”者高達83.3%,“準河南話”還會在這里保持較長時期。南疆地區的交際語言主要是帶新疆味的普通話,第二代移民不會講父母方言的占85%以上,原因之一是他們幼年接受了上海知青老師的普通話教育。
奧運會和世博會的語言服務 2007年北京奧運會官方網站提供中文、英文、法文三種語文服務,在所有奧運場館及相關大型活動場所提供55種語言服務,語言服務志愿者達5 000人次。北京公共場所雙語標識英文譯法形成規范體系,北京市各類重要公共場所更換或新增英語標識牌247 608塊。
上海世博會吉祥物“海寶”2007年12月發布,設計理念融入中華元素。上海世博會官方網站開通了中文版(簡體和繁體版)、英文版和日文版三種版本,《上海世博》雜志是中英雙語合璧。
手機短信語言 2007年中國手機用戶發送短信5921億條,手機已是名副其實的“第五媒體”。2004年我國推出首款少數民族語言文字手機。當今報紙、天氣預報等紛紛開發手機版,手機短信語言成為語言生活的新內容。
跨境語言 我國有30多種跨境語言,其中有些語言又具有外語性質,比如朝鮮語、蒙古語等。有些跨境語言擁有一定數量的海外學習者,如藏語、蒙古語等,幫助有關人員學習和使用跨境語言,國內外同種語言進行必要的語言文字協調,對富邊睦鄰及國家安全具有重要意義。
二、 領域語言豐富多彩
語文教育領域 教育在提高母語水平、傳承母語文化中舉足輕重。伴隨著中小學語文新課標的實施和修訂,圍繞語文課程“工具性”與“人文性”的統一問題,論爭激烈。學界主張,語文課程要走出應試教育,從側重母語知識向側重母語能力轉型,要幫助學生過好現代語文生活。半個世紀以來“高校母語教育”(習稱“大學語文”)第三次受到重視,不少出版社組織班底編寫各有特色的大學語文教材,許多大學都在開設或準備開設大學語文課程,力圖通過大學語文幫助學生繼續提高母語修養,強化母語文化的認同。
大眾傳媒領域 2007年,全國廣播電視系統結合深入開展抵制低俗之風活動,提出要維護祖國語言文字的純潔和規范,提倡語言美,凈化語言文字環境。2007年春節文藝晚會開播之前,中央電視臺還邀請《咬文嚼字》雜志社派專家協助“春晚”劇組在語言文字方面把關,成效明顯。
法律領域 為保證法律文本的語言質量,全國人民代表大會法律工作委員會于2007年7月成立了立法用語規范化專家咨詢委員會。2007年頒布的《中華人民共和國物權法》、《中華人民共和國企業所得稅法》等,分別被翻譯成蒙古文、藏文、維吾爾文、哈薩克文、朝鮮文等少數民族文字出版,保證了少數民族的法律語言權。到2007年澳門“五大法典”都有中譯本,幾乎所有的法律條文也都完成了相應的翻譯。
科學技術領域 2007年全國科學技術名詞審定委員會公布了通信科技名詞2104條、生態學名詞3414條、免疫學名詞1727條。截至2007年底,出版名詞匯編79部(含第二次審定出版的名詞)。經多年努力,海峽兩岸科技名詞對照與統一工作穩步開展,已完成對照統一工作的學科有20余個,出版了9冊兩岸名詞對照本。2007年還確定以“钅侖 ”作為第111號元素Rg的中文定名。
社會服務領域 社會服務行業根據對象使用服務語言。在西藏、新疆等航線上的多家航空公司,招收少數民族空乘人員,使用藏語、維語等多語服務。2007年海峽兩岸春節包機,廈門航空公司、中國國際航空公司都提供閩南方言服務。東方航空公司、中國國際航空公司除使用普通話、英語雙語廣播外,還根據情況推出韓語、日語服務。北京首都國際機場、上海浦東機場等,提供多文種指示服務。
青藏鐵路則使用多語種多文種服務。列車內、車站上的指示牌,一般都有藏文、漢文、英文三種文字;車站和火車上的播音,有些車站根據情況使用其中的兩種語言播音,有些使用普通話、藏語、英語三種語言播音。
北京秀水市場是一家涉外集貿市場,接待國外顧客時,99.5%都使用英語,其它使用語種依次為俄語、西班牙語、日語、韓語等。導購員大都能說幾種簡單的外語詞句,甚至可以簡單應用十幾種外語詞句。
三、 語言生活熱點
非英語外語語種熱 俗稱“小語種”熱。2007年北京外國語大學、中國傳媒大學、廣東外語外貿大學等高校,報考“小語種”人數比往年增長五成甚至一倍。北京暑期“小語種”培訓班招生數量,2007年比2006年增長近30%。目前列為上海緊缺人才培訓工程的非英語外語語種,有俄語、西班牙語、意大利語、葡萄牙語、阿拉伯語等8種。我國小語種人才培養,還不能滿足社會經濟文化發展的需要。有關部門應根據國家的未來發展做好外語語種規劃,采取切實有效的措施鼓勵非英語外語語種的教育。
虛假廣告用語熱議 語言虛假廣告大多信息失真、格調低俗、言語失范,是廣告語言的熱點。2007年中央電視臺“3?15晚會”對虛假廣告強力曝光。許多名人代言的廣告,如某種減肥茶、某種不粘鍋等,語言名不副實。據廣告新聞網統計,2007年(截止到11月),有關虛假廣告250多條,涉及保健用品、藥品、醫療器械及醫療機構等方面約為60%。衛生部、國家工商總局、國家廣電總局、國家食品藥品監管局及一些地方政府為此采取了不少維護消費者權益的措施。
新詞新語熱 《中國語言生活狀況報告(下編)2006》向社會公布了2006年產生的171條新詞語后,引起媒體和網民的熱議。國家語言資源監測與研究中心采用計算機半自動提取的方式,對2007年度新詞語進行調查,根據“公眾語感”及若干操作準則進行人工干預,并在新浪網上廣泛征求網友意見,最后得到254個新詞語。
漢語國際傳播持續升溫 2007年共有來自188個國家和地區的19.6萬名各類留學人員在我國境內的544所高等學校和其它教學、科研機構學習。來華留學生數量、生源國家和地區的數量,均達到新中國歷史上的新高。
2007年全球開辦的孔子學院已有210所,分布在64個國家和地區,教職工逾千人,開設漢語課程1 200多班次,學員4.6萬人。中國國際廣播電臺(CRI)創辦廣播孔子學院,用38種語言,向全球漢語學習者提供廣播和網絡視頻教學。
2007年國務院學位辦公室下發《漢語國際教育碩士專業學位設置方案》的通知,成立了全國漢語國際教育碩士專業學位教育指導委員會。國家漢辦發布《國際漢語能力標準》、《國際漢語教師標準》和《國際漢語教學通用課程大綱》確立了我國統領國際漢語教學標準的權威地位,促進了世界各國漢語教學質量的提高。
四、語言文字使用的若干數據
報紙、廣播電視、網絡(新聞)用字用詞用語調查,是每年語言實態調查的基本項目。2007年調查語料10.07億漢字、12.36億字符次。重點進行了2005年、2006年、2007年三年數據的比較。
(一)漢字使用情況
對漢字使用情況的調查結果顯示:
1.高頻字(覆蓋率達到80%,90%,99%)數量穩定。低頻字(頻次低于10次)隨機偶然出現。
2005年、2006年、2007年的數據調查分別是在7.32億、9.79億、10.07億字的語料上進行的,三年數據調查的語料量不同,總字種數也不同。2005年、2006年、2007年覆蓋率達到80%的字種數分別是581、591、595;達到90%的字種數分別是943、958、964;達到99%的字種數分別是2314、2377、2394。從高頻字占總字種數的比例來看,隨著總字種數的增加,高頻字的比例呈減小的趨勢。這些數據表明高頻字并不會隨語料規模或字種的增加而增多,而是趨于保持穩態。這說明高頻字的使用具有很強的穩定性,當語料規模達到一定的值之后,高頻字的分布總是比較均勻,語料中所增加的字種數多為偶然使用,對高頻常用字的分布影響不大。
對比三年的前600(覆蓋率達到80%以上)最高頻率用字,可以很好地看出社會語言生活的變化。如:“漲、季、盤、樓、均”等字在2007年進入前600,而這些字在2006年、2005年均在600位之后。
2005年、2006年、2007年低頻字的數量分別是1650、2362、3147,從低頻字占總字種數的比例來看,總字種數越少,低頻字的比例越低。表明低頻字的出現會隨著語料規模的增大,隨機偶然出現。
2.與現行規范字表對比:每年的用字總表與現行規范字表之間的差異大于年度字表之間的差異。
2005年、2006年、2007年用字總表都與現行規范字表之間存在著差異。取三年用字總表的前2500字與一級常用字比較,有差異的字數分別是357、331、334字;取三年用字總表的前3500字與《現代漢語常用字表》比較,差異字數分別是398、388、396;取三年用字總表的前7000字與《現代漢語通用字表》相比,差異字數分別是506、517、654。將每一年用字總表與現行規范字表之間的差異字進行比較,年度用字總表與現行規范字表之間的差異大于年度用字總表之間的差異。
(二)詞語使用情況
對詞語使用情況的調查結果顯示:
1.年度之間詞語的使用變化很大,但高頻詞語的使用穩定,詞語覆蓋率的分布穩定
年度之間的相同詞種數平均占到年度詞種數的22.1%。無論全部語料還是各媒體語料,年度之間的用詞用語差別較大,每年都有大量的獨用詞語出現。這些獨用詞語記錄著年度詞語使用的變化情況。
高頻詞語(覆蓋率達到90%的詞語)使用具有很強的穩定性。年度間詞種數的變化很大,但年度間高頻詞語的差別不足1000條,年度間共同使用的高頻詞語平均占高頻詞語的85.76%。《中國語言生活狀況報告》(2007)下編列出了2007年度高頻詞語表。
高頻詞語中的年度獨用詞語,多反映了當年的社會熱點。如2007年排在前面的高頻獨用詞語“減排、炒股、嫦娥、生豬”等,與年度流行語十分類似,反映了當年的社會生活和重要事件;排在2006年高頻獨用詞語前面的“榮辱觀、饅頭、核試驗”等詞則與當年的社會主義榮辱觀教育、娛樂界的“一個饅頭引發的血案”、朝鮮核武器試驗等事件密切相關。
每年的詞種數無論在數量還是詞形上,都有很大的差別,但從詞語覆蓋率的分布來看,三年表現出很強的一致性,三年不同覆蓋率下的詞語分布,只在覆蓋率達到99%以上時略有差異。
2.成語習用語的使用
2007年嘗試性地對語料中的成語和習語進行了調查。從調查結果來看,自動分詞語標注軟件還需進一步提高對成語和習語的識別。成語習語的使用無論在詞種上還是詞次上,比例都小于1%。
3.流行語
2007年度流行語的提取首次融合了報紙、廣播電視、網絡(新聞)三種媒體語料,三個分中心采用統一的技術路線,分別自動提取各媒體上的候選流行語后,再進行整合,最終得到“2007年度中國媒體十大流行語”。
流行語記錄了年度的社會生活,2007年的“中國媒體十大流行語”在常規的“綜合類、國內時政類、國際時政類、經濟類、教育類、科技類、社會生活類、文化娛樂類”外,新增了“奧運專題、金融專題、構建和諧社會專題、民生專題”等,凸顯了2007年度社會生活的主題和特色。
4.新詞語
新詞語是語言對社會變化表現最敏感的部分,它凸顯了語言的動態變化,是語言監測的重要內容之一,也是人們關注的焦點。2007年的新詞語監測工作,是在國家語言資源監測語料庫中2007年度10.07億字語料的基礎上做的,采用先機器提取、后人工干預的方法,并通過網上公布、聽取群眾意見,最終采集了254條新詞語。
這些新詞語表現出的特點有:第一,多字詞語占優勢。其中三字詞語36.61%,四字詞語28.35%,兩者合計近65%。第二,大量使用詞語模類推構詞,詞族化表現明顯,運用較多的類后綴有“~族、~客、~奴、~友、~門、~吧、~日”等。詞族化的新詞語占27.55 %。第三,名詞性詞語最多,占91.33%。第四,構成材料以漢字為主,兼有別樣。254個新詞語中有13個字母詞。第五,新詞語來源于多個渠道,分布在不同領域,反映了社會生活的方方面面。其中生活、文化、科技和經濟領域產生的新詞語較多,占67.32%。
(三)網絡語言使用情況
2007年度的中文網絡用字用詞調查以網絡媒體監測語料庫2007年的語料為基礎,調查對象包括漢字、符號、詞語以及BBS網絡用語。
1.用字調查
(1)漢字的覆蓋率調查顯示:在10%至70%的各級覆蓋率下,新聞語料所用的字種數都大于博客語料和BBS語料,這反映新聞類語料涉及的內容更豐富,結構更均勻、平衡,使用的高頻字字種更多。
(2)對比新聞語料、博客語料、BBS語料的共用字、獨用字發現:新聞、博客和BBS三類語料的共用字種數為8 460個,占全部字種數的56.74%。博客、BBS的獨用字比較多,且低頻。其中博客有1918個,BBS有1383個,造成這種現象的主要原因為:網絡上流行的“火星文”的干擾、一些由生僻字組成的網名、海外網民使用的繁體字等。
(3)調查顯示一些與外來詞語相關的漢字、與網絡相關的語氣詞進入到高頻字中,如“爾、伊、迪、呵、哦”。
(4)對比2007年與2006年的高頻字,新聞語料的高頻字相對比較穩定,兩年的數據相比,前600高頻字中,只有13個不同;前1000高頻字中,只有20個不同;前3500高頻字中,只有74個不同,相同部分占97.89 %。而BBS語料的高頻字的變化較大,兩年的數據相比,前600高頻字中,有68個不同;前1000高頻字中,有96個不同;前3500高頻字中,有148個不同,相同部分占95.77 %。
(5)利用頻率比值對比分析2006年與2007年的語料,2007年頻率比值較大的“跌、漲、股、幅、券”幾個字都和股票有關,十七大的召開使得“黨”字的頻率比值增大;2007年豬肉價格上漲,使得“肉”字的頻率比值較大。
2.符號使用調查
從符號的種數來看,博客所用符號的種數最多,BBS與之接近,都有900多種。從符號占語料頻次的比例來看,新聞和博客中符號所占的比例相差不是太大,而BBS中符號所占的比例明顯高于其他兩類語料,這與BBS用字用語往往形式上比較簡潔、比較隨意等特點有關。另外,BBS中也包含大量的與專業技術相關的討論,有些是直接用英文書寫的;BBS中使用的網絡用語也比其他兩類語料多。
3、詞語調查
(1)前100個高頻詞語中單字詞為76個,其余24個為二字詞語的”是使用頻率最高的一個詞。
(2) 2007年語料中,構詞數最多的字是“人”,分別在162個詞語中出現。構詞數最多的前10個字分別是:人、大、不、上、出、國、中、一、行、年。有721個字只在一個詞語中出現。
(3)高頻詞語中,一字詞出現的總頻次占全部高頻詞語頻次的49.04%,排名第一;二字詞語的詞種數最多,占全部詞種的70.53%,在頻次上所占比例為47.86%;一至二字詞語在詞種上占了88.40%,在頻次上占了96.90%。說明在實際應用中,主要以一至二字詞語為主。
(4)使用頻次最高的成語為“一網打盡”,它在網絡上使用時,除了其原有的詞義外,還有很多使用的是與網絡有關的引申義。
(四)基礎教育語文新課標教材的語言狀況
本次調查包括了新課標九年義務教育階段語文教材中的“用字”、“用詞”、“基本句型”等內容。鑒于教材的發行時間、發行量、覆蓋面及影響力等因素,選取了2001-2004年出版的人民教育出版社、江蘇教育出版社、語文出版社和北京師范大學出版社的九年制義務教育新課程標準語文教材。
1.漢字調查
四套教材的容量人教版為48.3萬字,蘇教版為37.3萬字,北師大版為44.9萬字,語文版為52.6萬字。共出現漢字字種5069個,其中四套教材共用的漢字字種3590個,占總字種的70%;部分教材共用字種905個,占17.8%;只出現于一套教材的獨用字種共574個,占11.3%。
漢字使用中,覆蓋率為50%時使用了127字,覆蓋率為90%時使用了1164字,覆蓋率為95%時使用了1712字。前3500字的覆蓋率達到99.6%。
2.詞語調查
使用軟件自動分詞并經人工干預,得到的分詞單位為1290126個,不同的詞種數為50670個。在四套教材中均出現的詞種數有10460個,占總詞種數的20%。在各套教材中,共用詞種數最高的占45%,最低的只占36%;每套教材的獨用詞種數在1/5至1/4之間。
從詞語出現的頻次來看,覆蓋所有語料80%時用了3320條詞,覆蓋90%時用了9101條詞,覆蓋95%時用了17505條詞。
從詞語在課文篇數的分布來看,分布在51篇課文以上的只有1630個詞語,占詞語總數的3.22%。分布在11-50篇課文的有5297個詞語,占詞語總數的10.45%。二者相加,共有詞種6927,占詞語總數的13.67%,不足詞語總數的1/7。出現1次的達23200個詞,占詞語總數的45.79%,出現1-5次的占77.55%。可見教材詞語雖然數量多,但分布面不廣,復現率不高。
比較詞語的出現頻次與在課文中的分布,發現分布面廣的詞更容易凸顯語文性詞語。根據分布上的特征,再參考語義的指稱性與結構的凝固性,提取了基礎教育的3000條基本詞。這個詞表的特點是重視書面語特色,重視古今語言的學習,重視文學語言的學習,重視基本生活日語詞語。
3.句型調查
對小學1-3年級課文的所有句子進行了句型、句式、句類的普查。發現單句中“主謂句”的比例高于“非主謂句”。主謂句是劃分句子結構成分的基點,具備句子結構完整性的一切條件,對初級階段的學習者形成句子概念具有舉足輕重的作用,對學生語言結構的獲得和語言能力的形成和錘煉也具有重要作用。非主謂句具有更多的語用和交際特點,口語化、敘述強。
根據充當謂語詞語性質的分類,動詞謂語句占總單句的88.37%,居第二位的是形容詞謂語句
在8種特殊句式中,出現頻率高的依次是“連動句”、“是字句”和“存現句”,“使字句”“比字句”“被字句”出現比較少。
在復句中,居首位的是“順承關系”復句,高于所有其他關系復句之和。順承關系復句的大量存在,反映的是漢語句子總是按一定的時間、空間或事理關系的先后來敘述的,與小學生的邏輯習慣相吻合。
在四種句類中,陳述句占70%,疑問句占約14%,感嘆句占約15%,祈使句只占約1%。
《中國語言生活狀況報告(2007)》,已由商務印書館出版發行。
版權所有:中華人民共和國教育部 中文域名:教育部.政務
京ICP備10028400號-1 京公網安備11010202007625號 網站標識碼:bm05000001