- 漢語二語者書面語體習得研究
- 汲傳波
- 2244字
- 2025-03-28 11:49:13
1.2
研究目標與研究內容
1.2.1 研究目標
通過對不同語體語料庫的量化分析,確定能夠區分非正式語體(口語語體)和正式語體(書面語體)的語體特征標記。正如馮勝利(2015)所指出的,“不同的文體使用著不同的‘語體構件’(如俗體詞、正體詞、典體詞以及俗體句、正體句、典體句等)”,“三種語體(通俗、正式、莊典)分別和總共有多少‘構體部件’,還是一個有待研究的新課題,因此,用哪些部件組成哪些‘文體’(如記敘體、論說體、操作體、新聞體等),更是一個未曾開墾的處女地”,“語體的研究必將在這里開辟出大量的可耕地”。馮勝利(2015)的觀點非常有前瞻性,但因目前尚無可供研究使用的大型口語語料庫,構建一個“語體構件”庫相對比較困難。另外通俗、正式、莊典三分系統雖然在理論上是可行的,但是在語言實踐中將莊典納入正式進行研究更有可操作性,也就是將語體劃分為非正式、中性、正式語體三大類(后文將詳述具體原因)。我們采納馮勝利(2006a)的觀點,將日常口語看作非正式語體,書面語看作正式語體。我們的研究目標之一是歸納、整理學界現有的關于語體區別特征的具體、零散的研究,利用現有的語料庫進行驗證和篩選,嘗試初步建立區分非正式語體和正式語體的特征標記群。
依據語體特征標記,將留學生書面語中介語語料庫與漢語母語者語料庫進行對比,將留學生學術論文語料庫與漢語母語者學術論文語料庫進行對比,發現留學生書面語體習得特點,提出改進語體教學的建議。
1.2.2 研究內容
首先,梳理目前漢語學界的語體研究成果,整理現有成果中能夠區分非正式語體和正式語體的語法格式、核心詞匯。我們同意金立鑫、白水振(2012)的觀點,即“構成不同語體的語言單位一定有著較為明顯的差別,這些差別不僅體現在具體的用詞上,還體現在對句法結構或句式的選擇上”。比如,已有語體語法研究成果表明“V+向/往+NP”用于書面正式語體,“向/往+NP+V”用于口語非正式語體(王永娜2011a);“NP+們”用于書面正式語體(王永娜2011b);“V+和+V”是正式書面語體(王永娜2012);“NNVVN”用于書面正式語體,“VNN”用于通用語體,“VN的(N)”用于口語非正式語體(王永娜2015a);“在”屬于口語非正式體,“當現實”屬于書面正式體,“當虛構”則傾向于文藝體(王永娜、馮勝利2015);判斷句是書面正式語體(王永娜2015b)。這些研究成果為區分非正式語體和正式語體提供了參考。另外,還有一些語體研究成果也可以借鑒,比如,書面語中主語大多數由名詞充當,口語中主語大多數由代詞充當,書面語的定語構成中名詞占絕對優勢(劉丙麗等2012);若一對同義詞有音節上的差異,口語傾向于為單音節,書面語傾向于為雙音節(張文賢等2012);22個條件標記在口語中的使用頻次遠高于書面語體(姚雙云2014)。在現有研究成果基礎上,我們運用北京語言大學BCC語料庫中各30億字規模的微博語料庫和科技語料庫,將漢語語法學界目前研究的能夠區分語體的語法格式、核心詞匯進行卡方檢驗,確定一批典型的語體特征標記。
其次,結合歐化語法研究(賀陽2008a)、書面語研究(孫德金2012a)、古句式研究(馮勝利2006b)的成果,補充一批典型的語體特征標記。這些語體特征標記與經過驗證、確定的標記共同構成“標記群”,能夠有效區分兩種不同的語體(正式與非正式)。具體研究時也借鑒英語學界的研究成果,比如Biber&Conrad(2009)關于英語口語樣本和學術論文樣本中名詞、代詞和形容詞的研究。這些成果為本研究提供了非常有價值的參考。
再次,運用HSK動態作文語料庫(從中抽取語料新建不同水平、不同國別語料庫)、國家語委現代漢語平衡語料庫、中國高中生作文語料庫、自建語料庫(韓國學生學術論文語料庫、中國學者學術論文語料庫),利用本研究所確定的語體特征標記群,分析留學生書面語、學術漢語中的語體使用情況。具體而言,通過對比留學生書面語和漢語母語者書面語,分析留學生語體習得總體情況,是否存在口語化傾向,是否存在典雅度不足現象;通過對比不同水平的留學生在語體習得方面有無差異,分析語體習得情況是否與留學生的語言水平呈正相關;通過分國別探討日本、韓國、歐美留學生的書面語體習得情況,分析國別特點。通過自建語料庫,以韓國學生為例,對比其學術論文和中國學者的學術論文,分析韓國學生漢語學術寫作中文言結構的使用是否不足。
最后,嘗試從教材和口語格式收錄問題入手分析面向留學生的語體教學存在哪些問題,對教材及辭書編寫提出改進建議。具體而言,這一研究主要通過檢索北京大學CCL語料庫、中國傳媒大學有聲媒體文本語料庫[8]、自建《實話實說》語料庫,分析精讀教材中語法格式“待到……之時”“何嘗”的語法練習設計問題;考察口語格式在《現代漢語詞典》(第7版)、《漢語水平詞匯與漢字等級大綱》(修訂本)等中的收錄情況,以及在漢語對話語料中的使用情況,進而分析日本留學生漢語書面語中存在口語化傾向的原因,以及《現代漢語詞典》(第7版)等在口語格式收錄方面的得失。
1.2.3 擬突破的重點和難點
正如趙雪、李平(2013)所指出的,“如果不能確定哪些語言標記在語體研究上具有普遍意義,那么再先進的技術手段也將是英雄無用武之地”。因此本研究的重點和難點是語體特征標記的確立和提取。近幾年受語體語法理論的影響,漢語語法學界發表了一系列關于區分不同語體的語法特征的文章,這將有助于本研究對研究難點進行突破。另外,目前BCC語料庫已經區分了不同語體(微博接近非正式體,科技為正式體),這為不同語體的語法特征、詞匯特征的計算機提取奠定了基礎。在匯總所有語體特征標記之后,在BCC微博、科技語料庫中查找頻次,然后運用卡方檢驗,選取有顯著差異的語體特征標記。