緒論
在語言系統的各個子系統中,對詞匯系統的研究是公認的語言研究中比較薄弱的環節,這主要表現在對詞匯系統內部的規律認識不夠。這在很大程度上是因為詞匯系統內部成員眾多,成員的特異性又較強,因此詞匯系統內部具有較大的異質性;而且詞匯是變化最快的,既不斷有新的成員加入,也不斷有舊的成員退出,這都為研究詞匯帶來了很多困難。
到目前為止,漢語詞匯研究著作大多是對漢語詞匯進行抽樣式的定性描寫,所涉及的詞條是有限的,所作出的概括往往不夠全面[1]。而且,不少漢語詞匯研究論著所針對的對象就是規范型詞典中收錄的詞,所作的有限的定量調查也是以詞典條目為基礎的。人用詞典的收詞是有限的,而且一般只收見字不能明義的詞語,不收由能產的詞法模式構造的語義透明的詞[2],因此不能很好地反映詞匯的真實使用情況。本書的研究是在大規模平衡語料庫和帶有使用頻率等信息的收詞廣泛的計算機用詞表的基礎上進行的,這樣,一方面所討論的對象更貼近于詞匯使用的真實情況,另一方面可以將定性分析與定量分析相結合,使所得概括更為全面有效。
筆者參與了由清華大學孫茂松教授主持的《信息處理用現代漢語分詞詞表》(以下簡稱《詞表》)的后期研制工作,本書所用的計算機用詞表就指這一詞表。《詞表》的研制過程是這樣的:將目前所有出版的現代漢語詞典中的條目輸入電腦,取其合集,并從現有的分詞語料庫中取出一些可能為詞的單位,陸續補充之后最終得到一個包含大約200,000個條目的原始數據庫,然后建立了一個大約10億字的語料庫來作為支持系統以計算每個條目的出現頻率,又對那200,000左右的原始條目是否為詞進行了人工鑒定,最后確定了92,843個條目,形成了最后的《詞表》(孫茂松等2001)。根據在大約10億字的語料庫中的出現頻率,《詞表》中的條目分為一級常用(56606條)和二級常用(36237條)兩類。《詞表》還對條目的各種形式類別作了人工的初步標注(對于《詞表》內部結構和編寫規范的詳細介紹可參看王洪君2001b,孫茂松、王洪君、董秀芳2003)。
《詞表》所包含的條目遠遠多于一般供人使用的詞典。經測試,這些條目對語料的覆蓋率(除掉專名)超過了96%(孫茂松等2001)。可見,《詞表》中的條目基本能夠代表現代漢語詞匯的實際面貌。
《詞表》中的條目不僅能反映詞匯系統的共時面貌,而且也能透露出變化的信息。詞匯系統是變動不居的,除了語言使用者有意識地創造新詞會給詞匯系統帶來新成員之外,原先非詞的結構在使用中會發生詞匯化(lexicalization)[3](董秀芳2011/2002),從而也會產生出新的詞匯單位。詞匯化的過程在漢語歷史上大量存在著,有些已經完成,還有一些詞匯化過程在現代漢語中正在進行,一些由這樣的詞匯化過程所造成的詞還未被詞典編纂者編入詞典,但《詞表》對這類形式卻有比較多的收錄。
本書的研究材料主要取自《詞表》。在分析某一詞法模式或詞匯現象時,我們都是在窮盡地調查了《詞表》中的相關條目之后進行的,這就在一定程度上保證了所作出的概括的全面性。
我們認為詞匯系統的運作需要兩個部分,一是詞庫(lexicon),二是詞法(morphology)。詞庫是一個語言中需要記憶的所有詞匯單位的集合;對詞法的傳統定義是關于詞的結構、形式和類別的規則,對詞法的新的理解是將其看做可以生成被語言使用者所接受的詞的規則系統。詞庫是顯性的,可直接觀察;而詞法規則是隱性的,較難于觀察。詞法規則體現在詞庫中的條目里,通過外顯的詞庫去研究內在的詞法規則應該是一條可行的研究途徑。
《詞表》可以說是對人腦中的心理詞庫(mental lexicon)的一個近似列表,我們的目標是通過研究《詞表》所反映出的漢語詞庫內容,來探索漢語的詞法特性,即詞語構造中的規則性的東西。詞庫是憑借,我們研究的最終目的是要弄清楚語言使用者頭腦中的詞法知識。另外,我們也試圖根據《詞表》中的材料來探討詞匯的歷時形成所表現的特性及其與共時的詞法規則的可能關聯。
本書的研究目標是加深對漢語詞法特點的認識,在這一點上具有理論意義。語言學家們一個比較公認的事實是:各語言在詞法方面的差異要遠遠大于句法。這樣看來,對于具體語言詞法的深入的個案描寫就顯得尤為重要。不難發現,漢語詞匯面貌與印歐語言詞匯面貌有著很大不同,如果說將描寫印歐語言的一些句法范疇拿到漢語中來還至少能找到一些大致的對應的話,那么描寫印歐語言的一些詞法范疇則往往在漢語中不容易發現恰當的對應物。因此,漢語詞法就更需要進行獨立深入的研究。當然,我們相信語言共性的存在,即使漢語的詞匯面貌表面上看起來與印歐語言有很大不同,在一個更為抽象的層次上,漢語與其他語言的詞法又會表現出深刻的一致性(Packard 2000)。本書在描述漢語詞匯現象的同時,力圖揭示漢語詞法的一些規律性的東西并對其實質進行分析,以期豐富詞法理論。
同時,我們相信本書的研究成果也會具有一定的實用意義,對于各類漢語詞典的編纂、中文信息處理、對外漢語教學中的詞匯教學等都會有一定參考價值。
值得指出的是,我們的研究本身是從本體角度出發的。漢語應用領域,比如中文信息處理和對外漢語教學,對現代漢語的本體研究提出了要求,同時也發掘出了不少值得解釋的新現象。語言學理論如果能解決應用領域所提出的問題,那么這一理論無疑具有很大的價值。但是語言的本體研究和應用研究畢竟是兩個層面,研究的領域和宗旨并不完全相同,二者可以并行不悖。本書的研究是以解釋具有內在系統性的詞法規則和詞庫單位的形成為導向的,基本屬于語言學本體研究,只是在一些地方順便提及在應用領域中對一些語言現象的較為合適的處理策略。
本書在材料的獲取上采用語料庫提取與內省相結合的方法。再大的語料庫反映的也是在本質上無限的言語的有限片段,仍有一些語言現象無法從語料庫中直接獲得(我們編制《詞表》的時候也能體會到這一點,因此根據內省增加了一些語料庫中未發現但卻在日常生活中出現的詞匯條目),所以作為母語者通過內省獲得的對語言現象的判斷在語言研究中是必不可少的。
本書采用定性與定量相結合、理論導向與材料導向(在一定程度上更偏重于材料導向)并行的研究方法。在詞法學、句法學、詞匯化、語法化等理論的指導下,對《詞表》中所反映出的詞匯現象進行了分析和解釋。本書基本上采用的是項目與配列(Item and Arrangement,簡稱IA)[4]和以語素為基礎的詞法(morpheme-based morphology)研究模式。我們認為漢語中語素與語音形式的整齊對應(大多數語素對應于一個音節且音形穩定)以及復合構詞法占優勢的特點,決定了漢語詞法適于用上述研究模式來分析處理。本書也盡量廣泛吸收了當代最新的一些詞法理論,將之用于漢語詞法現象的分析。
在漢語詞法的研究中有一個大的爭論,即語法構詞理論與語義構詞理論的分歧(這兩個名稱取自葉文曦1996)[5]。這代表了對漢語詞法的兩種不同認識,同時也就決定了兩種不同的研究角度。語法構詞理論以陸志韋等(1957)、Chao(1968)等為代表,認為詞法與句法的結構方式具有相通性,注重復合詞的內部形類構成(形類包括語類屬性、詞根或詞綴的性質狀態等。如用“名+名”“動+名”等來描寫復合詞的構成),采用語法的術語來描寫詞的內部結構關系(如并列式復合詞、偏正式復合詞等稱呼);語義構詞理論以劉叔新(1990)、周薦(1991)、黎良軍(1995)、徐通鏘(1991,1994,1997)、葉文曦(1996)等為代表,反對用語法的概念來分析復合詞,否認復合詞中蘊含有句法或詞法關系,只承認復合詞的詞匯性質[6]。其中,有些語義構詞理論的學者走得更遠,甚至放棄了“詞”和“詞類”的概念。
我們認為這兩種認識及其相應的研究角度都有一定的偏頗。語言符號是具有形式和意義的兩面體,在研究中,形式和意義是不能偏廢的[7],而以上兩種認識則是各執一端。如同句法研究的目標是要搞清形式與意義之間的對應關系一樣(朱德熙1982),詞法研究的目標也需要搞清形式與意義的對應關系,具體說是詞法形式與詞法意義之間的對應關系。語素與語素在形式上的關聯對應著它們在意義上的關聯,詞法學的重要任務就是揭示出這種關聯。所以,在詞法研究中,不可以不關注詞內部的形類構成,也不可以不關注詞法規則所對應的語義內容。
漢語語法構詞理論對于詞與非詞的劃界問題作出了重要的貢獻,陸志韋等(1957)所提出的“擴展法”至今仍是判斷詞的一條重要標準。但語法構詞理論派的一些研究偏重于形式方面,重點在于描寫詞內成分的形類與整體詞類的對應,如陸志韋等(1957)對漢語復合詞的內部形類構成作了非常細致的分類說明(如“名+名→名,形+名→名,動+名→名,動+動→名”等),但卻在很大程度上忽略了詞法意義的探索。這種形式構成描寫的弊端是名目繁多,缺乏概括力。而且,這種描寫只流于表面形式的分類,對于真正具有一定系統性和周遍性的詞法規則沒有作出有效的梳理。
語義構詞理論派的研究偏重于語義的描寫,對于詞內成分間的語義關系作出了較為深入的描寫和概括,發現了一些有價值的事實。但由于完全拋棄了形類的概括,也造成了一些問題。語義的概括過于寬泛,限制太少,如果沒有形類加以控制,就無法將可接受的詞法構成與不可接受的詞法構成區分開來,甚至導致對“詞”的概念的取消[8]。
我們主張從形式和意義/功能兩個方面對詞法進行研究,詞法的形式構成與語義構成都會具有一定的規則性,應該將這兩方面的研究結合起來。
對于詞法能不能成為語言學中一個獨立的部門,在語言學界也存在著分歧。不論從形式入手,還是從語義入手,都有一部分學者主張將詞法與句法歸并。從形式入手的如Selkirk(1982),提出了“詞句法”(word syn-tax)的主張,將X標桿理論運用到詞的內部結構中,認為詞法和句法遵循相似的原則。Baker(1985)提出的“鏡像原則”(Mirror Principle)認為詞法的衍生過程完全反映句法的衍生過程。湯廷池(1991)指出:“我們承認在漢語中詞語結構與詞匯部門的存在,但我們并不主張詞匯部門的完全自律,而主張詞語結構與其他句法表顯層次(如深層結構、表層結構、邏輯形式)同受原則系統的支配。”從語義角度入手,在字本位理論框架下堅持語義構詞理論的一些學者也不區分詞法和句法,完全由語義來控制成分與成分之間的組配(徐通鏘1997等)。當然,也有不少學者是將詞法作為一個獨立的部門來加以研究的(Wasow 1977,Anderson 1992等),雖然在研究時總會涉及與語言學其他部門(如語音、句法等)的關聯。
我們不贊成將詞法歸并入句法。我們認為詞法的生成性、規則適用的周遍性無法與句法相比,詞法只具有較弱的周遍性和規則性,而句法的周遍性和規則性則很強;詞法和句法在語義結構上也有差異,不是所有可以由句法表達的語義關系類型都可以用詞法表達,因此,詞法和句法也不能通過統一的語義原則來概括。詞法應該作為一個獨立的部門來加以研究。漢語的詞法與句法雖然在結構原則上具有一定相通性,在所能表達的語義關系上也具有很大相似性,但是二者畢竟有別,在目前對于詞法和句法的了解還不能說是很深入的情況下,將詞法與句法區分開來有利于對語言現象的深入分析。因此,我們主張在漢語中區分詞法和句法領域,將詞法作為一個獨立的模塊來研究。
這里還要對可能引起人們疑惑的術語作一下說明。文獻中有“詞法”“形態學”“構詞法”幾個名詞,它們之間是什么關系?
“詞法”和“形態學”實際都對應于英文的morphology。Morphology一詞源自希臘語,本義是“對于形式的研究”(study of forms)。Morphology這個詞包含兩個語素:一個是morph,義為“形式”;一個是ology,義為“關于……的科學”。它原本是一個生物學的術語,作為語言學術語最早出現于19世紀。
索緒爾指出語言符號具有任意性。如英語中dog指的是狗,而漢語中指稱同樣的東西用的語音形式則是[kou],音義之間的結合沒有理據。如果語言中所有的詞都如同英語中的dog或者漢語的“狗”,那么就沒有詞法可言了。詞庫中除了形式和意義之間的對應完全任意的單純詞之外,還有一些詞匯項是“部分有理可據的”(partially motivated):詞中包括可以獨立出來的部分,而且這些部分是有規律地結合在一起的。如retry、friendly、高高興興,當我們知道re-、try、friend、ly、“高興”這些組成成分的意思,并知道了加綴和重疊的詞法規則之后,就知道整個詞的意思了。構造一個新詞,如果這個新詞不是一個單純詞,有幾種可能的方式:加詞綴、復合、改變原詞根的內部語音形式、重疊等。不同的語言有不同的詞法模式,而且在一種語言中往往有多種詞法模式,不過也往往有一種占主導地位的詞法模式,比如,有的語言以加綴法為主,而有的語言以復合法為主。
很多學者指出漢語缺乏形態,但是這并不等于說漢語中詞的構造沒有規律,也就是說漢語仍是有詞法可以研究的。因為作為語言學的一個分支,morphology指的是對詞的形式的研究,具體來講是對詞的內部結構的研究,目的是了解一個語言中“可能的詞”(possible word)的構造規則。從這個角度說,在漢語中用“詞法”這一術語比用“形態學”更好一些。不過,在英語文獻中有morphosyntax一詞,用來指一些語法范疇或特性,對它們的定義形態學或句法標準都適用,因為屈折詞法本身就是與句法相關的。比如,名詞在“數”這一名目下的各種區別構成一個形態句法范疇,一方面,數的對立影響句法(如單數主語要求帶單數動詞);另一方面,數的對立要有形態上的定義(如復數加-s)。對于morphosyntax這個詞的中文翻譯一般是用“形態句法”,而不太好用“詞法句法”來對譯。
構詞法(word formation)一般是指構成詞的形態變化過程,包括派生(derivation)和屈折(inflection)兩大類。但在文獻中還有一種較狹窄的含義:word formation只指派生,而不包括屈折。雖然構詞法有時和詞法被看做是同義詞,但仔細追究起來,詞法涵蓋的內容比構詞法更多,因為詞法不僅關心詞的形成模式,還關注構造詞語的基本單位、詞法模式的能產性、詞法模式的歷時變化(歷時詞法學)等很多問題。
全書除緒論和結語部分之外,共包括六章。
第一章介紹詞庫和詞法的不同特性及二者之間的聯系。詞庫是一些意義具有不可預測性的單位的集合;而詞法則是具有一定能產性和周遍性的生成詞的規則。
第二章討論漢語詞法的基本單位及主要研究內容。我們認為語素是漢語詞法操作的基本單位,因而在詞法中占據重要地位。派生詞法在漢語中不占強勢地位,漢語詞法應以復合法為主要研究內容。
第三章對漢語詞法操作的基本單位——語素的分類進行了重新認識。重點論述了介于自由與黏著之間的半自由語素,并提出了漢語語素的三分格局:自由語素、半自由語素、黏著語素。半自由語素是歷史發展的產物,由此我們討論了漢語詞法與句法的關系問題。
第四章討論《詞表》中反映出的一些能產性較高的詞法模式。這些詞法模式是生成詞的重要途徑。由詞法模式構成的形式,有的可能進入了詞庫,有的可能未進入詞庫,但它們都是詞。那些進入詞庫的成員一般是發生了意義的特異化或使用頻率較高的。
第五章討論漢語復合詞的內部形類構成與語義構成。在《詞表》的材料基礎上,我們得出了以下概括:漢語名詞性復合詞的強勢結構類型是名名復合,強勢語義模式是“提示特征+事物類”;漢語動詞性復合詞的強勢結構類型是動動復合,強勢語義模式是“方式或途徑+行為或結果”。
第六章討論通過詞匯化過程而正在形成的詞(也包括一些具有一定詞匯性質的固定語)的特點及形成機制與途徑,并指出經常發生詞匯化的結構形式有可能轉化為詞法模式。
本書的第一章和第二章是對一些理論問題的說明,并設定本書的研究角度和研究核心。第三章到第五章重點討論《詞表》所反映的詞法問題(涉及漢語詞法操作的基本單位的性質和分類,詞法和句法的關系,詞法模式,復合詞的強勢結構模式和強勢語義模式等問題),同時也注意揭示詞法與詞庫的聯系。第六章研究的著眼點是詞庫,討論了除根據詞法模式生成之外詞庫成員的另外一個形成途徑——詞匯化,同時也討論了詞匯化與詞法的聯系。第三章到第五章的側重點是共時方面,第六章的側重點是歷時方面。總之,全書圍繞詞法與詞庫的互動與關聯,從共時和歷時不同的側面,以《詞表》所反映的問題為線索,著重探討漢語詞法和詞庫中迄今為止尚未被認真關注或深入分析的一系列現象,并力圖揭示其中蘊含的規律與原則。