第一章 詞匯知識的構成:詞庫與詞法
第一節 詞庫與詞法的區別和聯系
每個語言中都有一定數量的詞以表達思想,學習任何一門語言都必須掌握該語言中一定的詞匯量,顯然,詞匯是語言的重要構成要素。新的詞不斷出現,一個人在一生中不斷學習和掌握新的詞匯單位,那么我們如何來衡量一個人是否掌握了他所使用的語言中的詞匯呢?我們認為最重要的標準是掌握了一定數量的詞匯單位和該語言的詞法知識。語言中的詞不是雜亂無章、彼此無關的,而是相互之間存在著形式與意義上的各種聯系,這些聯系決定了語言中詞匯的可學性(learnability)。語言使用者掌握了一個語言中的詞匯,也就是獲得了內化了的(internalized)關于這個語言的詞匯知識,或者說是詞匯能力(lexical competence)[9]。當一個語言使用者遇到一個類似詞的形式時,可能會作出以下的某一種判斷:“這是我所用的語言中的一個詞,我用過或以前聽別人說過”“這個詞我以前沒有遇到過,但是它可能的意思是什么什么”“這個詞我以前沒有遇到過,它的意思可能與什么什么有關”“這個詞肯定不是我們語言里的詞”等。這些判斷就是基于一個人所具有的詞匯知識作出的。其中既包括了對個體詞的知識,也包括了關于詞的構成的一般知識,即詞法知識。
以下證據可以證明人腦中有關于詞法的知識。
證據一:人們可以理解以前從來沒有看到過的詞。憑借的工具就是頭腦中的詞法知識。比如以下英語中的詞是20世紀90年代以后才出現的:cyberspace、cybersurf、cyberchat、cyberholic、cyberspeak,但是英語母語者在第一次見到這些詞時,也可以比較輕松地猜到這些詞的意思。因為這些詞都包括一個新興的前綴和一個由先前已經存在的詞充當的詞根,cyber-這個前綴表示與計算機輔助交流有關,知道了這個前綴的意思,知道了詞根的意思,又知道派生詞的結構規則,整個詞的意思就很容易知道了。
證據二:兒童對母語詞法的習得。兒童對語言的習得包括對詞法的習得。包括以下方面的內容:
(1)可以從語流中分析出語素。
兒童掌握語言的一個重要步驟就是從語流中切分出有意義的音義結合體,即語素。對于一種陌生的語言,我們無法知道一句話中包含多少個詞,不懂英語的人當聽到一串連貫的語流時,如聽到Thecatsatonthemat這句話時,不知道其中包含幾個詞,而英語母語者則能輕松地指出其中包括六個詞。
(2)可理解語素的音和義以及語素排列成詞的規律。
知道語素的音和義是運用語素的前提。對于語素排列成詞的規律是在習得大量的詞語之后慢慢掌握的,而掌握之后就能理解或者創造新詞。
兒童在語言習得中所犯的錯誤也能證明兒童在習得語言的過程中對詞作了詞法分析。比如兒童在第一個階段會說出better(good(好)的比較級),但是在一個后來的階段,兒童的話語里會出現gooder這個錯誤形式,在一個更后來的階段兒童又會放棄gooder,而說better。這三個階段具有不同的性質。第一個階段,兒童話語中出現的正確形式better是出于機械的模仿,在這個階段,兒童有可能還沒有意識到better和good之間的關系。在第二個階段,兒童掌握了形容詞比較級的一般構成方式是在原形后加后綴-er,因此創造性地說出了在大人的言語輸入中不存在的形式gooder,這一事實有力地證明了孩子習得語言不只是機械模仿,而是進行了分析,歸納出了一條詞法規則,并對其加以創造性地運用了,但是這個運用出現了過度概括(over-generalization)的錯誤。到了第三個階段,孩子在成人的糾正下,知道了good這個詞是特殊的,其比較級形式是不規則的,因此放棄了gooder這個錯誤形式,重又回到正確的軌道上來了。這個曲折的過程正好顯示了兒童對詞法知識的逐步習得。
對語言使用者的詞匯能力進行分析,可以發現詞匯能力包括詞庫與詞法兩個部分。
詞庫(lexicon)是一個語言中具有特異性(idiosyncrasy)的詞匯單位的總體[10],存儲在語言使用者的頭腦中,所以又稱心理詞庫(mental lexi-con)。所謂“特異性”,主要表現在不具有規律性和理據性,不能由其他知識推知,而只能靠記憶的方式來處理。詞庫中的項目都是語言中意義不可預測(unpredictable)的成分,具有不規則性,表現出形式與意義之間的任意性或非常規的聯系,所以需要以清單方式一個一個地存儲,需要時就可以直接從這個清單中提取。詞庫的主體是詞,但也可能包括大于詞的習語和小于詞的語素(對于詞庫中所包括的內容,不同的學者有不同的看法,對此我們在后文有進一步的討論),因為這些也是需要記憶的詞匯性的成分。
詞庫中的成員在特異性上有不同的程度。單一的語素或由一個語素構成的單純詞具有完全的特異性,因為按照索緒爾的觀點,單個語言符號的形式和意義之間的聯系具有任意性(arbitrary)。一些合成詞和習語雖然包括不止一個語言符號,但也具有一定特異性。這種特異性可以表現在語音上,也可以表現在語義上。比如,women(女人們)作為復數,其中元音o的發音與單數形式woman(女人)中的發音不同,因此women在語音上具有一定特異性;當整體的意義不能完全由組成成分的意義和組合規則推知的時候,語義上就有一定的特異性,比如成語“胸有成竹”的含義就不能通過組成成分的意義的加合而得出。特異性的存在是收入詞庫的前提。
按照一個廣為接受的觀點,詞法是關于一個語言中可以接受或可能出現的復雜的詞的內部結構的知識(Aronoff 1976,1982等),或者說是生成語言中可能的詞的規則。詞法是一套規則系統,可以說,規則性既可以存在于句法之中,也可以存在于詞法之中(注意,詞法的規則性與句法的規則性有差異,這一點在后文還會談到)。
很多詞之間是有部分相似因而相互關聯的,復雜的詞中可能包含簡單的詞,如working與work有關系,前者在形式上包含后者,是在后者的基礎上通過一個加后綴-ing的詞法手段生成的。語言中這些內部結構清晰的詞可能不是以清單的方式儲存在心理詞庫中,而是在遇到這個詞時動用詞庫中存儲的成分以及詞法中的規則來對其加以理解,在要對其加以使用時,也是根據詞庫中的材料和詞法規則臨時合成,理解和使用完畢之后,就將其放棄,而不是將其整體存放在詞庫中[11]。可以說,這類內部結構清晰的詞是在線(on-line)理解和生成的。
注意,不在詞庫中存儲的成分并不等于不是詞,只是不需要以清單方式存儲而已。比如,由一些能產性極強的詞綴構成的派生詞就不在詞庫中存儲,但這并不意味著這些派生詞不是詞。如漢語中的“第”與數詞可以構成序數詞(郭良夫(1983)就將“第”定性為前綴),“第+基數詞→序數詞”這樣的一個詞法規則具有周遍性,所有的基數詞前都可以加“第”構成序數詞,因此詞典無需也不可能全部收錄所有的“第”與基數詞組成的組合,只要給出“第”作為詞綴的意義及用法就可以了,但并不能據此認為“第+基數詞”不是詞,因為按照“第+基數詞”在句法中的使用情況,它完全符合詞的“句中最小的自由使用的單位”的定義,是詞無疑。Di Sciullo&Williams(1987)將需要列入詞庫中的詞稱為“詞匯詞”(lexical word),而將由詞法規則生成的詞稱為“詞法詞”(morphologi-cal word),本書認為這種區分是很重要的。
詞法具有能產性,在這一點上與句法相似,而與詞庫有別。正因如此,在傳統的語法研究中,詞法總是與句法一起算做語法研究的對象。詞法的能產性造成的是詞,句法的能產性造成的是短語和句子。正是因為詞法具有能產性,所以語言中才可以不斷出現新的詞,而語言使用者也可以像理解新的句子一樣可以理解原則上是無限的可能出現的潛在的詞。新的詞,雖然其具體形式以前沒有在語言中存在過,但其構成規則卻是語言中現存的,屬于語言使用者頭腦中詞法知識的一部分,所以語言使用者對新詞的理解不會產生太多困難。當代詞法學理論認為,正如句法研究的目標不是語言中實際出現的所有句子的集合,而是可以造出語言中潛在的合法句子的規則,詞法研究的目標也不是語言中現實的詞的集合,而是語言中可能的詞,即研究合法的詞的生成規則。
但是一個語言中的詞法所允許的可能的詞能否成為該語言中實際出現的詞,這卻是一個具有詞匯性的問題(lexical issue)(Anderson 1992),即不是由明確的規則來控制的,而是具有一定的特異性。本書第四章的研究將揭示制約可能的詞成為現實的詞的一些社會文化和認知因素。
詞法作為一個規則系統,有別于句法,它作用于詞匯層面,而不作用于句子層面。從Chomsky(1970)論“名詞化”(nominalization)的觀點發表以來,生成語法學派的研究者較為普遍地接受了嚴格區分句法與詞匯兩個層面的處理方式。由于詞庫和詞法都為語言使用提供詞,在一些詞法研究者的處理中,詞法是放在詞庫中的(Jensen&Stong-Jensen 1984,Ander-son 1992等),以與句法層面相區分。這樣詞庫就包括了兩部分:一部分是具有特異性的詞匯單位的清單,另一部分是構詞規則(word formation rules)[12]。這樣詞庫就是在一系列規則控制下的語言知識(Anderson 1992)。這樣處理的好處是凸顯了詞匯與句法的區別,但是就只針對詞匯部分的研究而言,可以采取另外的處理方式。
需要指明的是,本書所使用的“詞庫”概念專指詞匯單位的清單這一部分內容,而將詞法與詞庫并列。我們同意將詞法作為一個獨立的模塊的觀點(Matthews 1974,Anderson 1992等),作為一個規則系統,詞法不宜并入作為單位集合的詞庫。其實,在詞法學以往的研究中,列出的詞匯清單部分與詞法規則部分也是分別進行探討的。在我們的體系中,詞匯知識作為一個上位概念,涵蓋詞庫和詞法,詞庫和詞法是在詞匯知識下的兩個獨立的但相互聯系的模塊。
嚴格來講,詞法和詞庫的區分是基于個體語言使用者的,而不是基于由人編輯而成的詞典(Aronoff&Anshen 1998,徐國慶1999)。如果一個詞對于某個特定的語言使用者來說,其中有一個組成部分的意義不明確或組成成分之間的關系不可理解,這個語言使用者就可能把這個詞以整體的形式貯存在他/她的心理詞庫中,以便下次可以使用。但可能這同一個詞對于另外一個語言使用者來說,其內部形式是可以分析的(比如因為這個語言使用者掌握更多的詞的歷史知識),因而不把它貯存在心理詞庫中,而是通過詞法來處理。所以詞法和詞庫的區分是存在著語言使用者的個體差異的(Di Sciullo&Williams 1987)。但是為了研究方便起見,我們可以把一般詞典收錄的條目看做是可能進入大多數人的心理詞庫的形式[13],而把一般詞典未收錄的條目看做不需要進入大多數人的心理詞庫的形式。我們在后文的分析中就是采用了這樣的策略。
詞庫是一個單位庫,是一些詞匯基本單位的集合;詞法則類似于運算系統,借以將詞庫中的基本成員組合起來生成復雜的詞匯單位。詞庫和詞法雖然處理的領域不同,但二者是有關聯的。二者的相互作用表現在以下幾個方面(Aronoff&Anshen 1998):
(1)阻斷效應(blocking effect)。在詞法學中阻斷效應指的是這樣一種現象:一個形式的不出現是由于有另一個形式的先期存在(Aronoff 1976)。比如英語中不存在由名詞化后綴加形容詞詞根構成的派生名詞*gloriosity,這是因為英語中已經有了表達這一意義的單純詞glory;不存在動詞過去式形式*goed,是因為有不規則的詞形went存在;不存在名詞復數形式*womans,是因為有women存在;不存在副詞*goodly,是因為有well存在;等等[14]。如果不承認詞庫和詞法之間存在聯系,就很難解釋阻斷效應的存在。語言學家也觀察到這樣的現象:兒童在習得語言時,經常出現過度概括的錯誤,當兒童在沒有掌握不規則形式went之前,會在話語中使用*goed這一不合法的形式,當他們掌握了went之后,就放棄了*goed。第二語言習得者也會犯類似錯誤,即用一個按詞法規則生成的形式來代替一個詞庫中的成員,這樣的錯誤也可以在進一步的學習中得到糾正。這些現象似乎表明了這樣一個心理過程:人們在表達一個意思時好像是先檢查詞庫中有沒有現成的詞,如果沒有,才動用詞法規則。如果有現成的詞,詞法規則就不會被啟用[15]。這就是說,詞庫里的形式相對于由詞法生成的形式來說具有優先性[16]。詞庫里的形式對語言使用者來說越熟悉,使用頻率越高,阻斷效應越可能發生。這可以由處理速度得到解釋。對合適的詞的檢索就好像是在詞庫與詞法之間的一場競賽,誰的速度快,誰勝出。頻率越高,處理速度越快,越容易被提取。
(2)由詞法在線生成的詞可能由于歷史發展而變為詞庫里的成員。一些由詞法規則生成的本不用在詞庫中儲存的詞,由于構成這些詞的詞法規則在語言發展過程中變得模糊,這些詞的內部形式也隨之模糊化了,最后變得完全不透明,不可分析,結果這些詞就進入了詞庫。對于漢語史的研究也揭示了這種變化(董秀芳2011/2002)。這一事實表明詞法可以和詞庫相通,詞法的規則形式可以在發展中變成不具有可分析性的特異單位從而進入詞庫[17]。
(3)由詞法過程所生成的復雜的詞可以在一定程度上繼承作為其構成基礎的詞庫成員的不規則性。詞法規則是作用于詞庫中已有的成分上的,因而詞庫成員的不規則性有可能通過參與詞法過程而在由其生成的復雜的詞中留下一些痕跡。比如,雖然派生詞的內部形式大部分是透明的,其意義在一定程度上具有可預測性,但是派生詞的意義有時也會繼承詞根作為詞庫單位的特殊性,因而也不是完全可以推斷出來的。如英語中的natural-ize是由形容詞natural(自然的,天然的)通過加后綴-ize動詞化構成的,但是這個詞的意義并不能簡單地解釋為是natural的動詞形式,其實際意義指的是“使順化;使歸化;入國籍”,這一意義與natural的意義的聯系不太容易預測。實際上由后綴-ize構成的其他一些詞,在意義上也不太統一,不是完全有規則的,如winterize義為prepare(something)for winter(為冬天作準備);hospitalize義為put(someone)into a hospital(把某人送進醫院);vaporize義為(cause to)become vapor(導致變為蒸汽)。漢語的“頭子”是“頭”加名詞后綴“子”形成的,指的是“首領(多含貶義)”,在意義上具有一定不透明性,不可以完全預測。這表明由詞法規則生成的一些詞也可能具有一定的詞匯特異性,不是完全規則的。詞法的規則性與句法的規則性的差異由此可見一斑:詞法規則是有彈性的,允許空缺(gap)和特異性的存在;而句法規則更為硬性(rigid),其運用具有更強的周遍性,不太會存在空缺,在語義解釋上也具有較強的一致性,所允許的變異極小(參看Chomsky 1970等)。
(4)在某一具體語言中,有些同類的詞可以一部分來自詞法,一部分來自詞庫。如英語中的復數,大部分都是規則的,是來自詞法,如dogs,是由名詞dog加復數后綴-s構成的;也有一部分是不規則的,如women、sheep、oxen等[18],是來自詞庫。英語序數詞中“第一”“第二”“第三”以及個位數是一、二、三的詞由特殊的詞匯形式來表示(first、second、third或基數詞與first、second、third的復合形式,如twenty-first),這些屬于詞庫中的成員(復合形式也可以不入詞庫);而其他序數詞用在基數詞后加后綴-th來表示,屬于由詞法生成的形式。來自詞法的部分可以根據規則生成,而來自詞庫的部分則是有標記的,需要專門記憶。來自詞法和詞庫的詞可以在同一范疇(如名詞復數、序數詞)中共現,這就說明二者在語言使用者的詞匯知識中是相互聯系著的。
由于詞庫和詞法彼此聯系,所以研究詞法不能脫離詞庫,揭示詞庫的構成與特性也不能脫離詞法。