官术网_书友最值得收藏!

第一節 花園幽徑現象國外研究綜述

1968年4月11~12日,位于美國匹茲堡(Pittsburgh)的卡內基梅隆大學(Carnegie-Mellon University)召開了《第四屆發展語言學年會》(Fourth Annual Symposium on Developmental Linguistics),會議議題是發展語言學,并主要討論了兒童語言認知這一話題。這些與會專家學者的論文在1970年由約翰威力父子出版公司(John Wiley and Sons)以《語言認知和發展》(Cognition and the Development of Language)為名結集出版。長達370頁的文集囊括了發展語言學和兒童語言認知的多個方面,如《兒童言語中的派生復雜性和認知順序性》(Derivational complexity and order of acquisition in child speech),《話語協議:兒童如何回答問題》(Discourse agreement:How children answer questions),《兒童關系概念的原始本能》(The primitive nature of children’s relational concepts)等。其中《語言結構中的認知基礎》(The cognitive basis for linguistic structures)從認知角度闡明了貝弗的語言結構觀。

在貝弗學術觀點發表之前,哈佛大學認知研究中心(Center for Cognitive Studies,Harvard University)的米勒和麥基恩曾提出了句子表層結構先于處理,然后在轉換規則影響下投射到深層結構的復雜性派生理論DTC(derivational theory of complexity)(Miller,1962;Miller & McKean,1964)。

復雜性派生理論是有關句子理解的理論,它認為句子在認知記憶中是以簡單的主動核心外加一系列轉換(a simple active “kernal” plus a list of transformations)構成的,句子解讀的難易程度與句子理解過程中的轉換次數成正相關,也就是說從深層結構向表層結構轉換的過程中涉及的轉換越頻繁句子越難以理解。例如在下列三個句子 “The frog ate the bug”“The bug was eaten by the frog”和“Was the bug eaten by the frog?”中,核心部分都是ate,frog和bug,不同在于后兩句是核心部分的變體,即(ate,frog,bug)+passive和(ate,frog,bug)+passive+question。這三個句子隨著轉換次數的增多,理解難度也逐漸加大。盡管這種理論由于無法得到系統性驗證而淡出視線,但對句子理解需要借助句法分析的觀點卻是無可置疑的。

與此不同,貝弗提出了非轉換性的句子解讀策略,并嘗試分析了為什么某些句子(如花園幽徑句)需要耗費較長時間來理解以及為什么解碼者容易陷入困境的原因。盡管貝弗的理論并不完整而且也不能提供一個較為系統的解決花園幽徑句認知障礙的策略,但他從認知角度闡釋了感知策略(perceptual strategies)取代復雜性派生理論的可能性,為后來感知策略理論的提出奠定了基礎。

感知策略(Fodor,Bever & Garrett,1974)是針對復雜性派生理論的不足而提出來的。句子表層結構、底層句子表征和基于語義的表征解釋是理解句子通常要涉及的三個方面。該理論認為在句法轉換過程中復雜性派生理論無法解釋句子理解中的很多情況。例如,“The police kicked the door down”比“The police kicked down the door”復雜,理應在認知中產生較長的感知時間,但在實際運用中卻不產生認知解碼的區別性。感知策略提倡者認為句子解碼時,轉換規則并不是必需的過程,有時可以根據淺表結構中的外顯提示對深層結構進行推論,由于這些啟發性推論(heuristic inference)具有認知層面的感知性,感知策略由此得名。例如,外顯提示詞“that”在“Fat people eat accumulates”中的缺失導致了它的感知難度要比“Fat that people eat accumulates”加大了許多。

1973年10月,《言語學習和言語行為雜志》(Journal of Verbal Learning and Verbal Behavior)發表了美國得克薩斯大學奧斯汀分校(University of Texas at Austin)福斯(Foss)和詹金斯(Jenkins)共12頁的文章《歧義句理解的語境效應》(Some effects of context on the comprehension of ambiguous sentences)。文章利用實驗進行歧義句的語境效應檢驗。首先他們挑選出80個被試并把歧義句分成可進行推斷的語境組和無特殊語境關系的中性組。然后要求各組被試對歧義句的指定目標音素(a specified target phoneme)進行識別,并對反應時間RTs(reaction times)進行登記。當目標音素出現在歧義詞之后時,兩組被試的反應時間都要比同等情況下出現在非歧義詞之后的反應時間要長(In both neutral and biased contexts the RTs were longer when the target phoneme occurred shortly after an ambiguous word than when it occurred after an unambiguous control word)。由此說明無論有無語境支持,歧義句都要比非歧義句占有更多的認知資源。作為特殊歧義現象的花園幽徑句的解讀需要多認知協調的假設得到實驗支持。

與側重實驗的福斯和詹金斯不同,美國印第安納大學(Indiana University)金博爾(Kimball)則提出了表層結構的句法分析理論。1973年發表于《認知》(Cognition)第二卷的論文《自然語言表層結構剖析七原則》(Seven principles of surface structure parsing in natural language)代表了金博爾的理論精髓。

金博爾認為,生成語法(generative grammar)在句子接受度方面有著傳統區分(there is a traditional distinction between sentence acceptability),涉及語言行為(performance)、句子語法性(sentence grammaticality)和語言能力(competence)。通過對英語中哪些句子是可接受句(acceptable sentence)的描述,金博爾嘗試建立一套模式來對輸入句的表層句法樹配列進行有效歸約(to be operative in the assignment of a surface structure tree)。他重申這些句法剖析技術在某種程度上說是來源于計算機科學家為適用于機器語言所開發的程序技術(To some extent,these principles of parsing are modeled on certain parsing techniques formulated by computer scientists for computer languages)。金博爾的語言理解計算觀點是較早討論計算科學和語言進行結合的學者,實際上這種觀點與計算語言學的發展形成了暗合。

簡單來說,金博爾的七條原則包括:(1)自上而下原則(top-down principle);(2)右側連接原則(principle of right association);(3)新興節點原則(principle of new nodes);(4)雙句飽和原則(principle of two sentences);(5)盡早閉合原則(principle of closure);(6)固定結構原則(principle of fixed structure);(7)即時處理原則(principle of processing)。

金博爾的自上而下原則認為通常情況下語法分析是從抽象向具體的轉換,也就是說語法分析器從S節點開始并利用短語結構規則進行擴充。請見下例:

例3:The poor record the music.窮人錄制音樂。

record具有一對二的關系(即名動兩狀態的認知關系),其解讀可借助上下文無關文法CFG(context-free grammar)進行:

G={Vn,Vt,S,P}

Vn={S,NP,VP,Det,Adj,V,N}

Vt={the,poor,record,music}

S=S

P:

S→NP VP (a)

NP→Det Adj(b)

NP→Det N(c)

NP→Det Adj N(d)

VP→V NP(e)

Det→{the}(f)

Adj→{poor}(g)

N→{record,music}(h)

V→{record}(i)

上例花園幽徑句的解讀可以從兩個方向展開,即自底向上剖析(bottom-up parsing)和自上而下剖析(top-down parsing)。

在自底向上剖析中,語法分析器從最具體的輸入句開始在語法范圍內不斷向上歸約,最后到達句法分析的終點S,句法分析成功。如果在歸約過程中偏離了語法范疇,剖析系統會因無相關語法規則支持而被迫返回,形成回溯(backtracking)。例如,如果解碼者開始就將record看成是動詞,自底向上剖析的路徑就是:1-2-3-10-11-12-13-14-15-16-SUCCESS。如果解碼者首選record為名詞就會產生花園幽徑現象,解碼者經過回溯后剖析成功,完全路徑為:1-2-3-4-5-6-7-8-8-7-6-5-4-3(9)-10-11-12-13-14-15-16-SUCCESS。

1:The poor record the music

2:Det poor record the music (f)

3:Det Adj record the music(g)

4:Det Adj N the music(h)

5:NP the music(d)

6:NP Det music(f)

7:NP Det N(h)

8:NP NP(c)

9:Det Adj record the music(g)

10:NP record the music(b)

11:NP V the music(i)

12:NP V Det music(f)

13:NP V Det N(h)

14:NP V NP(c)

15:NP VP(e)

16:S(a)

SUCCESS

自上而下剖析與自底向上剖析路徑正好相反,語法分析器初始位置不是具體的句子而是句法樹的最頂端S,然后在語法規則的限定范圍內向下擴展到句子。如果超出了語法規則的范疇或是采用的語法規則無法下行到具有語法、語義和語用意義的句子,剖析失敗,系統產生回溯。該例record的動詞詞性如果得到選擇,系統將順利完成自動解碼,請見下面系統解碼的過程。

1#:S

2#:NP VP (a)

3#:NP V NP(e)

4#:Det Adj V NP(b)

5#:Det Adj V Det N(c)

6#:The Adj V Det N(f)

7#:The poor V Det N(g)

8#:The poor record Det N(i)

9#:The poor record the N(f)

10#:The poor record the music(h)

SUCCESS

當record的名詞詞性首先得到確認,系統將按照語法規則下行至無法解讀為止。這時,系統回溯到正確的record動詞詞性的選擇,重新進行句法分析。

1:S

2:NP VP (a)

3:Det Adj N VP(d)

4:The Adj N VP(f)

5:The poor N VP(g)

6:The poor record VP(h)

7:The poor record V NP(e)

8:The poor record V Det N(c)

9:The poor record V the N(f)

10:The poor record V the music(h)

FAIL

由上面的句法分析過程可以看出,如果record作為名詞出現,整個句子就缺失了動詞V,系統無法按照既有的語法規則進行分析(試比較擁有動詞過去式read的句子“The poor record read the music”),所以系統中止運行。record作為名詞的錯誤剖析路徑為:1-2*-3-4-5-6-7-8-9-10- FAIL。

在自上而下的剖析中,當系統首先將record默認為名詞,遇到中止運行后重新將record解碼為動詞,則會產生具有回溯性特點的花園幽徑現象,這種折返性句法分析的路徑為:1-2-3-4-5-6-7-8-9-10-10-9-8-7-6-5-4-3-2(2#)-3#-4#-5#-6#-7#-8#-9#-10#-SUCCESS。

由上面分析可以看出,基于語言計算觀點的金博爾提出的自上而下原則,便于解碼者在初期就能意識到不符合語法情況的存在并及時調整,從而減輕認知負擔。例如,同樣是錯誤剖析(將record視為名詞),自底向上剖析在第5步“NP the music”能察覺到動詞缺失,而在自上而下剖析中第2步“NP VP”就能看出由于record作為名詞的中心語,VP不可能由the music擴展得到。所以金博爾認為,在認知承載范圍內,自上而下剖析比自底向上剖析具有更高的效率。

在花園幽徑句例3的自動剖析中,行進錯位也帶來了解碼困難。系統的錯位剖析如下:

Tagging

The/DT poor/JJ record/NN the/DT music/NN ./.

Parse

(ROOT

(NP

(NP(DT The)(JJ poor)(NN record))

(NP(DT the)(NN music))

(..)))

Typed dependencies

det(record-3,The-1) amod(record-3,poor-2) root(ROOT-0,record-3)

det(music-5,the-4) dep(record-3,music-5)

錯位的詞類細化中,record被標注為NN,即名詞。這直接導致該句沒有動詞支撐,解碼失敗。

錯位的句法剖析中,源于詞類的標注產生的不是S,而是NP,即該句不是完整的句子,而是一個名詞詞組。與基于規則的解碼不符。

錯位的依存分析中,amod(record-3,poor-2)表示形容詞 poor作為名詞record的修飾語,形成adjectival modifer。dep(record-3,music-5)表示名詞record和music形成的是依附關系dependent,即當系統由于各種原因無法在兩詞間判定它們清晰的依存關系時采用的標注關系。如“Then,as if to show that he could,…” 可表示為dep(show,if)。這些依存分析是基于record被標注為NN時的錯位分析,無法實現系統的正確解碼。錯位形成的依存關系圖如下:

圖4 例3行進錯位依存關系圖

如圖所示,該句不是完整的句子結構,錯位形成的是無法判定關系的(NP(DT The)(JJ poor)(NN record))和(NP(DT the)(NN music))名詞詞組并列關系。對行進錯位人工干預后的正確剖析結果如下:

Tagging

The/DT poor/JJ record/VBP the/DT music/NN ./.

Parse

(ROOT

(S

(NP(DT The)(JJ poor))

(VP(VBP record)

(NP(DT the)(NN music)))

(..)))

Typed dependencies

det(poor-2,The-1) nsubj(record-3,poor-2) root(ROOT-0,record-3)

det(music-5,the-4) dobj(record-3,music-5)

如上剖析可知,詞類細化中動詞record的標注為VBP,即動詞非第三人稱單數現在時(Verb,non-3rd ps.sing.present)。句法剖析中形容詞poor和限定詞the形成集合名詞(NP(DT The)(JJ poor)),為完整S結構NP+VP。依存關系中,nsubj(record-3,poor-2)表示形容詞poor結構形成名詞性主語結構(nominal subject),dobj(record-3,music-5)表示名詞music是動詞record的直接賓語(direct object)。

圖5 例3花園幽徑效應依存關系圖

通過行進錯位和花園幽徑句依存關系圖對比可知,兩圖之不同在于限定詞the的限定范圍。在行進錯位依存關系圖中,限定詞限定的是名詞record,所以形成的是名詞詞組結構(NP(DT The)(JJ poor)(NN record))。在花園幽徑句依存關系圖中,限定詞限定的是形容詞poor,形成的是集體名詞結構(NP(DT The)(JJ poor))。

金博爾的第二個原則是右側連接原則。這個原則的提出和英語的使用習慣相關聯。他認為向右擴展的語言節點通常習慣于和在語法樹中最低的、非終點的節點進行連接,有時稱之為相鄰原則。這樣的處理模式是由認知省力原則所決定的。

例4:I confirm that,as agreed,I have arranged for your Mr R.Simpson to deal with any matters arising in connection with the above during my absence on leave from 7-21 August 1993.本例源自英語國家語料庫,網址:http://www.natcorp.ox.ac.uk/。正如約定的那樣,我確認已經安排你們的辛普森先生在我于1993年8月7日至21日離開度假之際,全權處理與上面所提事情相關事宜。

按照金博爾的右側連接原則,例4中的兩個with 都與相鄰的動詞deal 或名詞connection相關聯,理解符合英語習慣,認知負載較小。

例5:I have arranged for Mr R.Simpson to deal with any complaints about National Health Service and the matters arising in connection with the problem of homelessness in the city during my absence on leave.我已經安排辛普森先生在我離開度假之際,全權處理對國家衛生服務的投訴和與城市無家可歸問題相關事宜的投訴。

例5中,the matters引導的短語部分既可以是complaints about的鄰接部分,也可以是deal with的鄰接部分,金博爾認為處于語法樹較低節點的部分更容易被解碼者認知接受,所以,右側連接原則決定了the matters引導的短語更應該是about的投射范圍。如果違背右側連接這種認知省力原則,容易產生花園幽徑現象。

例6:I have arranged for Mr R.Simpson to deal with any complaints about National Health Service and the matters arising in connection with the problem of homelessness in the city must be discussed by the board meeting during my absence on leave. 我已經安排辛普森先生在我離開度假之際,全權處理對國家衛生服務的投訴,但與城市無家可歸問題相關的事宜必須經董事會會議討論。

例6中the matters的引導短語根據右側連接原則優先與complaints about相關聯,在must be discussed出現前,與例5的解讀沒有區別。但是,must be discussed出現后,語法要求主語不能缺失,認知系統出現回溯,產生花園幽徑現象。回溯后,the matters的引導短語被確定為并列句的主語,句法分析結束。

通過以上分析可知,右側連接原則源于認知省力和語言習慣,而且語法成分具有附著句法樹中較低節點的優先性。對這種特性的違背,容易產生花園幽徑現象。

金博爾的第三個原則是新興節點原則。

引導詞(限定詞)的存在幫助認知理解回歸原位。

例7:The tycoon sold the offshore oil tracts for a lot of money wanted to kill JR.本例源自G.Altmann1985年文章 “ The resolution of local syntactic ambiguity by the human sentence processing mechanism”,http://acl.ldc.upenn.edu/E/E85/E85-1018.pdf。那個被迫花了一大筆錢購買了近海油田的財閥想殺死JR.

G={Vn,Vt,S,P}

Vn={S,NP,VP,Det,N,Pron,Adj,SC,V,PP,AuxP,Aux,Prep}

Vt={the,tycoon,sold,offshore,oil,tracts,for,a lot of,mony,wanted,to kill,JR}

S=S

P:

a.S→NP VP

b.VP→VP NP

c.NP→Det NP

d.NP→N N

e.NP→Det N

f.NP→Pron

g.NP→Adj NP

h.NP→NP SC

i.SC→V NP PP

j.VP→V AuxP

k.AuxP→Aux V

l.PP→Prep NP

m.VP→V NP PP

n.Det→{the,a lot of}

o.N→{tycoon,oil,tracts,money}

p.Pron→{JR}

q.V→{sold,wanted,kill}

r.Aux→{to}

s.Prep→{for}

t.Adj→{offshore}

上下文無關文法CFG(Context-Free Grammar)中,G={Vn,Vt,S,P}表示該文法包括非終極符號Vn、終極符號Vt、起始符號S和程序符號P。程序P中表示系統解碼需要的規則。由此,系統左角解碼的具體程序如下:

The tycoon sold the offshore oil tracts for a lot of money wanted to kill JR Rules

Det tycoon sold the offshore oil tracts for a lot of money wanted to kill JR n

Det N sold the offshore oil tracts for a lot of money wanted to kill JR o

NP sold the offshore oil tracts for a lot of money wanted to kill JR e

NP V the offshore oil tracts for a lot of money wanted to kill JR q

NP V Det offshore oil tracts for a lot of money wanted to kill JR n

NP V Det Adj oil tracts for a lot of money wanted to kill JR t

NP V Det Adj N tracts for a lot of money wanted to kill JR o

NP V Det Adj N N for a lot of money wanted to kill JR o

NP V Det Adj NP for a lot of money wanted to kill JR d

NP V Det NP for a lot of money wanted to kill JR g

NP V NP for a lot of money wanted to kill JR c

NP V NP Prep a lot of money wanted to kill JR s

NP V NP Prep Det money wanted to kill JR n

NP V NP Prep Det N wanted to kill JR o

NP V NP Prep NP wanted to kill JR e

NP V NP PP wanted to kill JR l

NP V P wanted to kill JR m

S wanted to kill JR a

BREAKDOWN AND BACKTRACKING

動詞sold過去式和過去分詞同形是產生行進錯位的根本原因。如果作為過去式解讀,規則VP→V NP PP則被采納,系統產生行進錯位(breakdown)。錯位后,由于表示解碼終結的符號S已經出現,而字符串wanted to kill JR仍未得到有效解碼,系統產生回溯(backtracking)。回溯節點是規則SC→V NP PP,即在對動詞sold過去式和過去分詞的同形選擇中,不再選擇過去式而選擇過去分詞。過去分詞sold引導結構的依存關系由原來的nsubj(sold-3,tycoon-2)轉變為vmod(tycoon-2,sold-3),即由tycoon作為過去式sold的名詞主語(nominal subject)變化為過去分詞sold是tycoon的動詞修飾語(verb modifier)。回溯后的解碼程序如下:

NP V NP PP wanted to kill JR l

NP SC wanted to kill JR i

NP wanted to kill JR h

NP V to kill JR q

NP V Aux kill JR r

NP V Aux V JR q

NP V Aux P JR k

NP VP JR j

NP VP Pron p

NP VP NP f

NP VP b

S a

SUCCESS

經歷行進錯位的回溯結構獲得成功解碼。例句中的所有字符串均得到有效歸約,并最終獲得表示解碼結束的符號S,剖析成功。所構建的樹形圖如下:

圖6 例7成功解碼的樹形圖

樹形圖可清晰展現句法層級結構。圖中可見,整個樣例的最高級句法結構是S→NP VP。次級結構是NP→NP SC 和VP→VP NP。以此類推,直至剖析到終端符號。

圖7 例7解碼的遞歸轉移網絡

遞歸轉移網絡的引入使例7解碼具有邏輯性。根據遞歸轉移網絡的構建規則,例7解碼涉及主網絡S net,子網絡NP subnet,AuxP subnet,PP subnet,VP subnet和SC subnet。根據解碼的邏輯性,我們構建了如下遞歸轉移網絡用于例7解碼。

上圖解碼程序包括兩部分:sold過去式解碼和回溯后的sold過去分詞解碼。行進錯位出現在sold過去式的解碼中,具體的遞歸轉移網絡程序如下:

The tycoon sold the offshore oil tracts for a lot of money wanted to kill JR.

<S/0,The tycoon sold the offshore oil tracts for a lot of money wanted to kill JR,>

<NP/0,The tycoon sold the offshore oil tracts for a lot of money wanted to kill JR,S/1:>

<NP/1,tycoon sold the offshore oil tracts for a lot of money wanted to kill JR,S/1:>

<NP/1,sold the offshore oil tracts for a lot of money wanted to kill JR,S/1:>

<NP/f,sold the offshore oil tracts for a lot of money wanted to kill JR,S/1:>

<VP/0,sold the offshore oil tracts for a lot of money wanted to kill JR,S/f:>

<VP/1,the offshore oil tracts for a lot of money wanted to kill JR,S/f:>

<NP/0,the offshore oil tracts for a lot of money wanted to kill JR,VP/f:S/f:>

<NP/1,offshore oil tracts for a lot of money wanted to kill JR,VP/f:S/f:>

<NP/1,oil tracts for a lot of money wanted to kill JR,VP/f:S/f:>

<NP/1,tracts for a lot of money wanted to kill JR,VP/f:S/f:>

<NP/f,for a lot of money wanted to kill JR,VP/f:S/f:>

<PP/0,for a lot of money wanted to kill JR,VP/f:S/f:>

<PP/1,a lot of money wanted to kill JR,VP/f:S/f:>

<NP/0,a lot of money wanted to kill JR,PP/f:VP/f:S/f:>

<NP/1,money wanted to kill JR,PP/f:VP/f:S/f:>

<NP/1,wanted to kill JR,PP/f:VP/f:S/f:>

<NP/f,wanted to kill JR,PP/f:VP/f:S/f:>

<PP/f,wanted to kill JR,VP/f:S/f:>

<VP/f,wanted to kill JR,S/f:>

<S/f,wanted to kill JR,>

<,wanted to kill JR,>

?

BREAKDOWN AND BACKTRACKING

動詞sold的過去式選擇導致程序解碼失敗。在程序<NP/0,the offshore oil tracts for a lot of money wanted to kill JR,VP/f:S/f:>中,系統默認動詞sold是主動詞,進入的子網絡是VP subnet。因此,在VP/f:棧中進行解讀余下的字符串。但是,隨著程序<S/f,wanted to kill JR,>的結果出現,系統無法解讀wanted to kill JR這些字符串,遂產生行進錯位,系統產生回溯。回溯后的程序解讀如下:

<NP/1,sold the offshore oil tracts for a lot of money wanted to kill JR,S/1:>

<SC/0,sold the offshore oil tracts for a lot of money wanted to kill JR,NP/f:S/1:>

<SC/1,the offshore oil tracts for a lot of money wanted to kill JR,NP/f:S/1:>

<NP/0,the offshore oil tracts for a lot of money wanted to kill JR,SC/2:NP/f:S/1:>

<NP/1,offshore oil tracts for a lot of money wanted to kill JR,SC/2:NP/f:S/1:>

<NP/1,oil tracts for a lot of money wanted to kill JR,SC/2:NP/f:S/1:>

<NP/1,tracts for a lot of money wanted to kill JR,SC/2:NP/f:S/1:>

<NP/f,for a lot of money wanted to kill JR,SC/2:NP/f:S/1:>

<PP/0,for a lot of money wanted to kill JR,SC/f:NP/f:S/1:>

<PP/1,a lot of money wanted to kill JR,SC/f:NP/f:S/1:>

<NP/0,a lot of money wanted to kill JR,PP/f:SC/f:NP/f:S/1:>

<NP/1,money wanted to kill JR,PP/f:SC/f:NP/f:S/1:>

<NP/1,wanted to kill JR,PP/f:SC/f:NP/f:S/1:>

<NP/f,wanted to kill JR,PP/f:SC/f:NP/f:S/1:>

<PP/f,wanted to kill JR,SC/f:NP/f:S/1:>

<SC/f,wanted to kill JR,NP/f:S/1:>

<NP/f,wanted to kill JR,S/1:>

<VP/0,wanted to kill JR,S/f:>

<VP/1,to kill JR,S/f:>

<AuxP/0,to kill JR,VP/f:S/f:>

<AuxP/1,kill JR,VP/f:S/f:>

<AuxP/1,JR,VP/f:S/f:>

<NP/0,JR,AuxP/f:VP/f:S/f:>

<NP/1,,AuxP/f:VP/f:S/f:>

<NP/f,,AuxP/f:VP/f:S/f:>

<AuxP/f,,VP/f:S/f:>

<VP/f,,S/f:>

<S/f,,>

<,,>

SUCCESS

回溯程序證明sold作為過去分詞的解碼是正確的路徑。在程序<NP/0,the offshore oil tracts for a lot of money wanted to kill JR,SC/2:NP/f:S/1:>中,我們可以看到系統由原來的棧<VP/f:S/f:>轉變為棧<SC/2:NP/f:S/1:>,即sold和tycoon的依存關系不再被認為是具有nsubj(sold-3,tycoon-2)的主謂關系,而是變成了由動詞過去分詞修飾名詞的成分關系vmod(tycoon-2,sold-3)。

算法矩陣可用于解釋行進錯位系統的解碼程序變化。在例7行進錯位產生前,由于字符串wanted to kill JR不能被系統解碼,形成的算法矩陣呈現非良構子串表的特點,即不能在最大矩陣處歸約為解碼成功的符號S。行進錯位的系統算法矩陣如下:

.0The.1tycoon.2sold.3the.4offshore.5oil.6tracts.7for.8a lot of.9money.10wanted.11to.12kill.13JR.14

表1 例7行進錯位的算法矩陣

圖8 例7行進錯位的非良構子串表

從行進錯位的算法矩陣和非良構子串表可以看出,解碼的停頓出現在表1的淺灰色填充區域后,即wanted的出現帶來了行進錯位。圖8中的終結符號S出現表示解碼已經結束,但是隨后的VP結構無法在系統中得到解碼。因此,前期的解讀不是最優模式,系統發生了回溯。回溯后SC→V NP PP和NP→NP SC的規則得到啟用,所有的字符串都得到順利剖析,解碼在經歷了行進錯位后成功。請見完全解碼后的算法矩陣和良構子串表。

表2 例7花園幽徑句的算法矩陣

圖9 例7花園幽徑效應的良構子串表

從以上對花園幽徑句的深入分析可知,行進錯位源于動詞sold的過去式和過去分詞的同形。如果能夠提供引導詞that并形成句子The tycoon that was sold the offshore oil tracts for a lot of money wanted to kill JR,那么,系統便會很容易辨別出動詞是過去式還是過去分詞,也就不會出現行進錯位和回溯。因此,引導詞(限定詞)的存在能夠提升系統的剖析效率。這與金博爾的新興節點原則相一致。

金博爾的第四個原則是雙句飽和原則。他認為由于人腦認知瞬時解碼內存的有限性,語法分析器同時處理具有兩個S節點的句子或分句是可能的。如果同時處理的節點量超過這個數值,就會加重記憶負擔,帶來認知解碼的延時性,速度放慢,效率降低甚至解碼失敗。這個原則從另一個方面說明了:為什么語言的遞歸性是存在的,但是在語言運用中卻不能無限制使用。

例8:The data was the result of active processes of project.數據是項目積極推進的結果。

例9:The data the scholars investigated was the result of active processes of project.學者們調查的數據是項目積極推進的結果。

例10:The data the scholars the police chased investigated was the result of active processes of project.被警察所追蹤的學者們調查的數據是項目積極推進的結果。

例11:The data the scholars the police the journalist interviewed chased investigated was the result of active processes of project.被記者采訪的警察所追蹤的學者們調查的數據是項目積極推進的結果。

例12:The data the scholars the police the journalist the children respected interviewed chased investigated was the result of active processes of project.被孩子們推崇的記者采訪的警察所追蹤的學者們調查的數據是項目積極推進的結果。

從上例的比較可以看出,含有一個節點S和兩個節點S的例句在理解過程中認知負載較小,理解較順暢。含有三個節點S的例句、四個節點S的例句和五個節點S的例句雖然符合語法規范,但是超出了瞬時認知解碼的存儲量,理解越來越困難,直至解碼停頓。

金博爾的第五個原則是盡早閉合原則。句法分析過程中,當新節點出現后,解碼者往往期待著找到符合語法規范的其他成分進行匹配,一旦匹配成功認知存儲器便迅速閉合,以便于釋放出更多的認知因子進行下一輪處理。這個過程是動態的、可逆的。所謂的動態是相對靜態而言的。分配給認知存儲器的單元量隨解讀量的大小而調整,往往呈現正相關分布,即句法分析越復雜的句子所占用的認知存儲量就越大,處理器解讀的時間就越長。所謂的可逆是相對模式而言的。在認知解碼過程中,當為了節省更多記憶空間而盡早閉合的認知系統無法解讀后續成分時,原來的既有模式便被打破,系統對新獲得的信息連同既有信息進行重新排列組合,最后形成符合語法、語義、語用規范的新模式。沒有認知可逆性的存在,既定模式不能更改,信息無法更新,正確的解碼也難以實現。這個特點是認知系統成功解讀花園幽徑句的關鍵。

例13:The raft floated down the river sank.順流而下的筏沉沒了。

例14:She told me a little white lie will come back to haunt me.她告訴我說小小的善意謊言會重新困擾我。(Katamba:2005:263)

盡早閉合原則在上面兩例中得到闡釋。花園幽徑句的解碼中,蘊含了行進錯位,其根本原因在于系統具有盡早閉合的優先剖析策略。請見上下文無關文法,以及基于該文法的行進錯位的左角解碼和回溯后的二次解碼。

She told me a little white lie will come back to haunt me.

G={Vn,Vt,S,P}

Vn={S,NP,VP,N,V,Pron,Det,Adj,IP,Aux,Adv,SC}

Vt={she,told,me,a little,white,lie,will,come,back,to,haunt}

S=S

P:

a.S→NP VP

b.NP→N

c.VP→V NP NP

d.NP→Pron

e.NP→Det NP

f.NP→Adj N

g.VP→V NP IP

h.VP→Aux V

i.VP→VP Adv

j.VP→VP IP

k.IP→NP VP

l.VP→VP SC

m.SC→Aux VP

n.VP→V NP

o.Det→{a little}

p.Pron→{she,me}

q.N→{lie}

r.V→{told,haunt,come}

s.Adj→{white}

t.Adv→{back}

u.Aux→{will,to}

上下文無關文法表明,規則VP→V NP NP和VP→V NP IP的差別在于最后附著結構的選擇上。如果認定 a little white lie 作為動詞tell的直接賓語出現,則啟動規則VP→V NP NP。如果系統認為a little white lie是后續分句的主語,形成的結構是子句,規則VP→V NP IP則被系統接受。對 a little white lie結構的附著范圍的歧義選擇導致了行進錯位的出現。

She told me a little white lie will come back to haunt me Rules

Pron told me a little white lie will come back to haunt me p

NP told me a little white lie will come back to haunt me d

NP V me a little white lie will come back to haunt me r

NP V Prop a little white lie will come back to haunt me p

NP V NP a little white lie will come back to haunt me d

NP V NP Det white lie will come back to haunt me o

NP V NP Det Adj lie will come back to haunt me s

NP V NP Det Adj N will come back to haunt me q

NP V NP Det NP will come back to haunt me f

NPV NP NP will come back to haunt me e

NP VP will come back to haunt me c

S will come back to haunt me a

BREAKDOWN AND BACKTRACKING

左角剖析中,灰色填充部分的歸約表明系統啟用的規則是VP→V NP NP。隨著表示解碼成功的終結符號S的出現,系統默認解碼結束。但will come back to haunt me字符串卻在規則集中找不到相關的規則繼續進行歸約。由于未處理字符串的存在,解碼失敗,系統回溯到規則選擇的岔路口。曾被棄用的規則VP→V NP IP顯性化。

NP V NP NP will come back to haunt me e

NP V NP NPAux come back to haunt me u

NP V NP NP Aux V back to haunt me r

NP V NP NP VP back to haunt me h

NP V NP NP VP Adv to haunt me t

NP V NP NP VP to haunt me i

NP V NP NP VP Aux haunt me u

NP V NP NP VP AuxV me r

NP V NP NP VP AuxV Prop p

NP V NP NP VP AuxV NP d

NP V NP NP VP AuxVP n

NP V NP NP VP SC m

NP V NP NP VP l

NP V NP IP k

NP VP g

S a

SUCCESS

回溯后的剖析可見,系統認為字符串a little white lie應該是子句的主語成分,tell me 后續的是從句IP而不是名詞詞組NP。由此構建的樹形圖可清晰地展現這種層級關系。

圖10 例14樹形圖

花園幽徑句的樹形圖層級展現了系統解碼的邏輯性。在自頂向下(top-down)剖析中,S→NP VP是最高層結構,VP→V NP IP是次高層結構,IP→NP VP是次次高結構。以此類推,直至系統將所有終端字符串剖析結束。這種系統解碼的層級性通過遞歸轉移網絡也可以得到表現。

圖11 例14的遞歸轉移網絡

遞歸轉移網絡包括主網絡S net,子網絡NP subnet、VP subnet、IP subnet和SC subnet。通過前面的分析可知,系統在處理規則VP→V NP NP和VP→V NP IP時會出現歧義。

在子網絡VP subnet中,規則VP→V NP NP的啟用路徑是VP0→VP1→VP2→VP2→VPf。系統在VP0→VP1解碼過程中,完成了動詞tell的解碼。VP1→VP2解碼過程中,剖析了第一個N(NP)結構(即me)。在VP2→VP2解碼過程中剖析了第二個嵌套子網絡N(NP)結構(即a little white lie)。VP2→VPf是空集,跳過。

規則VP→V NP IP的啟用路徑是VP0→VP1→VP2→VPf。系統分別在VP0→VP1和VP1→VP2解碼過程剖析了動詞tell和N(NP)結構me。在VP2→VPf解碼過程啟動嵌套子網絡IP subnet的剖析。

啟動路徑的不同導致規則不同,誘發系統行徑錯位。通過上面分析可知,兩個規則的啟動路徑是不同的。VP→V NP NP的啟用路徑不僅比VP→V NP IP的啟用路徑多了VP2→VP2的解碼過程,而且,后續的VP2→VPf是解碼空集,沒有字符串得到剖析。請看系統按照遞歸轉移網絡進行的解碼程序:

<S/0,She told me a little white lie will come back to haunt me,>

<NP/0,She told me a little white lie will come back to haunt me,S/1:>

<NP/f,told me a little white lie will come back to haunt me,S/1:>

<VP/0,told me a little white lie will come back to haunt me,S/f:>

<VP/1,me a little white lie will come back to haunt me,S/f:>

<NP/0,me a little white lie will come back to haunt me,VP/1:S/f:>

<NP/1,a little white lie will come back to haunt me,VP/1:S/f:>

<NP/f,a little white lie will come back to haunt me,VP/1:S/f:>

<NP/0,a little white lie will come back to haunt me,VP/2:S/f:>

<NP/1,white lie will come back to haunt me,VP/2:S/f:>

<NP/1,lie will come back to haunt me,VP/2:S/f:>

<NP/f,will come back to haunt me,VP/2:S/f:>

<VP/f,will come back to haunt me,S/f:>

<S/f,will come back to haunt me,>

<,will come back to haunt me,>

?

BREAKDOWN AND BACKTRACKING

規則VP→V NP NP選擇導致行進錯位產生。剖析可見,在<NP/f,a little white lie will come back to haunt me,VP/1:S/f:>中,系統已經完成了對字符串She told me的剖析。對a little white lie 的解碼啟動了系統對歧義規則VP→V NP NP和VP→V NP IP的選擇。在上面的剖析<NP/f,will come back to haunt me,VP/2:S/f:>中,我們可以看出系統選擇的是NP/f,即默認字符串a little white lie是動詞tell所在的棧中的一部分(直接賓語)。所以,隨著解碼的深入,分別表示子網絡VP subnet解碼結束的VP/f符號和主網絡S net解碼結束的S/f符號的出現,終止了系統繼續剖析的可能。余下的字符串<,will come back to haunt me,>在棧中無法得到解讀。系統產生了行進錯位,遂回溯到歧義規則節點。請看系統回溯后重新采納VP→V NP IP規則后形成的剖析程序。

<NP/f,a little white lie will come back to haunt me,VP/1:S/f:>

<IP/0,a little white lie will come back to haunt me,VP/2:S/f:>

<IP/1,a little white lie will come back to haunt me,VP/2:S/f:>

<NP/0,a little white lie will come back to haunt me,IP/1:VP/2:S/f:>

<NP/1,white lie will come back to haunt me,IP/1:VP/2:S/f:>

<NP/1,lie will come back to haunt me,IP/1:VP/2:S/f:>

<NP/f,will come back to haunt me,IP/1:VP/2:S/f:>

<VP/0,will come back to haunt me,IP/f:VP/2:S/f:>

<VP/1,come back to haunt me,IP/f:VP/2:S/f:>

<VP/1,back to haunt me,IP/f:VP/2:S/f:>

<VP/2,to haunt me,IP/f:VP/2:S/f:>

<SC/0,to haunt me,VP/f:IP/f:VP/2:S/f:>

<SC/1,haunt me,VP/f:IP/f:VP/2:S/f:>

<VP/0,haunt me,SC/f:VP/f:IP/f:VP/2:S/f:>

<VP/1,me,SC/f:VP/f:IP/f:VP/2:S/f:>

<NP/0,me,VP/2:SC/f:VP/f:IP/f:VP/2:S/f:>

<NP/f,,VP/2:SC/f:VP/f:IP/f:VP/2:S/f:>

<VP/f,,SC/f:VP/f:IP/f:VP/2:S/f:>

<SC/f,,VP/f:IP/f:VP/2:S/f:>

<VP/f,,IP/f:VP/2:S/f:>

<IP/f,,VP/2:S/f:>

<VP/f,,S/f:>

<S/f,,>

<,,>

SUCCESS

回溯剖析中,系統啟動VP→V NP IP規則,<IP/0,a little white lie will come back to haunt me,VP/2:S/f:>表示嵌套在子網絡VP subnet中的次子網絡IP subnet被系統激活,a little white lie 不再被認為是動詞tell的直接賓語,而被認為是IP子句的主語成分,這些信息體現在<NP/f,will come back to haunt me,IP/1:VP/2:S/f:>的表示中。NP/f表示名詞詞組a little white lie已經剖析完畢。IP/1:表示在次子網絡IP subnet棧中NP剖析階段是IP0→IP1。VP/2:表示子網絡VP subnet是嵌套子網絡IP subnet的上一級棧,而且所處的階段是VP2→VPf。S/f:表示主網絡S net是最高級別的棧,只有棧內所有的終端字符串都得到剖析才能被系統所接受。

通過系統行進錯位前后形成的算法矩陣可以清楚地看到解碼停頓和回溯的節點變化。請見行進錯位的算法矩陣和由此生成的非良構子串表。

.0She.1told.2me.3a.4little .5white.6lie .7will.8come.9back.10to.11haunt .12me.13

表3 例14行進錯位的算法矩陣

圖12 例14行進錯位的非良構子串表

上面的圖表顯示,誘發行進錯位的節點是will節點。在She told me a little white lie的剖析中,系統默認S→NP(Pron) VP已經完成,得到的也是一個良構的子串表。所以,在算法矩陣和子串表中都歸約出表示解碼終結的S符號。但是剩余子串will come back to haunt me無法進入系統剖析。這說明系統前期解碼出現了錯位。系統遂回溯到VP→V NP NP和VP→V NP IP選擇岔路重新處理。由此,可以形成正確剖析的算法矩陣和良構子串表。

.0She.1told.2me.3a.4little .5white.6lie .7will.8come.9back.10to.11haunt .12me.13

表4 例14花園幽徑句的算法矩陣

圖13 例14花園幽徑效應良構子串表

成功的解碼能處理所有的終端字符串。在表4的算法矩陣中,淺灰填充區域包括最高層的剖析符號{S}、次高層的{VP}和次次高層的{IP}。這與圖13的良構子串表中的最高三層的標識符號S→NP(Pron) VP、VP→V NP(Pron)IP和IP→NP VP是一致的。這說明算法矩陣中的所有字符串都得到了歸約,系統在剖析完所有的字符串后得到解碼終結的符號S,解碼成功。在子串表中,與算法矩陣相對的規則得到標識,最后形成了跨越所有終端符號的弧線S,即表示系統解碼成功后形成的子串表是封閉的,也就是良構的了。這種行進錯位前后的程序算法不同也可以通過CYK算法得到清晰展現。我們把算法流程進行了剖析,由于篇幅所限,此處不贅言,具體請參見附錄三。

例13和例14花園幽徑句產生的原因是不同的。例13的認知回溯源于動詞float的變化。首先該動詞的主動態過去式和被動態過去分詞形式同形,遵循金博爾的盡早閉合原則,解碼者在sank出現前,已經匹配到了完整的句法生成式,認知解碼系統完成處理,信息存儲器瞬時關閉并釋放出空間。但當sank出現時,系統的可逆程序啟動,原來的匹配模式崩盤,系統根據既有信息和加入信息重新進行排列組合,將float由開始的主動態過去式重新解讀為被動態的過去分詞形式,句法層級也下推至下一層級,即主動詞不再由float而是由sank承擔。例13在補足省略的成分后可形成正常句例16,其結構分析類似例15。

例15:The logs are trimmed and then floated down the river.本例源自 http://www.ldoceonline.com/dictionary/float_1。原木鋸伐成段后順流而下。

例16:The raft that was floated down the river sank.順流而下的筏沉沒了。

花園幽徑句例14的形成原因在于動詞told的轄域變化。解碼時,具有統領雙賓語功能的動詞told 通過附著賓語me實現了間接賓語的填位。當a little white lie進入認知處理器的存貯范圍時,缺少直接賓語進行補充的認知系統遵循盡早閉合原則,將a little white lie缺省認定為直接賓語,初期解碼完成。但是,助動詞will具有提示后續動詞即將出現的功能,隨著它的加入,已經閉合的認知環路重新打開。這樣,因缺少成分進行附著而無法完成句法生成式解讀的系統處于動態接納后續信息的狀態。隨后,以a little white lie為主語展開的賓語從句被視為直接賓語,系統才完成了整句的認知解讀。動詞told轄域發生了延展,即由一個短語充當直接賓語轉變到由一個從句充當直接賓語。這種變化導致了花園幽徑現象的出現。短語需要的認知負載小于從句,所以遵循盡早閉合原則,系統首先接納的是認知負荷較小的短語。這為后期系統隨著新信息的加入而出現的認知模式的破舊立新留下了鋪墊。這種花園幽徑句的回避辦法就是在賓語從句前補足一個提示新興節點的連詞that(盡管可以省略)。依此提示詞的存在,系統可以直接將told的轄域擴大到從句,認知環路不會提早閉合。請見例17。

例17:She told me that a little white lie will come back to haunt me.她告訴我說小小的善意謊言會重新困擾我。

金博爾的第六個原則是固定結構原則。所謂的固定結構(fixed structure)就是認知解碼過程中所秉承的既有模式,如果從計算科學角度來說就是系統缺省默認的狀態。這些固定模式的形成涉及神經語言學、認知語言學、社會語言學等多個領域。

例18:Until the police arrest the drug dealers control the street.樣例源自 http://www.fun-with-words.com/ambiguous_garden_path.html。毒販控制著街區直到被警察逮捕。

例19:Until the police make the arrest,the drug dealers control the street.毒販控制著街區直到警察采取逮捕行動。

例20:The professors instructed about the exam were confused.被指導考試的教授們感到困惑。(Milne,1982:351)

例21:The waiter served in a new restaurant was happy.在新餐廳里享受到服務的侍者很高興。

例22:Until the police arrest the baby control the street.嬰兒控制著街區直到被警察逮捕。

警察逮捕販毒分子是一個通用的認知模式,所以,根據這個固定模式,當名詞和動詞兼形的arrest出現,認知系統就把the drug dealers默認為arrest的賓語,形成了符合認知構式的環路。當后續的control the street 要求匹配主語時,系統回溯并重新將arrest解碼為名詞,the drug dealers也由既定的賓語成分調整為主語,花園幽徑現象出現。如果通過補足認知解碼所需的解釋性信息,這種現象也能夠避免。

花園幽徑句整體上是符合認知固定結構的,回溯只是來自于內部句法結構的調整。如果認知模式整體上沒有遵循傳統認知的固定結構,語言運用時就會產生認知延遲、誤解甚至造成解碼中斷。

教授是高等教育中具有最高職稱的群體,通常他們是指導學生學習的人,所以當被指導的對象變成教授時,解碼者容易產生認知延遲。

服務生由常規的服務者變成了顧客,如果沒有特定語境支持容易形成解碼者的誤解。雖然具有句法生成式的完整性,但該句對認知固定結構的整體違背造成了解碼中斷。

花園幽徑句的程序算法剖析可深化理解。在討論固定結構原則對行進錯位的影響時,我們發現回溯前后程序算法的不同剖析可以深化對花園幽徑模式的理解。

Until the police arrest the drug dealers control the street.

G={Vn,Vt,S,P}

Vn={S,NP,VP,N,Det,PP,Prep,CP,Conj,IP,V}

Vt={until,the,police,arrest,drug,dealers,control,street}

S=S

P:

a.S→PP IP

b.NP→N N

c.NP→Det N

d.NP→Det NP

e.PP→Prep NP

f.CP→Conj IP

g.IP→NP VP

h.VP→V NP

i.Det→{the}

j.Prep→{until}

k.Conj→{until}

l.N→{police,arrest,drug,dealers,street}

m.V→{arrest,control}

左角分析有利于解釋固定結構的解碼原因。剖析中對規則Conj→{until}和Prep→{until}的不同選擇會導致解碼的不同。由于until在句首出現時通常是連詞結構,其引導的結構是高概率的。所以,系統默認Conj→{until}具有優先級。由此展開的解碼程序導致行進錯位的誘發。

Until the police arrest the drug dealers control the street Rules

Conj the police arrest the drug dealers control the street k

Conj Det police arrest the drug dealers control the street i

Conj Det N arrest the drug dealers control the street l

Conj NP arrest the drug dealers control the street c

Conj NP V the drug dealers control the street m

Conj NP V Det drug dealers control the street i

Conj NP V Det N dealers control the street l

Conj NP V Det NN control the street l

Conj NP V Det NP control the street b

Conj NP V NP control the street d

Conj NP VP control the street h

Conj IP control the street g

CP control the street f

BREAKDOWN AND BACKTRACKING

系統回溯后可啟動次優選結構。規則Prep→{until}在系統回溯后得到激活,由此完成系統對該花園幽徑句的解讀。

Until the police arrest the drug dealers control the street

Prep the police arrest the drug dealers control the street j

Prep Det police arrest the drug dealers control the street i

Prep Det N arrest the drug dealers control the street l

Prep Det N N the drug dealers control the street l

Prep Det NP the drug dealers control the street b

Prep NP the drug dealers control the street d

PP the drug dealers control the street e

PP Det drug dealers control the street i

PP Det N dealers control the street l

PP Det N N control the street l

PP Det NP control the street b

PP NP control the street d

PP NP V the street m

PP NP V Det street i

PP NP V Det N l

PP NP V NP c

PP NP VP h

S a

SUCCESS

系統對例句成功剖析源于對until的正確解讀。由此構建的樹形圖可把解碼的程序層次性展現出來,具體請看下圖:

圖14 例18的樹形圖

樹形圖中的結構剖析表明,Until the police arrest結構是介詞詞組PP。規則PP→Prep NP、NP→Det NP、NP→N N、Prep→{until}、Det→{the}、N→{police,arrest}得到激活。由此形成的整個句子的遞歸轉移網絡如下:

圖15 例18的遞歸轉移網絡

遞歸轉移網絡由主網絡S net,子網絡NP subnet、VP subnet和PP subnet組成。在子網絡PP subnet中對arrest的選擇分歧產生了行進錯位。如果V→{arrest} 被激活,形成的就是<VP/0,arrest the drug dealers control the street,PP/f:S/1:>,即系統默認在S/1棧和PP/f棧下面的嵌套子網絡VP subnet得到啟用,VP/0表示開始對動詞arrest進行剖析。由此形成的程序算法如下:

Until the police arrest the drug dealers control the street

<S/0,Until the police arrest the drug dealers control the street,>

<PP/0,Until the police arrest the drug dealers control the street,S/1:>

<PP/1,the police arrest the drug dealers control the street,S/1:>

<NP/0,the police arrest the drug dealers control the street,PP/f:S/1:>

<NP/1,police arrest the drug dealers control the street,PP/f:S/1:>

<NP/2,arrest the drug dealers control the street,PP/f:S/1:>

<NP/f,arrest the drug dealers control the street,PP/f:S/1:>

<VP/0,arrest the drug dealers control the street,PP/f:S/1:>

<VP/1,the drug dealers control the street,PP/f:S/1:>

<NP/0,the drug dealers control the street,VP/f:PP/f:S/1:>

<NP/1,drug dealers control the street,VP/f:PP/f:S/1:>

<NP/2,dealers control the street,VP/f:PP/f:S/1:>

<NP/f,control the street,VP/f:PP/f:S/1:>

<VP/f,control the street,PP/f:S/1:>

<PP/f,control the street,S/1:>

<NP/0,control the street,S/2:>

?

BREAKDOWN AND BACKTRACKING

如上所示,灰色填充部分就是系統出現選擇岔口的部分,即在規則V→{arrest}和N→{arrest}間進行選擇。系統在優選規則V→{arrest}進入解碼程序得到最后的<NP/0,control the street,S/2:>,即剩余字符串control the street沒有相關的規則支撐繼續進行剖析。解碼失敗,系統回溯到岔路,重新選擇并嘗試N→{arrest}進行剖析。由于在岔路前的剖析沒有歧義出現,系統保留這些剖析結果,從岔路后剖析開始改變,直至全部解碼完畢。具體程序算法如下。

<NP/2,arrest the drug dealers control the street,PP/f:S/1:>

<NP/f,the drug dealers control the street,PP/f:S/1:>

<PP/f,the drug dealers control the street,S/1:>

<NP/0,the drug dealers control the street,S/2:>

<NP/1,drug dealers control the street,S/2:>

<NP/2,dealers control the street,S/2:>

<NP/f,control the street,S/2:>

<VP/0,control the street,S/f:>

<VP/1,the street,S/f:>

<NP/0,the street,VP/f:S/f:>

<NP/1,street,VP/f:S/f:>

<NP/2,,VP/f:S/f:>

<NP/f,,VP/f:S/f:>

<VP/f,,S/f:>

<S/f,,>

<,,>

SUCCESS

行進錯位前的程序算法(即V→{arrest}的激活過程)可以在矩陣和子串表中得到體現。

.0Until.1the.2police.3arrest.4the.5drug.6dealers.7control.8the.9street.10

表5 例18行進錯位的算法矩陣

上表的算法矩陣是不完整矩陣。由于系統在后續字符串control the street加入后不能在算法矩陣的最終位置(0,10)中歸約出終極符號S。這說明該矩陣是不完整矩陣。動詞control 出現前,until被系統接受為連詞,規則CP→Conj IP被激活,Until the police arrest the drug dealers形成了一個完整的子句。但是動詞control 出現后,系統已經完整的子句矩陣被瓦解,原來的解碼模式被推翻。這種不完整算法矩陣形成了非良構子串表。

圖16 例18行進錯位的非良構子串表

上圖的非良構子串表展現了誘發行進錯位前形成的解碼特點。字符串control the street出現前,系統按照規則CP→Conj IP,IP→NP VP,VP→V NP,NP→Det NP,NP→N N構建了閉合的子串表,即在沒有字符串control the street參與解碼的情況下,系統已經形成了良構的子串表,得到了表示子句解碼成功的標識CP。隨著動詞control及其所在結構control the street的出現,系統無法找尋到與之匹配的規則集。因此,不能剖析余下的字符串,形成的子串表也不能覆蓋所有終端符號,因而是非良構的。

系統誘發行進錯位并回溯后,可形成完整的算法矩陣和良構子串表。

表6 例18花園幽徑句的算法矩陣

上表的算法矩陣是解碼成功的完整矩陣。在終極位置(0,10)中,系統歸約出了表示解碼終結的符號S,激活的規則是S→PP IP。系統由until的連詞義項轉變為介詞義項,啟用規則PP→Prep NP。arrest的動詞義項轉變為名詞義項,啟用規則NP→N N。這種完整矩陣對應良構的子串表。

圖17 例18花園幽徑效應良構子串表

上圖的良構子串表是涵括所有終端符號的閉合圖形。在PP結構中,規則Prep→{until}和N→{arrest}都得到激活,形成了[Until the police arrest]PP模式。余下的字符串 the drug dealers control the street按照規則IP→NP VP形成了IP模式。S→PP IP規則最后被啟用,解碼成功。

金博爾的第七個原則是即時處理原則。根據其特點也可以稱之為短時記憶存貯空間的及時釋放原則。用于語言解碼的認知記憶主要分成三個階段:瞬時記憶、短時記憶和長時記憶。瞬時記憶也叫感覺記憶,其存儲器記錄的多是語言符號對感官(如眼睛)直接刺激后形成的映像,其存貯量的大小取決于感觀的生理范圍,如一次映入眼簾的語言符號的多少等。短時記憶也稱工作記憶。與短暫存貯的瞬時記憶所不同,短時記憶除了保留存貯功能外,對復雜信息具有初步加工的能力,句法生成式產生的過程主要出現在短時記憶階段。經過選擇并得到相對充分加工的信息在符合句法、語義、語用等規范后可進入長時記憶。由于生理功能所限,短時記憶的存貯量相對長時記憶是有限的,而且短時記憶中神經元感應加工是動態和混沌的。加工過的信息只是相對正確,所以這些信息在進入長時記憶后也可能返回重新加工。這種移送和重新提取過程是可逆的。但是已經進入長時記憶的信息如果重新返回短時記憶進行再加工(即回溯)的話,認知負載要比只在短時記憶中加工所付出的代價大的多。花園幽徑現象之所以耗費了更多的認知資源,其根本原因在于這個移送和重新提取的過程是二次甚至是多次加工的結果。長時記憶中信息被迫返回時,系統付出的認知代價是可觀的。

長時記憶包括解碼者認知中相對穩定的信息,它們是經過了瞬時記憶感知和短時記憶粗加工過了的。從存儲容量來說,長時記憶是最大的,其可用于記憶的認知單元的存貯能力超過了我們的想象,這和有限存儲的瞬時記憶和短時記憶形成了巨大反差。短時記憶作為一個能力有限的存貯加工單元,信息處理的及時與否決定了短時記憶的效率。它的主要功能在于摒棄多余信息,將加工過的信息及時轉送至具有更大存貯空間的長時記憶中,而且盡快釋放更多動態認知因子。這種特性為基于短時記憶的自然語言處理及時性研究奠定了基礎,并使具有回溯性特點的花園幽徑現象在短時記憶階段出現成為可能。

例23:The girl told the story cried.聽故事的小姑娘哭了。(Katamba:2005:263)

例24:I know the words to that song about the queen don’t rhyme.我知道那首關于女王的歌詞并不押韻。(Katamba:2005:263)

上面兩例具有認知回溯的特點。認知系統處理例23時,在cried出現前,短時記憶的處理已經具有了既定模式(小姑娘講故事)。為減輕認知負荷,短時記憶及時處理了前面部分并移送至存貯能量更大的長時記憶中。可是當cried作為補充信息通過瞬時記憶進入短時記憶中時,語法規范要求系統重新解讀該句。于是短時記憶和長時記憶間的可逆通道開啟,已經送至長時記憶中保存的既定信息被短時記憶重新提取,同時系統將told the story下推至比the girl低的句法層級(語義上小姑娘由施事變成受事)進行解讀,最后將解碼成功的信息再次移送至長時記憶中存貯。

例24的回溯性產生于動詞know的賓語變化時。當短時記憶處理完I know the words to that song about the queen(我知道那些有關女王的歌詞)后,系統將解讀后的信息及時移送至長時記憶中進行存貯以釋放出更多的動態認知因子。但是后續的don’t rhyme要求系統啟動短時記憶和長時記憶的可逆程序,將原來已經送出的解碼模式取回并更改為從句充當賓語的認知模式,然后重新送回長時記憶進行存貯。這個重新取回原來認知模式并發送新的更改認知模式的過程就是花園幽徑的回溯現象。

金博爾的七個原則是相互滲透、相互聯系、協同運轉的,其討論主要涉及語法和認知范疇。核心論點闡述了短時記憶對自然語言處理具有的不可低估的影響。他對自己提出的七個原則的功能概括如下:

These principles account for the high acceptability of right branching structures,outline the role of grammatical function words in sentence perception,describe what seems to be a fixed limit on short-term memory in linguistic processing,and hypothesize the structure of the internal syntactic processing devices.The operation of various classes of transformations with regard to preparing deep structures for input to parsing procedures such as those outlined in the paper is discussed.即這些原則解釋了右分支結構的高接受度,概述了語法功能詞在句子感知中的角色,描述了語言處理的短時記憶中什么因素起到了限制性作用,對句法分析內部策略的結構進行了推斷,并如前文所述討論了從深層結構輸入到分析程序的多層級轉換操作。(金博爾,1973)

如果從功能和結構兩個分水嶺分析金博爾的原則,我們認為,側重認知功能的原則有自上而下原則、雙句飽和原則、盡早閉合原則和即時處理原則,側重句法結構的原則有右側連接原則、新興節點原則和固定結構原則。盡管金博爾的原則并不是萬能的,甚至有的闡釋在今天看來還可能是錯誤的,但他從表層結構句法分析層面解讀了句子理解系統是如何展開的,并關注了語言理解和計算的關系,為我們利用計算語言學方法(如NS流程圖、線圖剖析法、遞歸轉移網絡等)解讀花園幽徑句提供了理論條件。

1978年,美國康涅狄格大學的弗雷澤(Frazier)和福多爾(Fodor)在《認知》第6卷發表了《灌腸機:一種新的雙階段句法剖析模型》(The sausage machine:A new two-stage parsing model)。他們認為人類的句子解析裝置(human sentence parsing device)可將短語結構分配到詞串的過程分成兩個階段。

第一階段稱之為“初級短語包(The preliminary phrase packager)”,即灌腸機(The sausage machine)。解析器將詞匯和短語節點(lexical and phrasal nodes)分配給規模大約為六個詞的子串(substrings of roughly six words),這些子串連接到一起形成一定的結構。超過這個長度,解析器不能有效處理。其中的子串可以是詞也可以是結合緊密的短語。

第二階段稱之為“句子結構監視器(The sentence structure supervisor)”。解析器用更高節點(higher nodes)把這些短語包(phrasal packages)進行連接并形成一個完整的短語標記(a complete phrase marker)。連接不破壞初級短語包中的節點結構。這種解析器模型可以與卡普蘭(Kaplan,1972)的擴充轉移網絡(Augmented Transition Networks)和金博爾(1973)的雙階段模型(two-stage models)進行比較。與強調句子數量多少影響解析效能的其他模型所不同,灌腸機模型更側重詞語數量對解析效能的影響。

他們假設從第一階段分流到第二階段的語言單位是由長度而不是句法類型來決定的。從這能看出在中心嵌入句和符合金博爾右側連接原則分析的句子中,語言成分長度對感知復雜度是有影響的。這樣,在沒有特別剖析策略的支持下(without appeal to any ad hoc parsing strategies),也能夠解釋為什么具有對可獲信息進行智能處理能力的解析器也總犯一些“短視”的錯誤(‘shortsighted’ errors)。

例25:Who could the little child have forced us to sing those stupid French songs for,last Christmas?http://www.gerardkempen.nl/Downloadables_files/Kempen-Ch8-Dijkstra-DeSmedt1996.pdf.去年圣誕節,小孩兒讓我們為誰唱了那些無聊的法語歌?

例26:Who could have forced us to sing those stupid French songs last Christmas?去年圣誕節,誰讓我們唱了那些無聊的法語歌?

例27:Who could the little child have forced to sing those stupid French songs last Christmas?去年圣誕節,小孩兒讓誰唱了那些無聊的法語歌?

例28:For whom could the little child have forced us to sing those stupid French songs last Christmas? 去年圣誕節,小孩兒讓我們為誰唱了那些無聊的法語歌?

在例25解析中,解碼者能感受到極大的困難,原因在于短時記憶由于受到解析詞語數量的影響,短時間內很難完成對本句的解碼。該句中共有三個可供who填空的位置(slot),分別是主語、間接賓語和介詞引導的狀語成分。首先解碼者發現主語位置被the little child占據,遂后推至第二個位置,而后又發現間接賓語位置被us填滿,最后只能在介詞引導的狀語成分位置找到Who的位置,可是短時記憶解碼跨度超過了灌腸機模型所預定的六詞(短語)范圍,給解碼帶來了較大障礙。在例28中,前置介詞for的存在提示了whom的位置,因此解碼范圍符合灌腸機模型的轄域,解碼比較順暢。

例29:Someone shot the brother of the actress who was on the balcony.有人朝看臺上女演員的兄弟射擊。

Kempen(1996)認為根據右側連接原則,英語使用者通常愿意接受who was on the balcony對actress而不是對brother的附著(翻譯為“有人朝看臺上的女演員兄弟射擊”),盡管有的語言正好相反(如西班牙語)。這種后續節點位置盡可能低的處理方式也源于灌腸機模型中解碼詞語數量影響解碼結果的推斷。

灌腸機模型除了受到金博爾右側連接原則的影響外,還受到最小附著原則(The principle of minimal attachment)的影響。該原則強調解碼過程中的省力原則,即盡可能采用較少的句法節點。

例30:John read the letter to Mary.約翰為瑪麗讀信。

例31:John read the note,the memo and the letter to Mary.約翰讀了便條、便箋和給瑪麗的信。

解碼是在灌腸機模型的第一階段的短時記憶中完成的,適合最小附著原則。在例30中,to Mary 是修飾動詞read的,這與例31解碼不同。例31超出了灌腸機模型的六詞(短語)范圍,所以,第一階段解讀的只是John read the note,the memo,并把它們視為暫時的獨立整體后分流到第二階段。剩余部分的the letter to Mary隨后進入該整體,解析器在不影響第一階段模型的情況下,將后續部分進行解讀。因此,例31中to Mary修飾的不是動詞read而是名詞the letter。http://www.gerardkempen.nl/Downloadables_files/Kempen-Ch8-Dijkstra-DeSmedt1996.pdf.

1982年,弗雷澤和雷納(Rayner)在《認知心理學》(Cognitive Psychology)雜志發表論文《句子理解的出錯與糾錯:結構歧義句分析中的眼動研究》(Making and Correcting Errors during Sentence ComprehensionEye Moments in the Analysis of Structurally Ambiguous Sentences),他們認為花園幽徑句是歧義句,而且是句法結構上帶來的認知偏誤。這種偏誤可以瞬時產生也會在特定觸發點出現后進行糾正。所有這些黑箱中的認知解碼都可以通過眼動試驗進行直觀分析,即通過眼睛在花園幽徑句上停留的時間比例不同的對照來驗證這種特殊語言現象的存在。

1985年,克雷恩(Crain)聯手斯蒂德曼(Steedman)推出《勿入花園幽徑路:語境在心理句法處理器中的使用》(On Not Being Led Up the Garden Paththe Use of Context by the Psychological Syntax Processor)。文中認為花園幽徑現象涉及基于心理學的句法分析,這種條件性決定了分析的選擇性,符合語境支撐條件的可以得到解讀,否則缺失語境將給解碼帶來困難。

1987年,哈佛博士生普里切特(Pritchett)以花園幽徑現象研究為題目展開討論,并將其博士論文整理后以《花園幽徑現象和語言處理中的語法基礎》(Garden Path Phenomena and the Grammatical Basis of Language Processing)發表于《語言》(Language),文中著重分析了花園幽徑句的語法特點,并認為:

“Grammatical theory and parsing are related.Evidence from processing breakdown was examined and an attempt was made to specify the conditions under which ambiguity in the input string resulted in grammatical but unprocessable sentences.Globally ambiguous sentences were contrasted with sentences characterized as strictly locally ambiguous.”語法理論和句法剖析是相關的。行進式錯位的證據可得到論證,并嘗試詳細討論能夠在輸入字符串中產生符合語法卻無法解讀的歧義的條件。完全歧義句與嚴格意義上被稱為局部歧義的句子可進行對照研究。

普里切特在文中提到的花園幽徑現象是局部歧義的觀點具有局限性。他的觀點和其他國內外學者將這種現象看成是“局部歧義”或者是“歧義的一種特殊情況”的觀點有相似之處。

我們在本書中所持觀點與普里切特不同:鑒于“單車道單向”通行的花園幽徑現象與“多車道單向”通行的歧義具有區別性特征,我們認為這種現象不應是歧義的附屬而應該是與歧義相對的一種現象。為了凸顯花園幽徑現象所蘊含的先期通暢、中期頓誤、后期折返特性,我們借用骨科術語“錯位”將processing breakdown 翻譯為“行進式錯位”,旨在關注花園幽徑現象折返時所付出的巨大認知代價。

1993年,溫伯格(Weinberg)在論文《句子處理理論中的參數:最小支撐理論走向東方》(Parameters in the Theory of Sentence ProcessingMinimal Commitment Theory Goes East)中提出“最小支撐理論(Minimal Commitment theory)”。該理論是確定性分析器的分支(a subspecies of deterministic parsers),可用于討論直接支配和優先關系尚不明確時的語言狀態(representations where immediate dominance and precedence relations are unspecified)。溫伯格認為跨語言解讀花園幽徑現象是可能的,但基于英語和日語語料的花園幽徑句的解碼需要一定的參數做背景。

2001年,克里斯琴森(Christianson)等學者發表《花園幽徑延遲性的主旨角色分配研究》(Thematic Roles Assigned along the Garden Path Linger),關注了花園幽徑現象的延遲性,并認為這種延遲性是主旨角色參與其中的特殊現象。語言的理解是恰當的表達(an appropriate interpretation)而不是一種語言的理想化,更不是理想化結構(idealized structure)。克里斯琴森的觀點表明了語言在實踐中的非理想化。

2003年,貝利(Bailey)和費雷拉(Ferreira)在心理語言學期刊《記憶與語言雜志》(Journal of Memory and Language)中推出文章《非連貫性對花園幽徑句剖析的影響研究》(Disfluencies Affect the Parsing of Garden-Path Sentences)。兩位作者著重分析了花園幽徑句在生成過程中的觸發性因素,并利用口語“嗯(Uh)”討論了非連貫性口語表達在某些特定的句法變化中產生的語義流中途返回的花園幽徑現象。

2004年,博恩克賽爾(Bornkessel)等學者在論文《花園幽徑效力的多維功用:格標記中游離短語結構研究》(Multi-Dimensional Contributions to Garden Path StrengthDissociating Phrase Structure from Case Marking)中借助德語主賓歧義并利用格語法討論了導致花園幽徑現象的可能因素。

同年,洛克(Roark)發表《魯棒的花園幽徑剖析》(Robust Garden Path Parsing),文中側重對紙質新聞素材的整理和電話語音的實證研究,并認為由此引發的花園幽徑現象具有條件性。

2005年,劉(Lau)和費雷拉(Ferreira)分析了非流利性表達對花園幽徑句延遲性的影響,其學術思想論文《花園幽徑句理解中非流利性材料所產生的延遲效應》(Lingering Effects of Disfluent Material on Comprehension of Garden Path Sentences)發表。

2006年,岡珀(Gompel)等在《花園幽徑句中不恰當分析的激活:源于結構中的證據》(The Activation of Inappropriate Analyses in Garden-Path SentencesEvidence from Structural Priming)中提出:花園幽徑句是句法結構順序變化導致的,花園幽徑現象與結構活性具有關聯性。

2008年,《記憶與語言雜志》(Journal of Memory and Language)刊發了卡爾匹克(Karpicke)等提交的文章《錯誤記憶不足為奇:聯想記憶錯覺的主觀感受》(False Memories Are Not SurprisingThe Subjective Experience of an Associative Memory Illusion),他們認為短時記憶中的記憶偏誤對花園幽徑現象的出現具有調節性。

同年,弗雷澤等發表《極性結構:對極性形容詞最小和最大標準的解讀》(Scale StructureProcessing Minimum Standard and Maximum Standard Scalar Adjectives),提出了極性形容詞(scalar adjective)具有的極大和極小性決定了結構描寫的兩極性,這成為結構性花園幽徑句產生的原因之一。

2008年,《實驗社會心理學期刊》刊載了杰弗里斯(Jefferis)和法齊奧(Fazio)的文章《無障礙輸入:無障礙建構信息對行為的引導》(Accessibility as InputThe Use of Construct Accessibility as Information to Guide Behavior),文中以中國上海某校的大學生為心理實驗的測試來源,對花園幽徑現象引發的瞬時性認知誤解進行了解讀。

2009年,帕特森(Patson)等在《花園幽徑句中的延遲誤解:源自釋義任務的證據》(Lingering Misinterpretations in Garden-Path SentencesEvidence from a Paraphrasing Task)中通過實驗證明了基于釋義任務的花園幽徑句是延緩性誤解的產物,對其解碼具有延遲性。

2010年,克里斯坦森(Christensen)在《大腦與認知》(Brain and Cognition)發表論文《句法的重構和重析,語義死角與前額葉皮層》(Syntactic reconstruction and reanalysis,semantic dead ends,and prefrontal cortex)。認為左額下回(the left inferior frontal gyrus)與句法處理相關聯。實驗證明:對省略的重構和對花園幽徑現象的重析都要求大腦進行額外的句法處理,相應地增加了相關區域的活性并在各區域間產生了交互效應(an interaction effect)。

國外的諸多研究大多是從發揮母語優勢的角度進行花園幽徑現象闡釋的,或者說是從語言本體進行切入解讀的,這與研究者大多是母語使用者是分不開的。與這一研究趨勢相反,國內研究者基本屬于非母語的英語研究者,因此不具備語言使用的敏感性語感。國內研究者側重引薦國外研究,同時力圖實現研究的本土化,并通過與漢語對比進行花園幽徑現象研究。

主站蜘蛛池模板: 武鸣县| 石台县| 耒阳市| 全南县| 镇康县| 宣恩县| 麻栗坡县| 卫辉市| 岳池县| 石阡县| 金昌市| 沾益县| 定边县| 云龙县| 福泉市| 灵宝市| 衡山县| 怀仁县| 民丰县| 合阳县| 苍山县| 葫芦岛市| 红桥区| 日照市| 汉寿县| 桓台县| 剑阁县| 杭州市| 平阴县| 简阳市| 永平县| 砚山县| 东兰县| 铜山县| 闵行区| 黄浦区| 西乡县| 都兰县| 堆龙德庆县| 西吉县| 社旗县|