- 我是誰:生命的起源(套裝共4冊)
- (英)杰米·A.戴維斯 埃德·揚 尼克·萊恩 (美)馬倫·霍格蘭 伯特·竇德生
- 7584字
- 2022-06-29 15:43:49
1 遇見奇怪的科技
一個人出生前九個月的歷史,可能比之后的七十年更有趣。
——塞繆爾·泰勒·柯爾律治(Samuel Taylor Coleridge)
英國哲學家、詩人柯爾律治寫下以上這句話時,用的是成人的考究語言,表達的卻是每個孩子都曾有的好奇。他們問父母:我從哪里來?由于這很可能涉及兩性和應該在什么時候給孩子講解到什么程度的問題,很多父母會變得局促不安。提問的孩子對父母的心思一無所知,對他們來說,問題更單純,也更復雜:他們只想知道,一個全新的人,是如何從無到有出現的。
孩子從未得到全面而正確的答案,因為從來也沒人知道得足夠多。在柯爾律治寫作的年代,人們已經部分了解到,一個全新的人在子宮內生長的過程中,會經歷一系列解剖結構上的變化。但這些變化是怎樣的,又為何發生,在那時還完全是一個謎。過去的兩個世紀里,一代代科學家費盡心思,想要知道一個受精卵如何變成一個孩子。過去十年間的科學飛速發展,隨著錯綜復雜的人體機制展露在人們面前,神秘感稍稍退去,人類的敬畏之心卻越發強烈。研究人員正在發掘的這些故事足以震驚世人,但至今為止幾乎只出現在學術期刊上干巴巴的文字中。這是關于我們每個人的經歷的故事,理應屬于每一個人。寫作本書是一次嘗試,是一個恰好在該領域工作的科學家的嘗試。他匯集了近年來相關的重大研究進展,來解釋這個復雜的、帶著孩子氣的提問:我從何而來?
我們現在對人類胚胎發育的理解絕非來自某一特定研究,而是綜合了從各個學科得到的信息。與發育直接相關的是胚胎學和新生兒科學,這些學科研究提供了與之相關的解剖和功能信息。遺傳學和毒理學為發育生物學帶來了更廣闊的視野,對甄別造成先天異常的原因有極大的價值。這非常重要,因為了解導致畸形的原因能夠幫助研究發育的科學家找到那些正常發育所必需的分子通路。生物化學和分子生物學會幫助研究這些通路的作用細節,甚至可以追溯到空間尺度上小到生物分子的原子之間的相互作用。細胞生物學致力于說明分子通路如何聯合起來控制每個細胞的行為。以更大的維度來論,生理學、免疫學和神經生物學揭示了眾多細胞之間交流與合作的種種細節。
以上提及的學科都從屬于生物或者醫藥科學,也是胚胎研究的傳統領域。近年來,還有一些學科初看上去和胚胎毫無關聯,但也給人類發育研究帶來了啟迪,例如數學、物理、計算機科學,甚至還有哲學領域的研究。這些研究并不提供哪個細胞什么時候做了什么的細節,而是關心有更深遠意義的抽象問題,比如:簡單的東西如何變得復雜?這些很容易出錯的機制是怎么完成精確的構造過程的?人類發育是否太過復雜,甚至超出了發育完全的人能夠完全理解的范疇?對于最后一個問題,人們從未達成定論,而何謂發育“完全”恰恰是爭論的焦點。關于前兩個問題,研究人員已經取得了重大的進展,他們找到的答案都與“涌現”(emergence)和“適應性自組織”(adaptive self-organization)這兩個概念有關。這兩個名詞分別位于更高層和更低層,是同一個問題必不可少的兩方面。那些關注高級行為的人喜歡用“涌現”:由簡單的組成和規則發展出復雜的結構與行為。“適應性自組織”是一種基于單個組分、由下而上的描述:簡單的組分遵循某些簡單的規則,就可以共同形成大規模的、巧妙或精致的東西。①“適應性自組織”的思想會貫穿本書,因為它是發育的核心:它讓非生命的分子產生了活細胞,讓作為個體能力十分有限的細胞形成強大的多細胞生物。它甚至超越生物本身。有一些值得一讀的書探討了有關這個問題的深遠意義,你可以在延伸閱讀中找到它們。
我們對發育日益增進了解,其中有一點毋庸置疑:身體的自我構建與我們在建筑和工程中熟悉的構建方法截然不同。這凸顯了這樣一個事實,我們完全不了解自己身體的構造方法。這個事實有多諷刺,它本身就有多重要。讓我們來比較和對比一下生物系統和人類的建筑技術,這可能十分有助于理解胚胎的發育過程。
幾乎所有的工程項目,比如組裝機車、建造房子都有一個共同特點,那就是首先會有一個明確的計劃,通常是一張圖紙或者其他類型的計劃書,其中會包括明確的預期目標。計劃書會詳細描繪出項目完成時的構造,但計劃本身并不是實體成果的一部分。每個項目都必須有人統籌全局,一個總工程師或建筑師,他利用有著一定等級結構的指揮系統,把指令傳達給負責切割、砌磚、焊接和粉刷的工匠。而由工匠完成的各個部分不能自主組合,只能依賴工人膠合、拴住或焊接。不過這些工人也不是最終建筑結構的一部分。工人和總工程師引入了大量的“外在”信息,例如焊接或澆筑拱門等,但這類知識細節并不會直接呈現在建筑上。大多數結構要等整個工程全部完工以后才會開始發揮預期的功能。
如果你在生物結構中尋找這類特征,就會深深意識到生物與傳統機械和土木工程之間的巨大差別。和工程項目不同,生命的構造過程并不涉及計劃書,沒有包含任何對最終結構的闡述。受精卵內(基因、分子結構、特定化學分子在不同位置的濃度差異)必定包含信息,但這些信息與最終的身體構成沒有簡單的對應關系。我們已經知道,這些信息可能續發之后的一系列事件(我們之所以知道,是因為我們改變信息之后,比如讓基因突變或者改變相關化學物質的位置,就會改變后續的發育步驟,導致發育出現異常)。
在工程項目中,特別是應用到數學的,建筑施工人員可以根據一系列指令把最終結構創造出來。告訴一個人,把一根木樁打入麥田的中央,在上面系一條繩子,抓住另一頭向遠處走,把繩子拉直,然后向右轉,保持繩子緊繃的同時繼續行走,這就是一個簡單的指導制作麥田圈的指令。對于有些結構,使用指示來說明,比畫滿細節的圖紙直截了當得多。如果你碰巧手邊有筆和紙張,嘗試跟隨下面的指令,畫一個被稱為謝爾賓斯基鏤墊(Sierpinski Gasket)的幾何圖案:
1. 畫一個底邊水平的等邊三角形,畫得盡可能大。把這個作為基底三角形。
2. 取各邊的中點,用線段連接每條邊的中點和相鄰邊的中點,一共畫三條線段。這三條線段會組成倒置的、占基底三角形四分之一面積的三角形。
3. 把這個倒置的三角涂黑。
4. 此時,基底三角形內有三個未涂黑的正置的三角形。把它們作為基底三角形,重復以上兩步。
(覺得無聊了就停下來;如果鉛筆夠用,就可以無限重復這個過程。)
把那些涂黑的部分想象成鏤空狀態,你得到的圖案就像某種鏤墊,這是分形,也可以說是自相似性(即任意放大后形態相似的結構)。另一個例子是康托爾集(Cantor Dust),這是一種在容易擦除痕跡的材料上很輕松地畫出來的結構。例如在黑板上畫一條線,擦掉中間的三分之一,創造出兩條相對較短的線。然后再擦掉短線中間的三分之一,制造出更短的線……一直重復這個步驟。不消一會兒,你就會得到帶有特別間隔的一系列粉筆短線。而這些間隔與大量自然現象有著相同的統計特征,例如沙丘傾塌的大小分布、漏水的水龍頭滴水的間隔,還有大地震、傳染病和大滅絕的發生間隔等。
即使在數學之外,與繪制出一張展示最終樣式的詳細圖紙相比,給出一系列規則而制造出一種特定的構造是一種更普遍的做法。美食教程如此,紡織說明也如此:簡單的有“一針正針,一針反針”這樣的圖案說明,也有復雜如雅卡爾(Jacquard)1801年發明的織布機上復雜的打孔卡——那可以說是世界上第一臺可編程的制造設備。音樂也采用類似的說明方式,五線譜上的音符告訴樂手何時開始演奏,也會指示演奏的音高和時長。
長久以來,在我們的文化中,人們通常會通過一種簡單的方法,即給出說明書來詳述如何得到某種預期的結果。這讓我們很容易就接受一種想法:生物信息也通過類似的方式構建了我們自己。然而,這種想法很危險。其實二者之間存在一個關鍵區別:人類構建一個對象總是依賴一系列說明,并且由一個外在的智能中間人,理解并遵循這一系列指令后組建完這個對象。即使有些東西初看上去像例外的產物,比如針織機或是能自動演奏的鋼琴,但這些機器本身還是由那些中間人理解指令后完成的,所以它們并不是真正的例外。簡而言之,羊毛開衫、交響樂、小汽車和教堂都不能創造它們自己。指令、操作知識(比如針織、烹飪、焊接和砌石頭等)和對材料的物理操作都來自外部,而非構建中的結構本身。而胚胎中的信息與此相反,不需要任何外來的熟練工添磚加瓦或深思熟慮,只由胚胎本身接收信息與表達發育。不像大多數的技術構建需要某個人做總指揮,你很快就會明白,生物的構建由其中所有的元素共同參與。構建一個人的過程中,控制不是少數的、部分的特權,而是由系統作為一個整體來實現的。
要理解這種構建過程,我們首先要理解構建材料的特性。我的實驗室在愛丁堡大學,那附近有三座著名的橋:托馬斯·特爾福德(Thomas Telford)主持修建的典雅院長橋位于市內,本杰明·貝克(Benjamin Baker)標志性的福斯鐵路橋橫跨海灣,一旁還坐落著福斯公路橋。特爾福德的那座橋由石塊砌成:這些材料又大又重,只有在受到重壓后才會穩固。他據此采用了傳統的建筑方法:首先建造橋墩,然后造了一個用來撐住橋拱的木制支架,接著往這個架子上堆積形狀適宜的石材,直到石材的重量足以穩固支撐橋拱,再拆除木架。貝克用的是當時極其新穎的材料——鋼材來建造他的鐵路橋。這種材料既可以承受拉力,也經受得住壓力,因此他得以從橋墩處直接向外延伸鋼材,形成一種懸臂式結構;他們用起重機吊起那些長長的、相對較輕的型鋼,然后放到合適的位置,再用鉚釘把它們固定在一起。福斯公路橋是三座橋中建成時間最短的。這座懸索橋由緊繃的鋼索支撐,這些鋼索從兩側的吊塔上伸出,一直延伸到位于海灣另一側海岸的吊塔上。因此,造這座橋時首先要造吊塔,然后在吊塔后面為吊索建造牢固的錨碇,再一根根增加鋼索并拉緊,直到可以懸起整片路面。在以上各個例子中,材料的天然特性決定了建造橋梁的整體策略,每座橋梁都必須因材施工。生物界的建造策略也是如此,都取決于參與成分的特性。所以是時候介紹一下構成生物的三種重要成分了,我將在本書中一次次提到它們:蛋白質、mRNA和DNA。
目前,生物結構中已知最重要的分子是蛋白質。它們構成了最重要的物理結構,賦予細胞特有的形狀;控制物質出入細胞的通道和離子泵也由它們構建;另外,驅動和控制生命活動中化學反應的酶還由它們組成。這些生化反應包括合成DNA、生成脂肪和糖類的代謝途徑,這些物質也是身體的組成成分。蛋白質的相對重要性在紅細胞中體現得最為淋漓盡致。紅細胞在成熟過程中會丟棄細胞核,其中包含著細胞的所有基因。成熟的紅細胞可以持續生活120天左右。但如果一個細胞失去了蛋白質功能,僅僅保留基因,那它們活不過幾秒鐘。
蛋白質是由一個個氨基酸組成的長鏈。人體內有20種氨基酸,它們形狀不同,化學性質各異。這些氨基酸之間能夠產生相互作用,氨基酸鏈也因此傾向于折疊成復雜的形狀:有時候是自主折疊,有時候還會借助臨時的“幫手”。折疊過程極其錯綜復雜,以至于人們目前還沒有能力在已知氨基酸序列的情況下,精確推斷出蛋白質的最終結構。(雖然人們已經開發出了預測蛋白質結構的電腦程序,但編程過程中涉及的計算和概率推理過程,都以已知的蛋白質結構與序列關系為基礎,這些都是通過氨基酸序列和X射線晶體學得到的結果。預測蛋白結構有點像預報天氣,就是稍微準確一點。)
不同的蛋白質,其氨基酸序列不同。一個又一個的氨基酸根據另一種生物分子信使RNA(也稱mRNA,請見圖1)指定的順序添加到不斷增長的蛋白質鏈中。mRNA分子也由多個單元鏈接成的長鏈構成,它們的構成單元是四種堿基:A(腺嘌呤)、C(胞嘧啶)、G(鳥嘌呤)和U(尿嘧啶)。這些組成單元十分相似,相對于氨基酸來說,它們在化學活性上相對簡單。細胞中的mRNA除了指導生長中的蛋白質添加氨基酸的順序,就沒什么其他用處了。蛋白質上的氨基酸序列由mRNA上的堿基決定,三個堿基排列成一組,共同決定一個氨基酸。

圖1 核糖體把mRNA翻譯成蛋白質,它會根據mRNA的堿基序列向蛋白質鏈中添加氨基酸。
mRNA的堿基序列直接由DNA的堿基序列決定,DNA是由A、C、G和T四種堿基串聯而成的長鏈分子。這些堿基可能按照任何順序排列。參與構成我們人體46條染色體核心的每個DNA分子都有數百萬個堿基。這里面就包含了組成基因的一個個片段。一個基因被讀取后,DNA上的遺傳信息會被復制到RNA上:根據DNA堿基A、C、G、T的順序,轉化為RNA的A、C、G、U的語言。因此,RNA實際上是一種復制了遺傳信息的不同媒介,或稱為“轉錄本”(transcript)。正式讀取基因編碼的任務由蛋白質執行。它們首先會結合ATAAT、TCACGCTTGA這類堿基短序列,這些序列常見于基因的起始處附近。不同的基因,其附近的短序列也各不相同,而不同的序列又會結合不同的蛋白質——因此,讀取不同基因的蛋白質組合各不相同。
不同的基因會由相應的DNA結合蛋白結合并啟動,這點十分重要,因為身體上的不同細胞需要制造出各自所需的蛋白質。例如腸道中的細胞會制造消化食物的蛋白質,卵巢中的細胞能制造產生性激素的蛋白質,白細胞能制造對抗感染的蛋白質。盡管這些細胞都含有基因組上的所有基因,包括永遠都用不到的那些,可是只有細胞需要的那些基因會被讀取出來,因為細胞中只有針對那些基因的DNA結合蛋白。
寫到這里,我們不得不接受這樣的事實:在細胞或胚胎中,并沒有什么“總負責人”。簡言之:生命體合成出蛋白質,僅僅是因為活躍的基因(通過mRNA)指定了這個制造過程。而這些基因之所以活躍,只是因為已經存在啟動它們的蛋白質。這是一個循環邏輯:哪里都不受控制,因為哪里都有控制(請見圖2)。

圖2 生物邏輯的循環特性。蛋白質決定哪些基因被讀取,這些基因又去指定制造出哪些蛋白質,其中就包括決定基因讀取的蛋白質……以此類推。
圖2中的循環為我們帶來了有趣的啟示。一個狀態穩定的細胞,其中所有活躍表達的基因中肯定包含了特定的基因,它們轉錄翻譯出能夠結合在這些基因附近的識別序列,同時一定不包括用來激活當前不活躍表達基因的蛋白質。如果滿足不了這樣的條件,通過基因轉錄翻譯出的蛋白質不能維持這些基因的表達,那么就會開啟或者關閉某些基因,繼而合成新的蛋白質,以此類推。這些變化會持續發生下去,直到達成能夠自我維持的狀態。這就是在我們的發育過程中,細胞會分化成不同類型的原理。這是一種尤其會受到外部影響(即觸發“信號”)驅動的改變,這些信號會改變特定蛋白質激活基因的能力:打破細胞當前的穩定狀態,使其轉向新的穩定狀態。在本書的后面,我們會講述很多關于這類信號的例子。
分散的、循環式的控制絕非生物體構建過程中唯一的古怪特性。另一個從傳統工程師的慣常認知看來非常奇怪的特征是,生物分子能夠進行自我組裝,自發地形成更大規模的結構,這是磚塊和螺栓單靠自身不可能做到的。這個對生命的存在而言有基礎重要性的過程,有點類似于晶體的形成過程。以小朋友們用化學儀器鼓搗出的那種常規晶體為例,這些晶體之所以能形成,是因為它們的組成分子能夠一個個緊密地連接在一起,這些連接主要由那些小小的局部電荷互相吸引而構建起來。蛋白質也有固有的電荷模式,會在蛋白主體上形成極其復雜的裂隙和凸起等。無論是蛋白質的形狀,還是其電荷模式,都是衍生自氨基酸序列的特征。有時蛋白質只在前端有一種類型的裂隙,而尾端有能夠匹配這個裂隙的凸起,很像樂高積木。在這種狀態下,同一種蛋白質分子會首尾相連,形成長長的細絲結構,具體長度不定(請見圖3)。而更常見的狀況是,每個蛋白質只能識別其他蛋白質或其他分子上而不是自身的結合位點,這意味著它們不能形成無限延伸的、類似于晶體的線狀結構,取而代之的是與其他確定數目的蛋白質結合在一起,形成具有確定結構的多成分復合物。這類復合物對細胞十分重要,因為它們就如某種小型機械裝置,可以運行某些復雜的化學反應,或是參與裝配某些因為過于龐大而不能自主形成的結構。上文提及的那些讀取基因的蛋白復合體就是一例。

圖3 蛋白質通常有一定的電荷模式。當電荷模式或形狀互補,不同蛋白質上的裂隙和凸起就可以非常牢固地結合在一起。如果某種蛋白質的一端可以結合同種蛋白質的另一端,就會形成蛋白質細絲,其中每個分子就是其中相對獨立的一環。如果一種蛋白質只能與其他蛋白質結合,就會形成有確定大小和形狀的蛋白復合體。轉錄和翻譯基因的蛋白質就是這種類型。
蛋白復合體所代表的這種組織層次把我們帶入了新的領域。蛋白質裝配成復合體所依賴的信息就儲存在蛋白質中(在這個例子中,“信息”本質上和結構是同一樣東西)。因此,這就進入化學領域了,而且結果總是一樣:可靠、可復制,但缺少靈活性。生物結構在更大尺度上有著更多變化,而這些變化是對環境的適應。比如說細胞的整體形狀就必須契合它所在的組織。同樣,這個細胞與相鄰細胞建立起的一系列聯系,必須與它相鄰細胞的位置相匹配。因此,這種更大尺度上的生物結構并不僅僅由它們分子的化學結構所包含的信息決定,還需要額外的信息。從之前僅由內部的信息決定結構,到外來的信息也參與調節,這種轉換帶我們跨越界限,從純粹的化學范疇進入生物學范疇。在生物系統中,多層級的調控加入化學上的自我裝配過程,形成了能夠組織結構來適應環境和生命所需的系統。而我們之前提過的適應性自組織,在這里就變得尤為重要了。適應性自組織是解釋這個現象的關鍵:人體中的幾千個基因和蛋白質,無論哪一個都不可能描述出人體結構和功能的概念(無論以哪種語言),卻能制造出人類機體。這就和工程項目形成了鮮明的對比:建造工程時總需要用到來自外部的工作人員或機器人,按照正確的方式把各部分拼裝到一起。接下來的章節會詳述,適應性自組織為何對人類發育的各個層級都極為關鍵:從單個細胞里分子的自組織,一直到大尺度上復雜組織的構建。
生物結構最后一個特別之處來自生命受到的重大限制:生命的運轉不能停下來,不能為某種需求從頭開始構造。人類主導的工程可不是這樣的,例如在制作電腦和飛機時,人們只希望完工之后這些東西能夠發揮功能,并不指望結構還未完工的時候能有什么用。發育中的胚胎所受到的約束是,無論發育到哪個階段,都要兼顧維持自身的生存。管道工人如果想把新的分管道連接到建筑主管道上,首先可以斷開主管道切斷水流,然后接入三通管,再重新通入水流,這就算完工了。但如果人類在生長過程中也采用這種方法給有需求的大動脈增加分支,那不等完工,人體就會因失血過多而亡。對人體內的其他基本系統來說都是如此。在發育過程中要維持生存的絕對前提,極大地限制了人體的構建過程。這也是人體的構建過程看起來如此奇異的另一個原因。而我們把這個構建過程與普通的工程項目相比較時,有時又覺得它們太復雜了。
我們致力于理解自身的起點時,必須準備好超越那些基于人類工程的平凡類比,學會從胚胎自身逐漸發育的角度來看待它。這將是一場踏入陌生領域的旅程,需要摒棄那些有關工程的比喻,采用新的思考方式。畢竟不是我們建造了胚胎,而是它們造就了我們。
①適應性自組織的同義詞,子類型還包括“群體智慧”“蜂巢思維”等。這些詞匯被用于人群和社會性昆蟲的研究,但用這樣的詞似乎太感性了,不太適合用在分子或細胞上。因此我在本書和以前寫作的書中都選擇了“適應性自組織”這個詞,在數學和物理領域,人們更常使用這個詞。