第四節
RNA和蛋白質的華爾茲
蛋白質能夠催化幾乎任何化學反應,按理說催化自己的生成也應該不成問題。但是出人意料的是,蛋白質不能夠催化自己的合成!這倒不是因為蛋白質沒有把氨基酸連在一起的能力,例如細胞里面有一種重要的分子,叫做谷胱甘肽(glutatione),就是由蛋白質催化合成的。谷胱甘肽由三個氨基酸單位組成,分別是谷氨酸、半胱氨酸、和甘氨酸(見圖2-8)。由于它只有三個氨基酸單位,所以還不夠蛋白質的“資格”,而只能被稱為“肽”。有幾個氨基酸就叫做幾肽,所以谷胱甘肽是個三肽。即使要把這三個氨基酸連在一起,也需要兩個酶的催化。第一步,γ-谷氨酰半胱氨酸合成酶把谷氨酸和半胱氨酸連在一起,形成谷胺酰半胱氨酸這個二肽。再由谷胱甘肽合成酶把甘氨酸加到這個二肽上,形成谷胱甘肽。這個例子說明,由蛋白質組成的酶是可以合成肽鏈的。既然肽鏈可以被蛋白質合成,為什么蛋白質的合成就不行呢?
這是因為合成谷胱甘肽的方法不能被擴大到蛋白質的合成上。在合成谷胱甘肽時,γ-谷氨酰半胱氨酸合成酶上面同時有谷氨酸和半胱氨酸的結合點,而且這些結合點把兩個氨基酸的位置安排得恰到好處,再經過酶的催化,這兩個氨基酸就連在一起了。谷胱甘肽合成酶上同時有谷胱二肽的結合點和甘氨酸的結合點,它們彼此之間的位置也是恰到好處,所以可以把甘氨酸和二肽連在一起,形成谷胱甘肽(圖2-8)。

圖2-8 谷胱甘肽的合成的兩個步驟。上圖為谷胱甘肽的分子結構,下圖表示谷胱甘肽的合成需要兩個酶的作用
現在假設我們要合成一個由5個氨基酸組成的蛋白質,其中的氨基酸依次是ABCDE(這樣寫只是為了敘述方便,其實其中的一些字母,例如B,并不真的代表一種氨基酸)。合成AB時需要一個酶,同時結合A和B。合成ABC時需要另一個酶,同時結合AB和C。到這一步,合成過程和谷胱甘肽的過程是一樣的。但是合成ABCD就需要第三個酶同時結合ABC和D,合成ABCDE還需要第四個酶同時結合ABCD和E,余此類推(圖2-9)。

圖2-9 一種假設的由蛋白質催化合成肽鏈ABCDE所需要的酶和步驟
這樣,要合成由N個氨基酸組成的蛋白,就需要N-1種酶,而且要結合的肽鏈也越來越長。對于有幾百個氨基酸單位的蛋白質來講,這顯然是不切實際的。這還是只對一種蛋白質的合成,而細胞里有幾千種的蛋白質,用這種方法來合成所有這些蛋白質更不可能。況且合成蛋白質的酶自己也是蛋白質,它們又如何被合成呢?所以走谷胱甘肽合成的這條路來合成蛋白質是行不通的。
RNA雖然可以把氨基酸連起來,形成蛋白質,但是如果沒有一種機制來規定氨基酸被加上去的順序,這樣合成的蛋白質中氨基酸的排列順序只能是隨機的。這樣隨機形成的蛋白質中會有一些具有生命所需要的性質(例如催化功能),在生命的早期也許起過作用,但是隨著生命的化學系統逐漸定型,對蛋白質序列的要求就越來越嚴格。有時一個氨基酸單位的改變都會影響蛋白質的功能,例如人的鐮狀細胞貧血癥(sickle-cell anemia)就是血紅蛋白中一個谷氨酸單位被纈氨酸取代而引起的。所以要合成具有一定氨基酸順序的蛋白質,必須要有含有這個序列的嚴格指令。
蛋白質中的氨基酸序列本身就包含有這個信息,如果這個信息可以被讀取,蛋白質也可以被用作模板來復制自己。假設每一種氨基酸都可以結合同樣的氨基酸,那么蛋白質伸開的肽鏈就可以把各種氨基酸按照自己的順序排列起來,再由RNA把這些氨基酸連在一起。但這只是一種假設,氨基酸并不能結合與自己相同的氨基酸。蛋白質作為一個整體的確可以結合氨基酸,前面所說的谷胱甘肽合成酶就是一個例子,但在這樣的結合中一個氨基酸對應的不是一個氨基酸,而是肽鏈卷曲以后由多個氨基酸組成的結合區。肽鏈的正確卷曲還有其他氨基酸的參與,所以蛋白質要結合一個氨基酸,需要整個蛋白質作用。由于這個原因,蛋白質是不能作為模板來指導自己的復制的。換句話說,由于蛋白質中的氨基酸之間沒有如RNA分子中堿基之間那樣的配對機制,蛋白質里面的信息(氨基酸的排列方式)并不能被讀取,信息必須儲存在別的分子中。
RNA由4種核苷酸(腺苷酸、鳥苷酸、胞苷酸、尿苷酸,分別用字母A、G、C、U代表)線性相連組成,好像由4個字母寫成的長句子。這4個字母排列的順序就可以用來儲存信息。例如AGC代表一個意思,GCC又代表另一個意思,就像24個英文字母按照不同順序排列,可以組成不同的詞一樣。用這種方式,蛋白質中氨基酸的順序就可以儲存在RNA分子中。那么需要幾個“字母”來代表一個氨基酸呢?RNA里面只有4種核苷酸,兩個核苷酸只有16種(4×4)排列方式,而氨基酸卻有20個,顯然是不夠的。如果用三個核苷酸來決定一個氨基酸,就有64(4× 4× 4)種排列方式,在決定氨基酸種類上是富富有余了,所以現在的生物都使用密碼子(triplet code)來為蛋白質中氨基酸的序列編碼。這些為蛋白質編碼的密碼子類似于電報的密碼,叫做密碼子(codon)。由于64遠大于20,許多氨基酸由多個密碼子來編碼,第3個字母可以不同,例如CAU和CAC都代表組氨酸,AAA和AAG都代表賴氨酸。許多氨基酸還有4個密碼子,例如GCU、GCC、GCA、GCG都代表丙氨酸(圖2-10)。不過可以儲存信息是一回事,能不能讀取信息又是另一回事。蛋白質中氨基酸的排列順序也是一種信息,只是細胞無法讀取,如果儲存在RNA分子中核苷酸序列里的信息也沒有方法被讀取,這樣的信息仍然沒有用處。

圖2-10 為氨基酸編碼的核苷酸密碼子
在這里,早期的生物有另一個“幸運”,就是有催化作用的RNA可以把氨基酸連在一個小RNA分子上。這個小RNA分子上面又有幾個核苷酸專門用來和儲存蛋白質氨基酸順序的RNA分子上的密碼子配對,例如小RNA分子上的ACU就可以和編碼RNA分子上的UGA配對,這樣就可以把氨基酸帶到RNA分子附近(見圖2-11)。這幾個通過堿基配對而和密碼子結合的核苷酸序列就叫做反密碼子(anticodon),是小RNA分子讀取RNA分子中密碼子信息的工具。如果每一種氨基酸都對應小RNA分子上特定的反密碼子,這些氨基酸就可以被帶到RNA分子上為自己編碼的密碼子附近,并且按照RNA分子上面密碼子的順序排列起來。如果這時有第三個RNA分子能夠把這些氨基酸連起來,就可以合成蛋白質。由于氨基酸的順序是按照編碼RNA分子上密碼子的順序決定的,mRNA分子就可以準確地指導蛋白質的合成,RNA分子中為蛋白質編碼的信息就可以被讀取了。
由于每一種蛋白質都有自己特有的氨基酸序列,這意味著每種蛋白質都需要專門為自己編碼的RNA分子。這應該不是個問題。同一個mRNA分子可以被重復使用,合成多個蛋白質分子,理論上每種蛋白質有一個為它編碼的RNA分子就夠了,所以細胞儲存這些信息并不需要太多的資源。
這個機制還真的被原核生物采用了。原核生物細胞中蛋白質的合成,是在一種叫做核糖體(ribosome)的結構中進行的。核糖體是由RNA和蛋白質組成的巨大復合物。原核生物的核糖體分為“大亞基”和“小亞基”兩大部分(參看圖1-9),其中小亞基含有1個由1540個核苷酸組成的RNA分子和21個蛋白質分子,大亞基含有兩種RNA分子,分別由120個和2900個核苷酸組成,以及31個蛋白質分子。核糖體里面的蛋白質沒有催化作用,而是幫助整個結構的穩定。核糖體里的RNA rRNA才是催化蛋白質合成的分子。為蛋白質編碼的mRNA結合于核糖體,在那里指導蛋白質的合成。合成蛋白質所需要的氨基酸則被與它相連的小RNA分子——轉運RNA(transfer RNA,簡稱tRNA),轉運到mRNA分子附近,通過tRNA上的反密碼子和mRNA上的密碼子結合。大亞基上由2900個核苷酸組成的rRNA有催化功能,可以把這些氨基酸連在一起,這樣就能夠準確地按照mRNA中的信息合成蛋白質,而且幾乎沒有誤差(圖2-11)。因此蛋白質肽鏈的合成是由三種RNA分子(mRNA、tRNA、rRNA)協同完成的。這個機制是如此成功,所以不僅原核生物首先使用,地球上所有的其他生物也都繼承了這個機制。這個合成蛋白質機制的發展和完善,是原核生物的又一大功勞。

圖2-11 RNA指導蛋白質合成。氨基酸先被連接到tRNA分子上,通過tRNA分子上的反密碼子與mRNA分子上的密碼子配對,把氨基酸帶到mRNA附近,由核糖體中的RNA(rRNA)把這些氨基酸連在一起,形成肽鏈。左下為苯丙氨酸tRNA的結構,顯示tRNA分子內的堿基配對使分子形成三葉草的形狀,右下為tRNA的實際空間形狀
在生命出現的早期,RNA催化自己的復制,并且催化蛋白質的合成。到了原核生物,RNA分子的合成已經不再由別的RNA分子催化,而改用蛋白質來催化,但是RNA催化肽鏈合成的功能卻一直保留。離開RNA,就沒有蛋白質的合成;而沒有蛋白質,RNA也無法合成。現在所有生物體內的RNA,都是由蛋白質催化合成的,而所有的蛋白質又是RNA催化形成的。RNA和蛋白質之間跳的這種“華爾茲”是所有現代生命的基礎。