- 破天機(jī)(第一推動(dòng)叢書·生命系列)
- (美)珍妮佛·杜德娜等
- 16762字
- 2023-02-13 18:52:05
上篇
工具
1.尋找解藥
最近,我聽到了一個(gè)不可思議的故事,它充分體現(xiàn)了基因編輯的力量和巨大潛力。
2013年,美國國立衛(wèi)生研究院(NIH)的科學(xué)家們遇到了一個(gè)醫(yī)學(xué)難題。這些研究人員在研究一種叫作WHIM綜合征的罕見遺傳病,但這位患者的狀況令他們一頭霧水。她從小就被診斷患有該病,但當(dāng)國立衛(wèi)生研究院的科學(xué)家遇到她時(shí),疾病竟然奇跡般地從她體內(nèi)消失了。
在世界范圍內(nèi),WHIM綜合征患者不過幾十個(gè)人,但它是一種令人痛苦的,甚至可能致死的免疫缺陷疾病,患者的生活受到嚴(yán)重影響。它的起因是一個(gè)微小的突變——在人體32億對堿基序列里,有一個(gè)字母出錯(cuò)了(區(qū)別只是幾十個(gè)原子的大小)。這個(gè)微小的變異讓W(xué)HIM患者特別容易被人乳頭瘤病毒(human papillomavirus, HPV)感染,引起皮膚疣,后者失控地生長,最終演變成癌癥。
國立衛(wèi)生研究院的科學(xué)家遇到的這位患者,正是20世紀(jì)60年代該疾病首次被報(bào)道時(shí)的那位女孩——這也從側(cè)面說明了該病的罕見程度。在學(xué)術(shù)文獻(xiàn)中,她通常被叫作WHIM-09,但是我會(huì)叫她金女士。金女士從一生下來就患有WHIM,后來也因該病引發(fā)的嚴(yán)重感染多次住院。
2013年,金女士58歲了。她帶著兩個(gè)20歲出頭的女兒,一道來見國立衛(wèi)生研究院的研究人員。她的女兒也表現(xiàn)出了WHIM的典型癥狀,但研究人員驚訝地發(fā)現(xiàn),金女士自己似乎安然無恙。事實(shí)上,她已經(jīng)20多年沒什么癥狀了。令人震驚的是,沒有接受任何醫(yī)療干預(yù),金女士自愈了。
金女士如何憑一己之力就從這種致命的疾病中逃過一劫?科學(xué)家通過精心設(shè)計(jì)的實(shí)驗(yàn)發(fā)現(xiàn)了一些重要的線索:在金女士的臉頰和皮膚細(xì)胞里,引起WHIM的突變基因仍然存在,但是在她的血液里,這個(gè)突變卻不見了。研究人員對金女士血細(xì)胞的DNA進(jìn)行了仔細(xì)分析,發(fā)現(xiàn)了一些更不可思議的事情:她的一條2號染色體上缺失了一段DNA,包括3500萬個(gè)堿基序列,而這一段里含有完整的突變基因,叫作CXCR4。2號染色體上余下的大約2億個(gè)堿基也被打亂了,就像龍卷風(fēng)席卷過染色體,其中的堿基序列一片狼藉。
這些初步發(fā)現(xiàn)引發(fā)了一系列疑問。金女士體內(nèi)其他細(xì)胞的DNA是正常的(CXCR4基因突變除外),但血細(xì)胞里的DNA怎么變得如此無序?此外,考慮到含有CXCR4基因的染色體已經(jīng)被打亂,而且缺失了164個(gè)基因,血細(xì)胞為何仍然能夠存活,而且可以正常行使功能?人類的基因組里含有數(shù)千個(gè)基因,它們發(fā)揮著重要的功能,比如DNA復(fù)制和細(xì)胞分裂。金女士體內(nèi)竟然會(huì)有這么多基因憑空消失了,而且似乎沒有什么糟糕的后果,這到底是怎么回事?
國立衛(wèi)生研究院的研究人員進(jìn)行了更多測試,終于為這種驚人的自愈現(xiàn)象拼接出一個(gè)完整的解釋鏈。他們的結(jié)論是,她體內(nèi)的某個(gè)細(xì)胞必然經(jīng)歷了一種極不尋常但通常引發(fā)災(zāi)難性后果的事件——染色體碎裂(chromothripsis)。這是一種新近發(fā)現(xiàn)的現(xiàn)象:染色體突然粉碎,然后重新修復(fù),引起基因劇烈重排。它對身體的影響可能微乎其微(如果破損的細(xì)胞馬上死去),也可能非常嚴(yán)重(如果重排的DNA意外激活了致癌基因)。
不過,在金女士體內(nèi),染色體碎裂的影響卻非同尋常。突變的細(xì)胞不僅長勢良好,而且丟棄了致病的CXCR4基因,于是,WHIM綜合征就自動(dòng)消失了。
但金女士的好運(yùn)還不止于此。國立衛(wèi)生研究院的科學(xué)家發(fā)現(xiàn),這個(gè)幸運(yùn)的細(xì)胞還是一個(gè)造血干細(xì)胞,它可以通過無數(shù)次復(fù)制和再生,分化出各種血細(xì)胞。這種細(xì)胞不斷復(fù)制、增殖,最終把金女士免疫系統(tǒng)里的白細(xì)胞都替換成了不含CXCR4突變拷貝的健康細(xì)胞。這一連串的事件聽起來如此不可思議,但金女士的確因此康復(fù)了。
在研究人員為金女士的狀況寫的總結(jié)報(bào)告里,他們說到:金女士是“自然界里一種前所未見的實(shí)驗(yàn)”的受益者——她體內(nèi)的一個(gè)干細(xì)胞經(jīng)歷了一次自發(fā)突變,拋棄了致病基因。簡言之,這是一次天賜的意外——稍有不當(dāng),金女士可能因此斃命;相反,金女士卻因此得救。
為了理解這種結(jié)果是多么偶然,不妨把人類的基因組想象成一個(gè)巨型軟件。在金女士身上,這個(gè)軟件里含有一個(gè)錯(cuò)誤代碼——要知道這個(gè)軟件里有60多億行代碼。要檢修軟件,你不會(huì)一上來就盲目地刪除大段的代碼,并把其他部分打亂。這不僅很難解決原來的問題,甚至很可能會(huì)引入新的、更大的問題。除非你極為幸運(yùn)——這個(gè)概率只有數(shù)百萬分之一,甚至數(shù)十億分之一,你才可能恰好刪除掉錯(cuò)誤的代碼,而不損壞軟件的關(guān)鍵功能。事實(shí)上,金女士的基因組里發(fā)生的事情正是如此——區(qū)別在于,這個(gè)魯莽的程序員是大自然。
雖然金女士的例子聽起來像是天方夜譚,但令人興奮的是,這不是孤例。雖然她是目前唯一被報(bào)道的因?yàn)樽园l(fā)染色體粉碎和重排而自愈的患者,但是科學(xué)文獻(xiàn)中也不乏其他天然基因編輯的例子,患者們的遺傳病通過偶然的、自發(fā)的基因組“編輯”而出現(xiàn)好轉(zhuǎn),甚至完全被治愈。比如,在20世紀(jì)90年代,兩位紐約的患者被診斷患有“重癥復(fù)合免疫缺陷”(severe combined immunodeficiency, SCID),他們也被稱為“泡泡男孩”,因?yàn)樗麄儽仨毶钤跓o菌的塑料保護(hù)膜中,以避免接觸致病菌。如果得不到徹底隔離或者積極治療,重癥復(fù)合免疫缺陷患者往往在2歲之前死去。但是,紐約的這兩位重癥復(fù)合免疫缺陷患者卻是幸運(yùn)兒:他們健康地挺過了青少年階段,長到了成年。科學(xué)家找到了原因,他們的細(xì)胞都自動(dòng)糾正了致病的突變基因ADA,而且修復(fù)過程中沒有擾亂染色體上的其他基因。
類似的天然基因編輯也治愈過其他遺傳病,比如維奧二氏綜合征(Wiskott-Aldrich syndrome),患者中10%~20%的人會(huì)因?yàn)樽园l(fā)的基因更正而活下來;再比如一種肝部疾病——酪氨酸血癥。在某些皮膚病中,肉眼都可以分辨出那些發(fā)生過基因編輯的細(xì)胞,比如五彩魚鱗病。這個(gè)名字栩栩如生地描述了癥狀:患者的皮膚上出現(xiàn)紅色的魚鱗狀斑點(diǎn)。患病處內(nèi)部的細(xì)胞攜帶著遺傳突變,而周圍健康的細(xì)胞修復(fù)了這些突變。
不過,總體而言,遺傳病自愈的概率微乎其微。大多數(shù)患者永遠(yuǎn)不會(huì)經(jīng)歷這種染色體在正確的組織、正確的細(xì)胞里,以正確的方式進(jìn)行重排的奇跡。天然的基因編輯往往沒有規(guī)律——極少數(shù)幸運(yùn)兒成了有趣的醫(yī)學(xué)案例,但也僅此而已。
但是,如果基因編輯不是自發(fā)事件呢?如果醫(yī)生可以修復(fù)導(dǎo)致WHIM綜合征、重癥復(fù)合免疫缺陷、酪氨酸血癥及其他遺傳病的基因,那又會(huì)怎樣?
在包括我在內(nèi)的許多科學(xué)家看來,類似金女士這樣的案例之所以令人振奮,不僅僅因?yàn)樗沂玖颂烊换蚓庉嫷男迯?fù)潛力,而且因?yàn)樗鼮槲磥淼尼t(yī)學(xué)干預(yù)指明了一條可能的道路:我們可以主動(dòng)、合理地更正基因組中的突變基因,從而治療遺傳病。這些幸運(yùn)兒的故事證明了基因編輯是可行的,前提是科學(xué)家知道它們背后的遺傳學(xué)機(jī)制,并擁有必要的生物技術(shù)工具。
幾十年來,早在我進(jìn)入這個(gè)領(lǐng)域之前,生命科學(xué)領(lǐng)域的研究人員就在兢兢業(yè)業(yè)地探索這些遺傳學(xué)機(jī)制,并開發(fā)這些工具。事實(shí)上,早在科學(xué)家知道大自然提供了這些手段之前,他們就夢想著有朝一日可以通過基因編輯進(jìn)行臨床治療了。不過,為了實(shí)現(xiàn)這種技術(shù),研究人員需要理解基因組:它由什么構(gòu)成,以何種方式構(gòu)成,以及更重要的是,它可能被修飾或者改造成什么樣子。有了這些知識,科學(xué)家才能夠嘗試幫助更多無力自愈的遺傳病患者。

圖1:DNA——生命的語言
基因組(genome),指的是一個(gè)細(xì)胞內(nèi)的全套遺傳指令——這個(gè)術(shù)語是由德國植物學(xué)家漢斯·溫克勒(Hans Winkler)在1920年提出來的,他很可能是用基因(gene)和染色體(chromosome)兩個(gè)詞組合而成的。在生物體內(nèi),除了個(gè)別突變,絕大多數(shù)細(xì)胞的基因組都是一致的,基因組告訴生物體如何生長、如何維護(hù)自身、如何把基因傳給后代。魚的基因組指導(dǎo)它長出鰓和鰭,并讓它在水下呼吸、運(yùn)動(dòng);樹的基因組則指導(dǎo)它長出葉片和葉綠體,從陽光中捕獲能量。我們內(nèi)在或外在的身體特征——視力、身高、膚色、對疾病的易感性等——都是由基因組編碼的信息決定的。
組成基因組的分子叫作脫氧核糖核酸,即DNA,它由四種核苷酸組成。這四種核苷酸往往也被簡寫為A、G、C、T,這代表了它們的堿基,分別是腺嘌呤、鳥嘌呤、胞嘧啶、胸腺嘧啶。這些分子連接成串,兩串這樣的分子通過堿基配對形成雙螺旋結(jié)構(gòu)。
雙螺旋有點(diǎn)像一個(gè)螺旋上升的長梯子。兩條DNA的單鏈圍繞著中心軸彼此纏繞,磷酸與核糖組成了螺旋的骨架,它們一起形成了梯子的兩條側(cè)軌。四種堿基位于螺旋內(nèi)部,彼此相向,在內(nèi)部配對,它們組成了梯子的橫梁。這個(gè)結(jié)構(gòu)的一個(gè)優(yōu)美之處在于,把兩條單鏈維系在一起組成橫梁的是化學(xué)作用力,它有點(diǎn)像是分子膠水:堿基A永遠(yuǎn)與另一條鏈上的堿基T配對,而G永遠(yuǎn)與C配對。這種組合叫作堿基互補(bǔ)配對。

圖2:DNA的雙螺旋結(jié)構(gòu)
雙螺旋結(jié)構(gòu)美妙地揭示了遺傳學(xué)的分子基礎(chǔ),它解釋了為什么看似簡單的DNA分子可以攜帶遺傳信息,通過細(xì)胞分裂從親本傳遞到子代,以及遺傳信息如何進(jìn)一步傳播到生物體的每一個(gè)細(xì)胞里。由于DNA分子由雙鏈組成,而且雙鏈的堿基遵守配對原則(A與T, G與C),每一條鏈都可以作為模板指導(dǎo)合成出互補(bǔ)鏈。在細(xì)胞復(fù)制之前,DNA雙鏈在一種解旋酶的作用下從中間打開,然后,其他的酶會(huì)以兩條單鏈為模板合成出兩條新的雙鏈,跟原來的雙鏈一模一樣。
在我認(rèn)識DNA雙螺旋的過程中,我也逐漸意識到,雖然最強(qiáng)大的光學(xué)顯微鏡也無法觀察到它們,但科學(xué)家仍有辦法洞察其分子結(jié)構(gòu)。大約在12歲時(shí),有一天我放學(xué)回家,發(fā)現(xiàn)床上躺著一本舊書,是吉姆·沃森的《雙螺旋》(我父親偶爾會(huì)從舊書店里淘一些書回來,看看是否會(huì)激發(fā)我的興趣)。我以為這是本偵探小說(它的確是的!),所以過了幾周,等到一個(gè)下雨的周六我才開始閱讀。書里,沃森講述了他與弗朗西斯·克里克這段無比精彩的學(xué)術(shù)合作:利用羅莎琳德·富蘭克林收集到的關(guān)鍵數(shù)據(jù),他們終于發(fā)現(xiàn)了這個(gè)簡單優(yōu)美的分子結(jié)構(gòu)。我第一次感到命運(yùn)會(huì)把我送到相似的路上,多年之后,在我終于開始自己的學(xué)術(shù)生涯的時(shí)候,我的第一個(gè)課題就是解析RNA(核糖核酸)分子的三維結(jié)構(gòu)——比起DNA、RNA的三維結(jié)構(gòu)要更加復(fù)雜。
在沃森和克里克發(fā)現(xiàn)雙螺旋結(jié)構(gòu)之后的幾年,科學(xué)家逐漸闡明了這種分子結(jié)構(gòu)和它相對簡單的化學(xué)組成如何編碼了信息,并以此來解釋生物世界里豐富多彩的現(xiàn)象。人們發(fā)現(xiàn),DNA更像是一種秘密語言,每一段特定的堿基序列都為細(xì)胞里的一個(gè)特殊的蛋白質(zhì)提供了指令,然后蛋白質(zhì)去執(zhí)行體內(nèi)的各種重要的功能,比如分解食物、識別并破壞病原體、感光等。

圖3:分子生物學(xué)的中心法則
要把DNA的指令轉(zhuǎn)化成蛋白質(zhì)的組成信息,細(xì)胞需要一個(gè)關(guān)鍵的中間體分子,叫作核糖核酸,即信使RNA,它是由DNA模板通過一個(gè)叫作轉(zhuǎn)錄的過程而合成出來的。RNA里有三個(gè)字母跟DNA的相同(A、G、C),但是在RNA里,T(胸腺嘧啶)被U(尿嘧啶)替換了。此外,組成RNA骨架的是核糖,它比DNA中的脫氧核糖多了一個(gè)氧原子(因此DNA的全稱為脫氧核糖核酸,RNA的全稱為核糖核酸)。信使RNA把信息從細(xì)胞核(DNA儲藏在這里)運(yùn)輸?shù)郊?xì)胞質(zhì)(蛋白質(zhì)在此合成)。細(xì)胞通過一個(gè)叫作翻譯的過程,利用信使RNA長鏈——上面包含了基因的序列——來合成出蛋白質(zhì)分子。每三個(gè)RNA字母連起來閱讀的時(shí)候,就意味著一個(gè)氨基酸,蛋白質(zhì)就是這樣由一個(gè)個(gè)的氨基酸組成的。基因與蛋白質(zhì)的區(qū)別在于,前者是核苷酸的序列,而后者是氨基酸的序列。遺傳信息的整體流動(dòng)——從DNA到RNA到蛋白質(zhì)——被稱為分子生物學(xué)的中心法則。
基因組的大小和它包含的基因數(shù)目,在不同種類的生命體中差別巨大。比如,大多數(shù)病毒只有數(shù)千個(gè)DNA(或者RNA)堿基序列,即只有幾個(gè)基因。相比之下,細(xì)菌的基因組里包含上百萬個(gè)堿基,大約4000個(gè)基因。果蠅的基因組里有大約幾億個(gè)堿基,包含了大約1.4萬個(gè)基因。人類的基因組里包含了約32億對堿基,有約2.1萬對蛋白質(zhì)編碼的基因。有趣的是,基因組的大小與生物體的復(fù)雜程度并不成正比,人類的基因組與小鼠或者青蛙的大致接近,但只有蠑螈的十分之一,尚不及某些植物的百分之一。
不同物種包裹基因組的方式也截然不同。大多數(shù)細(xì)菌的基因組都是一段單一連續(xù)的DNA片段;而人類的基因組卻由23個(gè)不同的片段組成,這些片斷叫作染色體,長度從5000萬到2.5億個(gè)堿基對不等。類似于大多數(shù)哺乳動(dòng)物,人類細(xì)胞里的染色體通常包含兩個(gè)拷貝,一個(gè)來自父親,一個(gè)來自母親。雙親各自貢獻(xiàn)了23條染色體,所以后代含有46條染色體(當(dāng)然也有例外,比如患有唐氏綜合征的個(gè)體具有第三條21號染色體)。在人體內(nèi),絕大多數(shù)細(xì)胞都有一套完整的染色體(血紅細(xì)胞是個(gè)顯著的例外,因?yàn)樗鼈儧]有細(xì)胞核),但是在細(xì)胞核之外也有一些DNA。人體的基因組里也包括了一個(gè)獨(dú)立的微小染色體,只有1.6萬個(gè)堿基對,它位于線粒體內(nèi)。跟其他染色體上的遺傳信息不同,線粒體的DNA完全來自于母親。
在基因組內(nèi),任何地方(包括23對染色體和線粒體的微小染色體)的突變都可能會(huì)引起遺傳病。最簡單的突變是替換,即一個(gè)核苷酸換成了另外一個(gè)核苷酸,這可能會(huì)擾亂基因,導(dǎo)致蛋白質(zhì)缺陷。比如,在鐮狀細(xì)胞病中,乙型球蛋白基因里的第17個(gè)字母由A變成了T,這就導(dǎo)致了本來的谷氨酸變成了纈氨酸,而且這個(gè)氨基酸剛好位于血紅蛋白結(jié)構(gòu)的關(guān)鍵區(qū)域,對于運(yùn)輸氧氣的功能來說非常重要。于是,蛋白質(zhì)的這個(gè)微小突變(在8000多個(gè)原子里有10個(gè)發(fā)生了變化),就帶來了非常嚴(yán)重的后果。突變的血紅蛋白分子粘在一起,形成異常纖維,這就會(huì)改變紅細(xì)胞的形狀,引起貧血,增加了中風(fēng)、感染和嚴(yán)重骨痛的風(fēng)險(xiǎn)。
鐮狀細(xì)胞病是隱性遺傳病的一個(gè)例子。所謂隱性遺傳病,是指只有當(dāng)個(gè)體攜帶著兩份突變的HBB基因的時(shí)候,他/她才會(huì)表現(xiàn)出癥狀;如果一個(gè)拷貝出現(xiàn)突變,另一個(gè)正常拷貝仍可以合成出足夠多的正常的血紅蛋白,突變基因的影響就不會(huì)顯現(xiàn)出來。當(dāng)然,這些個(gè)體仍然攜帶著一份突變的HBB基因,他們一樣可能把突變基因傳給后代。
另外一些遺傳病表現(xiàn)為顯性遺傳,這意味著一個(gè)拷貝的突變基因就足以致病。一個(gè)例子是WHIM綜合征,患者體內(nèi)的CXCR4基因里第1000個(gè)堿基從C突變成了T,突變基因合成出超級活躍的蛋白質(zhì),正常基因的功能就被掩蓋了。
鐮狀細(xì)胞病和WHIM綜合征都是單個(gè)堿基替換突變引起的遺傳病,但是遺傳病也可能源于DNA插入或者缺失。比如,有一種叫作亨廷頓病的神經(jīng)退行性疾病,就是因?yàn)镠TT基因里同樣的3個(gè)堿基重復(fù)了太多次,引起了腦細(xì)胞合成出異常的蛋白質(zhì)。與此相反,囊性纖維化疾病是一種感染肺部的致命性遺傳病,它最常見的起因是DNA缺失。CFTR基因中缺失了3個(gè)堿基,導(dǎo)致蛋白質(zhì)中失去了一個(gè)重要的氨基酸,無法正常行使功能。還有一些遺傳病的起因是基因發(fā)生了反轉(zhuǎn),某一段基因甚至整個(gè)染色體出現(xiàn)復(fù)制錯(cuò)誤或者完全丟失。
幸虧最近有了DNA測序技術(shù),科學(xué)家才能閱讀并記錄人類的基因組,繼而查明許多疾病的病灶基因。自從20世紀(jì)70年代第一代測序方法出現(xiàn)以來,科學(xué)家前赴后繼地闡明了許多遺傳病的分子機(jī)制。伴隨著人類基因組計(jì)劃的完成,該領(lǐng)域也經(jīng)歷了跨越式的發(fā)展。自1990年以來,世界各地的科學(xué)家聯(lián)合起來,開始對人類的全基因組進(jìn)行測序。這項(xiàng)浩大的工程,加上新的技術(shù)進(jìn)步,使得科研人員可以在酵母里克隆大片段的人類DNA。與此同時(shí),實(shí)驗(yàn)室自動(dòng)化水平升級與計(jì)算機(jī)算法的進(jìn)步,使得人們可以解析測序數(shù)據(jù)。2001年,在投入了巨大的精力,花費(fèi)了超過30億美元之后,科學(xué)家終于完成了人類基因組的草圖。
自從人類基因組計(jì)劃完成以來,基因測序變得越來越容易,也越來越便宜。科學(xué)家已經(jīng)精確鑒定出了4000多個(gè)會(huì)導(dǎo)致遺傳病的突變位點(diǎn)。基因測序可以揭示我們是否更容易患上某些癌癥,也可以幫助醫(yī)生根據(jù)病人的家族遺傳史進(jìn)行針對性的治療。此外,現(xiàn)在商業(yè)DNA測序分析也日益普遍,數(shù)以百萬計(jì)的人進(jìn)行了全基因組測序,你需要做的只是郵寄一份你的唾液樣品,再花上幾百美元就成了。于是,數(shù)據(jù)井噴了。這些數(shù)據(jù)幫助研究人員在上千個(gè)基因多樣性與某些身體和行為特征之間找到了顯著的關(guān)聯(lián)。
不過,雖然全基因組測序代表了遺傳病研究領(lǐng)域的巨大進(jìn)步,但它只是一種診斷工具,并不是治療手段。它可以幫助我們找出遺傳病的根源何在,但我們依然沒辦法改寫DNA。畢竟,閱讀跟寫作是兩回事。要實(shí)現(xiàn)改寫DNA的目的,科學(xué)家需要一套全新的工具。
一直以來,研究人員就夢想著,我們只要闡明了遺傳病的基因機(jī)制,就能改寫它。事實(shí)上,早在遺傳病的根源被揭示之前,就有人開始探索治療遺傳病的新方法——不僅僅是讓患者服用藥物來暫時(shí)緩解突變基因的負(fù)面影響,而是修復(fù)基因本身,以徹底扭轉(zhuǎn)疾病的進(jìn)程。舉一個(gè)常見的例子:鐮狀細(xì)胞病的治療方法包括經(jīng)常性輸血、使用羥基脲、進(jìn)行骨髓移植,如果我們可以從DNA突變的源頭進(jìn)行治療,豈非治本之策?
研究人員早就知道,治療遺傳病的最好方法是修復(fù)缺陷基因,主動(dòng)完成大自然在金女士等人身上完成的事情。不過,對于這些科學(xué)家來說,通過改寫突變的遺傳密碼來治療遺傳病似乎是無法完成的任務(wù)。修復(fù)一個(gè)缺陷基因無異于大海撈針,而且在取出針的過程中不能打亂任何一根海藻。但是他們也推測,另一個(gè)辦法是在缺陷細(xì)胞里添加一個(gè)完整的替代基因。問題在于,如何才能把這個(gè)珍貴的基因片段投遞進(jìn)基因組?
病毒有時(shí)會(huì)把自身的遺傳信息拼接到細(xì)菌基因組里——受此啟發(fā),早期嘗試基因治療的研究人員使用病毒作為載體,把治療基因運(yùn)送到人體里。據(jù)報(bào)道,20世紀(jì)60年代,一位美國醫(yī)生斯坦菲爾德·羅杰斯(Stanfield Rogers)首次進(jìn)行了嘗試。他當(dāng)時(shí)在研究兔子里的致疣性病毒:肖普氏乳頭瘤病毒(Shope papillomavirus)。令他特別感興趣的是,該病毒會(huì)引起兔子過量分泌精氨酸酶,后者可以中和精氨酸。與正常兔子相比,患病的兔子身上精氨酸酶的含量更高,精氨酸水平更低。此外,羅杰斯發(fā)現(xiàn),那些接觸過該病毒的研究人員血液中的精氨酸水平也更低。顯然,這些人從兔子身上感染了該病毒,而這些感染使得研究人員的身體發(fā)生了持久變化。
羅杰斯推測,可能是肖普氏乳頭瘤病毒把某個(gè)可以提高精氨酸酶水平的基因從兔子傳染到了人。他一邊驚嘆于病毒運(yùn)送基因的能力如此之大,一邊也開始考慮是否可以改造病毒來運(yùn)送其他基因。多年之后,羅杰斯回憶道:“顯然,在尋找致病原的時(shí)候,我們發(fā)現(xiàn)了一種藥物!”
沒過很久,羅杰斯就找到了一種疾病來檢驗(yàn)他的理論。幾年之后,研究人員在兩位德國女孩身上發(fā)現(xiàn)了一種叫作高精氨酸血癥(hyperargininemia)的遺傳病,患者體內(nèi)的精氨酸含量也出現(xiàn)了異常——但是她們的水平不是過低,而是過高。病人體內(nèi)負(fù)責(zé)精氨酸轉(zhuǎn)化的基因——這也正是羅杰斯推測的病毒傳播的基因——可能缺失或者突變了。
高精氨酸血癥是一種很折磨人的疾病,患者會(huì)出現(xiàn)痙攣、癲癇,隨著病情越來越重,智力發(fā)育也嚴(yán)重遲緩。但是,在德國的這兩位小女孩身上,我們有機(jī)會(huì)進(jìn)行早期干預(yù),從而避免了狀況惡化。羅杰斯和德國的合作伙伴向兩位女孩的血液里注射了高劑量、純化過的肖普氏乳頭瘤病毒。
不幸的是,羅杰斯的基因治療實(shí)驗(yàn)失敗了,這讓所有人都大為失望,不僅僅是他自己,患者和患者的家庭更是如此。這次注射對兩個(gè)小女孩沒起到什么作用,而羅杰斯也因?yàn)槿绱唆斆А⒉怀墒斓呐e動(dòng)而被同行批評。隨后的研究人員證實(shí),與羅杰斯的理論相反,肖普氏乳頭瘤病毒的基因組里并沒有精氨酸酶基因,所以它根本無法達(dá)成期望的治療效果。
雖然羅杰斯再也沒有嘗試過基因治療,但他使用病毒作為載體運(yùn)送基因的策略,徹底改變了生物學(xué)研究。這個(gè)實(shí)驗(yàn)失敗了,但是它的基本假設(shè)是成立的。目前,病毒載體仍然是向活體生物的基因組里插入基因的最有效方式。
病毒之所以適合做載體,是因?yàn)樗哂邢率鰩讉€(gè)特征。首先,病毒演化出了極為有效的方式,可以滲透進(jìn)一切類型的細(xì)胞。無論是哪個(gè)種類的生物——細(xì)菌、植物、動(dòng)物等——都必須對抗寄生性病毒,因?yàn)楹笳叩奈ㄒ荒康木褪墙俪旨?xì)胞,把它們的DNA插入宿主,并借助宿主細(xì)胞完成自身的復(fù)制。在億萬年的演化過程中,病毒幾乎“摸清了”細(xì)胞防御系統(tǒng)的每一個(gè)弱點(diǎn),它們向宿主中安插基因的策略近乎完美。作為工具,病毒載體極為可靠,研究人員使用病毒載體向目的細(xì)胞中投遞基因的成功率接近100%。對于這個(gè)領(lǐng)域的工作者來說,病毒載體是終極特洛伊木馬。

圖4:使用病毒載體進(jìn)行基因治療
病毒不僅知道如何把自己的DNA導(dǎo)入宿主細(xì)胞,而且知道如何把它們?nèi)谌胨拗鞯幕蚪M。二十世紀(jì)二三十年代,科學(xué)家開始利用細(xì)菌進(jìn)行遺傳學(xué)研究。當(dāng)時(shí),令科學(xué)家感到困惑的是,細(xì)菌的病毒(噬菌體)看起來好像是憑空出現(xiàn),引起了感染。后續(xù)研究表明,這些病毒實(shí)際上把它們的基因組打碎成幾個(gè)片段,插入基因組,并潛伏在那里,無聲無息,直到條件合適才引起感染。逆轉(zhuǎn)錄病毒(許多病毒都屬于這種類別,包括艾滋病病毒)在人體里也會(huì)做同樣的事情,它們把自身的遺傳信息打碎,安插進(jìn)細(xì)胞的基因組里。由于這個(gè)特點(diǎn),逆轉(zhuǎn)錄病毒很難被根除,結(jié)果,它們在我們的基因組里留下了不可磨滅的印記。人類基因組里有8%——超過2.5億個(gè)DNA堿基——是古老的逆轉(zhuǎn)錄病毒感染人類祖先所留下的“遺跡”。
自從20世紀(jì)60年代人們首次嘗試基因治療以來,這個(gè)領(lǐng)域迅速騰飛,這也得益于一系列生物技術(shù)革命,包括重組DNA技術(shù)(重組DNA泛指一切實(shí)驗(yàn)室里制造的,而不是大自然里出現(xiàn)的遺傳物質(zhì))。通過新的生物技術(shù)和新的生物化學(xué)方法,科學(xué)家在20世紀(jì)70年代開始開辟新的途徑,剪切DNA片段,復(fù)制DNA片段,讓其進(jìn)入基因組,或者分離出特定的基因序列。他們開始把治療性基因引入病毒,同時(shí)移除有害的基因,使病毒不會(huì)破壞受感染的細(xì)胞。實(shí)際上,科學(xué)家已經(jīng)把這些病毒改造成了無害的“運(yùn)載火箭”,把特定的遺傳物質(zhì)運(yùn)輸?shù)街付ㄎ稽c(diǎn)。
到了20世紀(jì)80年代末,研究人員利用改造的逆轉(zhuǎn)錄病毒成功地在實(shí)驗(yàn)室小鼠里引入了重組DNA,于是,用于臨床的基因治療競賽開始了。當(dāng)時(shí),我正在哈佛大學(xué)進(jìn)行生物化學(xué)方面的博士研究,我還記得跟實(shí)驗(yàn)室的伙伴討論一則新聞:國立衛(wèi)生研究院的威廉·弗倫奇·安德森(William French Anderson)和同事第一個(gè)達(dá)成了目標(biāo)。他們開發(fā)出了一種載體,搭載了一份健康的腺苷脫氨酶基因(adenosine deaminase,ADA),在重癥復(fù)合免疫缺陷患者身上,正是該基因發(fā)生了突變而失去了功能。他們的目的,是使用基因治療把健康的ADA基因永久性地嵌入患者的血細(xì)胞,彌補(bǔ)缺失的蛋白質(zhì),從而治愈疾病。不幸的是,早期臨床試驗(yàn)結(jié)果不盡人意:改造后的病毒,安全性固然通過了考驗(yàn),但是治療效果微乎其微。具體來說,兩位患者接受治療后,免疫細(xì)胞的數(shù)量有所上升,但是這很可能是同時(shí)進(jìn)行的其他治療措施的結(jié)果。更重要的是,患者體內(nèi)似乎只有極少數(shù)細(xì)胞接受了健康的ADA基因,病毒進(jìn)行基因拼接的效率并不像科學(xué)家期望的那么高。
雖然30年前早期的試驗(yàn)沒有得出明確結(jié)果,但是基因治療領(lǐng)域還是取得了長足的進(jìn)步。病毒載體的設(shè)計(jì)與投遞方法都得到了改進(jìn),這使得ADA基因治療的結(jié)果更加振奮人心,以至于FDA(美國食品藥品監(jiān)督管理局)很快就批準(zhǔn)一套叫作Strimvelis的治療方案上市。此外,截止到2016年,已經(jīng)有2000多個(gè)基因治療的臨床試驗(yàn)已經(jīng)完成或者即將開始,它們針對的疾病癥狀也大幅拓展,包括單基因遺傳病,比如囊性纖維化、血友病、某些形式的失明,以及日漸增多的心血管與神經(jīng)疾病。與此同時(shí),癌癥免疫治療方興未艾,其中用到的免疫細(xì)胞可裝載專門針對腫瘤的基因,這再次說明,基因治療在生物醫(yī)藥領(lǐng)域仍然大有可為。
不過,盡管有些宣傳天花亂墜,但是基因治療并沒有成為靈丹妙藥。事實(shí)上,有時(shí)它弊大于利。1999年,在接受了高劑量的病毒載體注射之后,一位患者因劇烈的免疫反應(yīng)而死亡,這讓該領(lǐng)域一度陷入停滯。那時(shí),我剛開始在耶魯大學(xué)執(zhí)教,正在研究病毒的RNA分子如何劫持了宿主細(xì)胞的核糖體。雖然我的研究領(lǐng)域跟基因治療相去甚遠(yuǎn),但這種悲劇性的新聞也更堅(jiān)定了我更深入地理解病毒與細(xì)胞的決心。
21世紀(jì)初,5位重癥復(fù)合免疫缺陷患者接受基因治療之后都出現(xiàn)了白血病——這是一種骨髓癌癥,它的起因在于逆轉(zhuǎn)錄病毒激活了原癌基因,使得細(xì)胞不受控制地增殖。這次事件再次表明,向患者體內(nèi)注射大量外源物質(zhì)并向基因組隨機(jī)插入上千個(gè)堿基,風(fēng)險(xiǎn)多多。我當(dāng)時(shí)就在想,這類臨床研究的理論依據(jù)固然激動(dòng)人心,但實(shí)際操作似乎太過冒險(xiǎn)。
此外,還有許多類型的遺傳病,其病因并不是基因缺失——對于這些疾病,單純地引入新基因并不會(huì)奏效。以亨廷頓疾病為例,突變基因產(chǎn)生的異常蛋白完全遮蔽了健康基因。既然突變基因占據(jù)了主導(dǎo)地位,簡單的基因治療——通過病毒載體引入一份正常的基因拷貝——對亨廷頓或者其他類似的疾病就沒有效果。
對于這些難治型的遺傳病,醫(yī)生們需要做的是修復(fù)缺陷基因,而不僅僅是替換掉它們。如果他們可以修復(fù)導(dǎo)致疾病的缺陷基因,也就可以治療顯性與隱性基因疾病,而不必?fù)?dān)心基因拼接出錯(cuò)的后果。
我從開始職業(yè)生涯以來,就一直被這種可能性深深吸引。在20世紀(jì)90年代初,從哈佛博士畢業(yè)之后,我前往科羅拉多大學(xué)博爾德分校進(jìn)行博士后研究。那個(gè)時(shí)候,我跟實(shí)驗(yàn)室的伙伴布魯斯·薩倫格(Bruce Sullenger)經(jīng)常就各種議題進(jìn)行辯論——比如1992年的總統(tǒng)大選,我支持保羅·叢格思(Paul Tsongas),他支持比爾·克林頓,對基因治療的策略,我們也有不同的看法。當(dāng)時(shí)我們經(jīng)常聊到一個(gè)想法,也許RNA分子可以用來編輯并修復(fù)突變。事實(shí)上,這正是布魯斯自己的研究課題。不過,我們也討論過其他可能性,比如編輯這些缺陷RNA的源頭——即基因組里的DNA。我們都認(rèn)為,如果可能,這會(huì)是劃時(shí)代的突破。問題在于,這是不是異想天開呢?
20世紀(jì)80年代,一些研究人員在繼續(xù)優(yōu)化基于病毒的基因治療策略,與此同時(shí),另一些人開始嘗試使用實(shí)驗(yàn)室合成的重組DNA來轉(zhuǎn)化哺乳動(dòng)物細(xì)胞,這套辦法顯然更簡單。一開始,這些方法主要用于基礎(chǔ)研究,但隨著技術(shù)的進(jìn)步,科學(xué)家也開始探索它們臨床應(yīng)用的潛力。
比起更復(fù)雜的基因轉(zhuǎn)移技術(shù),這個(gè)方法有幾個(gè)關(guān)鍵的優(yōu)勢。首先,它們更快,因?yàn)椴槐匕鸦虬M(jìn)病毒,科學(xué)家可以直接把重組DNA引入細(xì)胞,或者讓細(xì)胞自動(dòng)吸收DNA與磷酸鈣的混合溶液。其次,它不必借助病毒把外源基因拼接到細(xì)胞的基因組,細(xì)胞本身就可以實(shí)現(xiàn)這一點(diǎn),雖然效率略低。
這類技術(shù)的首選實(shí)驗(yàn)對象往往是小鼠。科學(xué)家不無驚訝地發(fā)現(xiàn),這種新方法對小鼠非常有效。研究人員向小鼠的受精卵里注射了新的DNA,然后將其植入雌性小鼠體內(nèi),他們發(fā)現(xiàn),這足以把外源DNA永久地引入基因組,并導(dǎo)致后代發(fā)生顯著的變化。這些進(jìn)展意味著,我們可以在實(shí)驗(yàn)室里分離、克隆基因,并探究其功能。雖然我當(dāng)時(shí)還在研究RNA分子的結(jié)構(gòu)和功能,但我對這樣研究的巨大價(jià)值也有所耳聞。
問題在于,這些DNA到底是如何進(jìn)入基因組的?在20世紀(jì)80年代初,猶他大學(xué)的一位教授,馬里奧·卡佩奇(Mario Capecchi)就開始試圖解答這個(gè)問題。當(dāng)時(shí),他注意到一個(gè)很奇怪的現(xiàn)象:當(dāng)一個(gè)基因的許多拷貝進(jìn)入基因組的時(shí)候,它們嵌入的模式并不是隨機(jī)的。事實(shí)上,這些拷貝并沒有隨機(jī)分散到基因組的各個(gè)角落,卡佩奇發(fā)現(xiàn),這些基因總是聚集在一個(gè)或幾個(gè)位置,許多拷貝彼此重疊,好像是被特意安排在一起的。
在此之前,卡佩奇曾觀察到同源重組參與了這個(gè)過程——雖然人們對同源重組有一定的了解,但是沒人想到在這個(gè)實(shí)驗(yàn)里會(huì)再次發(fā)現(xiàn)它。關(guān)于同源重組的最著名的例子,可能是精卵細(xì)胞的形成過程:來自父母的兩套染色體,經(jīng)過減數(shù)分裂,數(shù)量減半,等到精卵結(jié)合的時(shí)候數(shù)目又恢復(fù)正常。在減數(shù)分裂的過程中,細(xì)胞會(huì)從雙親的染色體中選擇性地繼承一定比例的片段;每一對染色體會(huì)進(jìn)行同源交換,從而增加了遺傳多樣性。這個(gè)過程涉及數(shù)百萬個(gè)堿基對,還要進(jìn)行無比復(fù)雜的混合、配對、重組,但細(xì)胞卻執(zhí)行得有條不紊。事實(shí)上,這個(gè)過程在所有的生物種類中都會(huì)發(fā)生,比如,細(xì)菌會(huì)通過同源重組交換遺傳信息,多年來生物學(xué)家就是利用同源重組在酵母中進(jìn)行遺傳學(xué)實(shí)驗(yàn)的。
但是卡佩奇發(fā)現(xiàn),實(shí)驗(yàn)室里培養(yǎng)的哺乳動(dòng)物細(xì)胞也能進(jìn)行同源重組——這一點(diǎn)至關(guān)重要。他在1982年的論文末尾提到:“如果我們能夠通過同源重組來‘靶向鎖定’染色體上的特定基因,那會(huì)很有意思。”換言之,科學(xué)家可以通過同源重組把基因精確引入基因組內(nèi)的特定位置——比起利用病毒進(jìn)行隨機(jī)插入,這是一個(gè)巨大的進(jìn)步。更妙的是,科學(xué)家甚至可以在突變位點(diǎn)插入正常基因,修正缺陷。
在卡佩奇的研究發(fā)表3年之后,奧利弗·史密斯(Oliver Smithies)和同事做到了這一點(diǎn)。他們利用實(shí)驗(yàn)室合成的重組DNA,替換掉了人類膀胱癌細(xì)胞中原有的乙型球蛋白基因。沒有使用任何花哨的技巧——他們只是把DNA跟磷酸鈣混合,再灑到細(xì)胞上。顯然,其中一些細(xì)胞吸收了外源DNA,把重組DNA與基因組DNA上對應(yīng)的區(qū)域配對,通過一些分子水平的“雜技”實(shí)現(xiàn)了同源交換。
看起來,要修飾基因組,細(xì)胞自己就可以完成其中最困難的工作。這意味著,科學(xué)家可以通過更溫和的手段運(yùn)送基因,而不必使用病毒把DNA“硬塞”進(jìn)基因組。科學(xué)家可以“誘使”細(xì)胞“認(rèn)為”重組DNA只是一段與它自身基因組配對的額外的染色體,從而確保新DNA通過同源重組與本來的基因組融合在一起。
科學(xué)家把這種新的基因操作的方法叫作基因打靶,今天,我們叫它基因編輯。
這種技術(shù)在遺傳學(xué)研究中的潛力非常吸引人,但是史密斯知道,同源重組也可以用于治療。如果科學(xué)家對鐮狀細(xì)胞病患者的血液干細(xì)胞進(jìn)行類似的基因打靶,就可以把突變的乙型球蛋白基因替換成正常基因。這意味著,他發(fā)現(xiàn)的實(shí)驗(yàn)方法,某一天可能會(huì)用于臨床治療。

圖5:通過同源重組進(jìn)行基因編輯
其他實(shí)驗(yàn)室馬上跟進(jìn),迅速優(yōu)化該技術(shù),這其中也包括卡佩奇的實(shí)驗(yàn)室。1986年,當(dāng)我博士二年級的時(shí)候,他的實(shí)驗(yàn)表明,同源重組的精確度非常之高,甚至可以修復(fù)基因組里的單個(gè)堿基突變,更正細(xì)胞中變異的酶。兩年之后,他提出了一種適用范圍更廣的策略,可以靶向針對基因組中任何基因(只要我們知道它的序列)。他也提出,同源重組不僅可以用于修復(fù)基因,也可以進(jìn)行基因敲除,以便研究其功能。
20世紀(jì)80年代末,在我讀完博士的時(shí)候,基因打靶已經(jīng)廣泛用于編輯組織培養(yǎng)的細(xì)胞和活體小鼠的DNA。馬丁·埃文斯(Martin Evans)實(shí)驗(yàn)室的工作表明,在小鼠的胚胎干細(xì)胞中進(jìn)行基因打靶,然后把編輯過的干細(xì)胞注射回小鼠胚胎,科學(xué)家可以獲得“定制”小鼠。因?yàn)榭ㄅ迤妗⑹访芩挂约鞍N乃沟耐黄菩怨ぷ鳎麄儤s膺2007年諾貝爾生理學(xué)或醫(yī)學(xué)獎(jiǎng)。
雖然基因編輯的臨床應(yīng)用潛力巨大,但在早期,它最吸引人的地方是其對基礎(chǔ)研究的價(jià)值。對于研究哺乳動(dòng)物遺傳學(xué)的科學(xué)家來說,要研究基因的功能,基因打靶是劃時(shí)代的突破。但是,醫(yī)學(xué)研究人員對于在人類身上使用這項(xiàng)技術(shù)卻有些忐忑,這是因?yàn)椋淹粗亟M技術(shù)用于臨床治療,還有許多困難需要克服。
它最大的一個(gè)缺陷是所謂的非同源重組的問題,也叫“異常重組”(illegitimate recombination)。在這種情況下,新的DNA不是準(zhǔn)確地進(jìn)入配對序列,而是隨機(jī)嵌入基因組。事實(shí)上,異常重組與同源重組的比例大約是100:1。顯然,如果基因編輯的成功率只有1%,而錯(cuò)配率高達(dá)99%,臨床應(yīng)用是行不通的。科學(xué)家還在尋找更好的解決方案,來避免細(xì)胞培養(yǎng)中的問題,他們也沒有放棄未來應(yīng)用于醫(yī)學(xué)的希望。卡佩奇在20世紀(jì)90年代初曾說:“要在人類中進(jìn)行基因治療,同源重組是必經(jīng)之路。”但是,起碼就目前而言,基因編輯還不夠完善,無法用于人類。
20世紀(jì)80年代初,當(dāng)許多科學(xué)家在思考如何把基因打靶用于人類細(xì)胞的時(shí)候,杰克·紹斯塔克(Jack Szostak)卻在關(guān)注酵母細(xì)胞分裂的過程。他當(dāng)時(shí)是哈佛大學(xué)醫(yī)學(xué)院的教授,也是我博士研究課題的指導(dǎo)老師。紹斯塔克思考的是一個(gè)基礎(chǔ)問題:基因打靶和同源重組何以可能?具體來說,他試圖理解的是一條染色體上的DNA雙鏈如何與另一條染色體上的雙鏈結(jié)合,通過何種中間階段交換信息,然后重新分開,在細(xì)胞分裂之后再次形成單個(gè)染色體。
1983年,當(dāng)我還在美國西海岸的波莫納(Pomona)學(xué)院讀本科的時(shí)候,紹斯塔克認(rèn)為他找到了答案。依據(jù)酵母遺傳學(xué)實(shí)驗(yàn)的結(jié)果,他和博士生特里·奧爾韋弗(Terry OrrWeaver),以及兩位教授——羅德尼·羅森斯坦(Rodney Rothstein)、弗蘭克·斯塔爾(Frank Stahl)——發(fā)表了一個(gè)大膽的模型。其中的誘發(fā)因素——即促使同源重組開始的信號——是兩條染色體分離導(dǎo)致的DNA雙鏈斷裂。在這個(gè)模型中,斷裂的雙鏈與DNA的自由端尤其容易發(fā)生融合,它兩側(cè)的序列更容易與配對的染色體交換遺傳信息(在基因編輯的例子里,它們與研究人員提供的外源DNA進(jìn)行配對,發(fā)生交換)。
等我1986年加入紹斯塔克實(shí)驗(yàn)室的時(shí)候,他的研究焦點(diǎn)已經(jīng)轉(zhuǎn)向RNA分子在生命早期演化中的作用了。但是在實(shí)驗(yàn)室里,我們一群人仍然在討論雙鏈斷裂模型和它的優(yōu)美之處,以及科學(xué)同人對它的懷疑。然而,隨著時(shí)間推移,人們逐漸發(fā)現(xiàn),這個(gè)模型跟許多實(shí)驗(yàn)數(shù)據(jù)吻合。雙鏈斷裂修復(fù)不僅參與了精卵細(xì)胞形成時(shí)的同源重組,也參與了DNA受損之后的修復(fù)過程。事實(shí)上,所有細(xì)胞的DNA都可能遭到破壞,比如接觸到X射線或者致癌物的時(shí)候,但細(xì)胞能夠高效地修復(fù)這些斷裂,而不丟失遺傳信息。根據(jù)紹斯塔克提出的模型,修復(fù)的過程取決于染色體通過同源重組進(jìn)行匹配的能力,這可能是兩條染色體所具備的演化優(yōu)勢:單一染色體受到的任何破壞,都可以通過第二條染色體來進(jìn)行修復(fù)。
如果雙鏈斷裂模型是正確的,而且酵母研究得出的結(jié)論同樣適用于哺乳動(dòng)物,那么我們就有機(jī)會(huì)提高基因編輯的效率:我們可以在基因編輯的目標(biāo)位點(diǎn)把基因組打斷。如果你想使用一個(gè)正常基因替換一個(gè)缺陷基因,你首先要做的是設(shè)法在缺陷基因處“切斷”染色體,引入局部的雙鏈斷裂,與此同時(shí)提供一個(gè)正常的基因拷貝。細(xì)胞一旦發(fā)現(xiàn)雙鏈斷裂,就會(huì)試圖尋找一個(gè)配對的染色體修復(fù)斷裂——這時(shí),它有可能就會(huì)找到我們提供的基因。本質(zhì)上,我們“欺騙”了細(xì)胞,讓它“認(rèn)為”DNA受到了破壞,同時(shí),我們提供了第二份DNA,將它“偽裝”成第二份染色體,細(xì)胞就利用它來修復(fù)斷點(diǎn)。
1994年,紐約斯隆-凱特琳癌癥中心的瑪利亞·賈辛(Maria Jasin)實(shí)驗(yàn)室在哺乳動(dòng)物細(xì)胞里最早嘗試了這個(gè)策略。當(dāng)時(shí),我已經(jīng)結(jié)束了在科羅拉多的博士后研究,剛來到離這兒不遠(yuǎn)的耶魯大學(xué),熱切地關(guān)注著這方面的進(jìn)展。這項(xiàng)突破性工作令我倍感振奮,首先,這個(gè)實(shí)驗(yàn)是基于我的博士導(dǎo)師的雙鏈斷裂模型;其次,賈辛和我都是女性科學(xué)家,對核酸分子都有濃厚的興趣。
賈辛的基因編輯實(shí)驗(yàn)別出心裁。她的策略是向小鼠細(xì)胞里引入一個(gè)可以把基因組切開的酶,從而制造出雙鏈斷裂;與此同時(shí),她也引入了一段合成的DNA,作為修復(fù)模板,與切斷的DNA序列匹配。然后,她檢查了小鼠細(xì)胞是否修復(fù)了DNA斷裂。通過對照實(shí)驗(yàn)(實(shí)驗(yàn)組添加切斷DNA的酶,對照組則不添加),她就可以檢驗(yàn)下述假說:人為引入的雙鏈斷裂提高了同源重組的效率。
這里的挑戰(zhàn)在于找到一個(gè)可用的酶,把基因組從一個(gè)特定的位點(diǎn)切開。為了解決這個(gè)問題,賈辛巧妙地從酵母里借用了一個(gè)分子機(jī)器:I型SceI核酸內(nèi)切酶。
核酸酶是一類可以切開核酸的酶,有些會(huì)切開RNA,有些會(huì)切開DNA。核酸內(nèi)切酶會(huì)從核酸的內(nèi)部切開雙鏈,而核酸外切酶則從核酸的末端切除堿基。有些內(nèi)切酶對細(xì)胞有毒,因?yàn)樗鼈冊贒NA的任何位置都可以切割,跟堿基序列無關(guān);另一些內(nèi)切酶則高度特異,只在特定的序列切開雙鏈;此外,還有一些內(nèi)切酶的特異性介于二者之間。
賈辛選擇的I型SceI內(nèi)切酶是當(dāng)時(shí)所知的特異性最高的內(nèi)切酶之一,它需要準(zhǔn)確識別18個(gè)連續(xù)的DNA堿基之后才進(jìn)行剪切。選擇一個(gè)高度特異的內(nèi)切酶至關(guān)重要——如果賈辛選擇的酶專一性沒那么高,在基因組里到處剪切,這不僅會(huì)令結(jié)果難以解釋,更可能傷害宿主細(xì)胞。不過,I型SceI的特異性如此之高,它的切割位點(diǎn)出現(xiàn)的頻率只有1/(418),即,在680億個(gè)堿基里才出現(xiàn)一次。說來好笑,小鼠的基因組里甚至沒有這樣的序列,所以在開始嘗試基因編輯的實(shí)驗(yàn)之前,賈辛首先在基因組里引入了這樣一個(gè)位點(diǎn),以便I型SceI內(nèi)切酶進(jìn)行切割。
賈辛的實(shí)驗(yàn)結(jié)果非常驚人。通過同源重組,她在10%的細(xì)胞中準(zhǔn)確修復(fù)了突變基因。回頭看來,這個(gè)比例好像沒什么了不起,但是這比之前的實(shí)驗(yàn)成功率提高了近百倍。這是當(dāng)時(shí)最富希望的證據(jù),表明了科學(xué)家可以通過同源重組重新編寫基因組,而不必?fù)?dān)心逆轉(zhuǎn)錄病毒載體引起的非同源重組或者隨機(jī)插入——我們只要在準(zhǔn)確的位置引入雙鏈斷裂,細(xì)胞會(huì)完成余下的工作。
但一個(gè)關(guān)鍵的問題是:要用上這項(xiàng)技術(shù),科學(xué)家必須得在特定的位點(diǎn)切開基因組。在賈辛的驗(yàn)證實(shí)驗(yàn)中,I型SceI內(nèi)切酶識別的序列是事先人為引入的,但是,與疾病相關(guān)的基因序列卻無從改變,我們不可能為了使用某些罕見的內(nèi)切酶而特地修改基因序列,而且,一旦基因組被切開,它會(huì)非常有效地修復(fù)自身——問題在于如何在正確的位置引入雙鏈斷裂。
從20世紀(jì)90年代中期開始,當(dāng)我投身于研究RNA的分子結(jié)構(gòu)以及生化特征的時(shí)候,研究人員爭先恐后地開始設(shè)計(jì)新的類似I型SceI內(nèi)切酶的系統(tǒng),以精確地作用于特定DNA序列。只要能夠解決這個(gè)問題,我們就可以充分釋放基因編輯的潛力。
新一代的基因編輯系統(tǒng)包含了三項(xiàng)關(guān)鍵要素:一是它必須能夠特異性地識別一段對我們而言有價(jià)值的DNA序列;二是它必須能夠切開DNA序列;三是它必須易于重新編輯,以便針對不同的DNA序列進(jìn)行剪切。前兩項(xiàng)特征使它可以產(chǎn)生一個(gè)雙鏈斷裂,第三項(xiàng)特征則能擴(kuò)大其適用范圍。I型SceI內(nèi)切酶在前兩項(xiàng)特征上特別優(yōu)秀,但是第三項(xiàng)特征卻非常糟糕。要構(gòu)建一個(gè)可以編輯的DNA剪切系統(tǒng),生物工程人員有兩個(gè)選擇:要么重新改造I型SceI內(nèi)切酶,使其可以切開新的DNA序列,要么尋找天然存在的新型核酸酶。
可惜,科學(xué)家改造I型SceI內(nèi)切酶的努力失敗了(考慮到蛋白質(zhì)分子的復(fù)雜性,這并不意外)。很快人們就意識到,尋找新的核酸酶是更有潛力的方向。事實(shí)上,在賈辛使用I型SceI內(nèi)切酶的時(shí)候,科學(xué)家已經(jīng)從許多生物體中分離出了更多的核酸酶,而且鑒定出了它們針對的DNA序列。但是,這里有一個(gè)根本的問題:大多數(shù)核酸酶識別的堿基序列只有6個(gè)或8個(gè)——這太短了,完全不適于基因編輯。這些序列在人類基因組里出現(xiàn)了上萬次甚至數(shù)十萬次,這意味著,這個(gè)酶會(huì)把整個(gè)基因組切成許多段,細(xì)胞恐怕還來不及修復(fù)DNA就死去了。
研究人員無法依賴之前發(fā)現(xiàn)的核酸酶,但是每次進(jìn)行基因編輯之前都尋找類似I型SceI的內(nèi)切酶也不現(xiàn)實(shí)。如果要在臨床上針對致病基因進(jìn)行基因編輯,醫(yī)生不可能等待科學(xué)家再發(fā)現(xiàn)一個(gè)剛好可以針對患者身上突變基因的酶。科學(xué)家需要立即找到一個(gè)可以針對該基因的內(nèi)切酶,或者有辦法根據(jù)需求很快合成出來。
事實(shí)上,早在1996年,有人已經(jīng)開始嘗試用新的策略來解決這個(gè)問題。約翰·霍普金斯大學(xué)的教授斯里尼瓦桑·赫曼德拉斯格恩(Srinivasan Chandrasegaran)意識到,除了從頭開始構(gòu)建核酸酶或者在自然界尋找新型內(nèi)切酶,還有第三種折中的辦法:重新改造天然存在的內(nèi)切酶,使得它們滿足進(jìn)行基因編輯的前兩項(xiàng)要求:識別特定的位點(diǎn),并進(jìn)行剪切。
具體來說,赫曼德拉斯格恩采取的策略是從兩類天然存在的蛋白質(zhì)中拼接出一個(gè)雜合體內(nèi)切酶,這兩類蛋白質(zhì)一個(gè)擅長DNA識別,一個(gè)擅長DNA剪切。要實(shí)現(xiàn)DNA剪切,赫曼德拉斯格恩選擇了一種叫作FokI的細(xì)菌核酸酶作為模塊,它可以切開DNA,但沒有序列偏好;要實(shí)現(xiàn)DNA識別,他借助了另一類廣泛存在的天然蛋白質(zhì),叫作鋅指核酸酶。所謂鋅指,指的是它依賴于鋅離子與DNA結(jié)合,像兩根手指那樣夾住DNA。由于這些鋅指核酸酶由多個(gè)重復(fù)單元組合而成,每個(gè)單元識別特定的三個(gè)DNA序列,看起來,科學(xué)家有可能通過重新設(shè)計(jì)蛋白質(zhì)使它識別其他DNA序列。
令人振奮的是,赫曼德拉斯格恩的雜合內(nèi)切酶似乎可行。他的團(tuán)隊(duì)融合了FokI的剪切模塊和鋅指核酸酶中的DNA識別模塊,并進(jìn)一步表明,這個(gè)重新設(shè)計(jì)的核酸酶可以精確識別并切割目標(biāo)DNA,雖然這兩類蛋白質(zhì)的來源完全不同。
很快,赫曼德拉斯格恩就與猶他大學(xué)的達(dá)娜·卡羅爾(Dana Carroll)教授合作,開始把這些新的鋅指核酸酶(zinc finger nucleases,簡稱ZFNs)用于實(shí)驗(yàn)。他們的工作表明,鋅指核酸酶可以在青蛙的受精卵(這是生物學(xué)家常用的模式生物之一)中工作,而且鋅指核酸酶引起的DNA切割激發(fā)了同源重組。緊接著,卡羅爾改造了一個(gè)新的鋅指核酸酶,針對的是果蠅體內(nèi)與色素有關(guān)的基因YELLOW,他們的實(shí)驗(yàn)再次在成體中進(jìn)行了精確的基因改造。對基因編輯而言,這是一個(gè)影響深遠(yuǎn)的進(jìn)展。鋅指核酸酶不僅可以用于動(dòng)物實(shí)驗(yàn),更重要的是,它們可以經(jīng)過重新設(shè)計(jì)來剪切新基因。
更多的研究人員加入了進(jìn)來,他們開始針對自己的研究方向設(shè)計(jì)鋅指核酸酶,在新的模式生物中剪切新的基因。2003年,馬修·波特斯(Matthew Porteus)和大衛(wèi)·巴爾的摩(David Baltimore)首次在人類細(xì)胞中利用定制的鋅指核酸酶進(jìn)行了基因編輯;緊接著,費(fèi)奧多爾·烏爾諾夫(Fyodor Urnov)和同事在人類細(xì)胞中更正了導(dǎo)致重癥復(fù)合免疫缺陷的基因突變。從此,利用基因編輯技術(shù)來治療遺傳病變得觸手可及。
與此同時(shí),通過鋅指核酸酶進(jìn)行的基因編輯也被用于其他場合,比如精準(zhǔn)改造農(nóng)作物或者模式動(dòng)物。到了21世紀(jì)初,這項(xiàng)技術(shù)已經(jīng)成功地應(yīng)用于擬南芥、煙草、玉米,證實(shí)了DNA雙鏈斷裂可以在多種細(xì)胞類型中(不僅僅是哺乳動(dòng)物)促進(jìn)高效的同源重組。與此同時(shí),一些論文也陸續(xù)報(bào)道了鋅指核酸酶可以在斑馬魚、昆蟲、小鼠中進(jìn)行基因編輯。這些工作引人入勝,富有應(yīng)用前景,在參加許多學(xué)術(shù)會(huì)議期間,我也為之吸引。
不過,雖然潛力巨大,但是鋅指核酸酶的使用局限于少數(shù)幾個(gè)實(shí)驗(yàn)室。使用鋅指核酸酶,需要研究人員有豐富的蛋白編輯經(jīng)驗(yàn),或者有機(jī)會(huì)跟有這些經(jīng)驗(yàn)的實(shí)驗(yàn)室合作,或者有足夠的經(jīng)費(fèi)可以支付定制核酸酶的高昂費(fèi)用。從理論上來說,設(shè)計(jì)鋅指核酸酶不難——只要把不同鋅指核酸酶的片段以特定的方式組合起來,識別感興趣的DNA序列即可。但是在實(shí)際操作中,它非常困難。很大比例的鋅指核酸酶無法識別目標(biāo)DNA;另外有一些專一性太低,到處切割,導(dǎo)致細(xì)胞死亡;還有一些鋅指核酸酶模塊可以識別DNA,但是無法完成剪切。
除了改造蛋白質(zhì)的重重困難,鋅指核酸酶的靈活性也有限,難于推廣使用。毋庸置疑,鋅指核酸酶的結(jié)果表明,如果要進(jìn)行基因編輯,定制核酸酶是必由之路,但是這個(gè)領(lǐng)域仍然期待著一種更可靠、更便捷的技術(shù)。
2009年,第一代基因編輯技術(shù)出現(xiàn)了,它依靠的是從黃單胞桿菌里發(fā)現(xiàn)的一種新型蛋白質(zhì),叫作類轉(zhuǎn)錄活化因子(TALEs)。這些蛋白質(zhì)與鋅指核酸酶的構(gòu)造非常類似:它們都是由多個(gè)重復(fù)片段組成,每個(gè)片段識別特定的DNA序列。區(qū)別在于:每個(gè)鋅指核酸酶的手指識別三個(gè)DNA堿基,而每個(gè)類轉(zhuǎn)錄活化因子的片段可以識別單個(gè)DNA堿基。這使得科學(xué)家很容易推斷出哪個(gè)片段識別哪個(gè)DNA堿基,于是他們可以重新編輯,來識別更長的DNA序列。在鋅指核酸酶中,這項(xiàng)工作聽起來簡單,實(shí)際上頗為困難,但在類轉(zhuǎn)錄活化因子中,它的確很簡單。
研究人員轉(zhuǎn)而探索這種新技術(shù)。類轉(zhuǎn)錄活化因子的編碼序列一經(jīng)破解,三個(gè)實(shí)驗(yàn)室就把類轉(zhuǎn)錄活化因子與鋅指核酸酶的剪切模塊融合,創(chuàng)造出了類轉(zhuǎn)錄活化因子核酸酶(簡稱TALENs)。類轉(zhuǎn)錄活化因子核酸酶在細(xì)胞內(nèi)引發(fā)基因編輯的效果非常驚人,科學(xué)家對它做了某些設(shè)計(jì)上的改進(jìn),更方便了它們的構(gòu)建和使用。
“但是,可憐的類轉(zhuǎn)錄活化因子核酸酶恐怕沒有機(jī)會(huì)一展身手了。”卡羅爾在一篇關(guān)于基因編輯起源的綜述文章中寫到。因?yàn)榫驮谌藗儼l(fā)現(xiàn)類轉(zhuǎn)錄活化因子核酸酶并用于基因編輯不久,最新的(也許是終極的)基因編輯技術(shù)出現(xiàn)了。這項(xiàng)技術(shù)叫作CRISPR——正是在這里,我的故事跟基因編輯的故事銜接了起來。基因編輯技術(shù)經(jīng)歷了漫長的發(fā)展歷史,但它馬上要進(jìn)入一個(gè)激動(dòng)人心的新時(shí)代。