- 破天機(第一推動叢書·生命系列)
- (美)珍妮佛·杜德娜等
- 4字
- 2023-02-13 18:52:04
上篇
工具
1.尋找解藥
最近,我聽到了一個不可思議的故事,它充分體現了基因編輯的力量和巨大潛力。
2013年,美國國立衛生研究院(NIH)的科學家們遇到了一個醫學難題。這些研究人員在研究一種叫作WHIM綜合征的罕見遺傳病,但這位患者的狀況令他們一頭霧水。她從小就被診斷患有該病,但當國立衛生研究院的科學家遇到她時,疾病竟然奇跡般地從她體內消失了。
在世界范圍內,WHIM綜合征患者不過幾十個人,但它是一種令人痛苦的,甚至可能致死的免疫缺陷疾病,患者的生活受到嚴重影響。它的起因是一個微小的突變——在人體32億對堿基序列里,有一個字母出錯了(區別只是幾十個原子的大?。?。這個微小的變異讓WHIM患者特別容易被人乳頭瘤病毒(human papillomavirus, HPV)感染,引起皮膚疣,后者失控地生長,最終演變成癌癥。
國立衛生研究院的科學家遇到的這位患者,正是20世紀60年代該疾病首次被報道時的那位女孩——這也從側面說明了該病的罕見程度。在學術文獻中,她通常被叫作WHIM-09,但是我會叫她金女士。金女士從一生下來就患有WHIM,后來也因該病引發的嚴重感染多次住院。
2013年,金女士58歲了。她帶著兩個20歲出頭的女兒,一道來見國立衛生研究院的研究人員。她的女兒也表現出了WHIM的典型癥狀,但研究人員驚訝地發現,金女士自己似乎安然無恙。事實上,她已經20多年沒什么癥狀了。令人震驚的是,沒有接受任何醫療干預,金女士自愈了。
金女士如何憑一己之力就從這種致命的疾病中逃過一劫?科學家通過精心設計的實驗發現了一些重要的線索:在金女士的臉頰和皮膚細胞里,引起WHIM的突變基因仍然存在,但是在她的血液里,這個突變卻不見了。研究人員對金女士血細胞的DNA進行了仔細分析,發現了一些更不可思議的事情:她的一條2號染色體上缺失了一段DNA,包括3500萬個堿基序列,而這一段里含有完整的突變基因,叫作CXCR4。2號染色體上余下的大約2億個堿基也被打亂了,就像龍卷風席卷過染色體,其中的堿基序列一片狼藉。
這些初步發現引發了一系列疑問。金女士體內其他細胞的DNA是正常的(CXCR4基因突變除外),但血細胞里的DNA怎么變得如此無序?此外,考慮到含有CXCR4基因的染色體已經被打亂,而且缺失了164個基因,血細胞為何仍然能夠存活,而且可以正常行使功能?人類的基因組里含有數千個基因,它們發揮著重要的功能,比如DNA復制和細胞分裂。金女士體內竟然會有這么多基因憑空消失了,而且似乎沒有什么糟糕的后果,這到底是怎么回事?
國立衛生研究院的研究人員進行了更多測試,終于為這種驚人的自愈現象拼接出一個完整的解釋鏈。他們的結論是,她體內的某個細胞必然經歷了一種極不尋常但通常引發災難性后果的事件——染色體碎裂(chromothripsis)。這是一種新近發現的現象:染色體突然粉碎,然后重新修復,引起基因劇烈重排。它對身體的影響可能微乎其微(如果破損的細胞馬上死去),也可能非常嚴重(如果重排的DNA意外激活了致癌基因)。
不過,在金女士體內,染色體碎裂的影響卻非同尋常。突變的細胞不僅長勢良好,而且丟棄了致病的CXCR4基因,于是,WHIM綜合征就自動消失了。
但金女士的好運還不止于此。國立衛生研究院的科學家發現,這個幸運的細胞還是一個造血干細胞,它可以通過無數次復制和再生,分化出各種血細胞。這種細胞不斷復制、增殖,最終把金女士免疫系統里的白細胞都替換成了不含CXCR4突變拷貝的健康細胞。這一連串的事件聽起來如此不可思議,但金女士的確因此康復了。
在研究人員為金女士的狀況寫的總結報告里,他們說到:金女士是“自然界里一種前所未見的實驗”的受益者——她體內的一個干細胞經歷了一次自發突變,拋棄了致病基因。簡言之,這是一次天賜的意外——稍有不當,金女士可能因此斃命;相反,金女士卻因此得救。
為了理解這種結果是多么偶然,不妨把人類的基因組想象成一個巨型軟件。在金女士身上,這個軟件里含有一個錯誤代碼——要知道這個軟件里有60多億行代碼。要檢修軟件,你不會一上來就盲目地刪除大段的代碼,并把其他部分打亂。這不僅很難解決原來的問題,甚至很可能會引入新的、更大的問題。除非你極為幸運——這個概率只有數百萬分之一,甚至數十億分之一,你才可能恰好刪除掉錯誤的代碼,而不損壞軟件的關鍵功能。事實上,金女士的基因組里發生的事情正是如此——區別在于,這個魯莽的程序員是大自然。
雖然金女士的例子聽起來像是天方夜譚,但令人興奮的是,這不是孤例。雖然她是目前唯一被報道的因為自發染色體粉碎和重排而自愈的患者,但是科學文獻中也不乏其他天然基因編輯的例子,患者們的遺傳病通過偶然的、自發的基因組“編輯”而出現好轉,甚至完全被治愈。比如,在20世紀90年代,兩位紐約的患者被診斷患有“重癥復合免疫缺陷”(severe combined immunodeficiency, SCID),他們也被稱為“泡泡男孩”,因為他們必須生活在無菌的塑料保護膜中,以避免接觸致病菌。如果得不到徹底隔離或者積極治療,重癥復合免疫缺陷患者往往在2歲之前死去。但是,紐約的這兩位重癥復合免疫缺陷患者卻是幸運兒:他們健康地挺過了青少年階段,長到了成年。科學家找到了原因,他們的細胞都自動糾正了致病的突變基因ADA,而且修復過程中沒有擾亂染色體上的其他基因。
類似的天然基因編輯也治愈過其他遺傳病,比如維奧二氏綜合征(Wiskott-Aldrich syndrome),患者中10%~20%的人會因為自發的基因更正而活下來;再比如一種肝部疾病——酪氨酸血癥。在某些皮膚病中,肉眼都可以分辨出那些發生過基因編輯的細胞,比如五彩魚鱗病。這個名字栩栩如生地描述了癥狀:患者的皮膚上出現紅色的魚鱗狀斑點。患病處內部的細胞攜帶著遺傳突變,而周圍健康的細胞修復了這些突變。
不過,總體而言,遺傳病自愈的概率微乎其微。大多數患者永遠不會經歷這種染色體在正確的組織、正確的細胞里,以正確的方式進行重排的奇跡。天然的基因編輯往往沒有規律——極少數幸運兒成了有趣的醫學案例,但也僅此而已。
但是,如果基因編輯不是自發事件呢?如果醫生可以修復導致WHIM綜合征、重癥復合免疫缺陷、酪氨酸血癥及其他遺傳病的基因,那又會怎樣?
在包括我在內的許多科學家看來,類似金女士這樣的案例之所以令人振奮,不僅僅因為它揭示了天然基因編輯的修復潛力,而且因為它為未來的醫學干預指明了一條可能的道路:我們可以主動、合理地更正基因組中的突變基因,從而治療遺傳病。這些幸運兒的故事證明了基因編輯是可行的,前提是科學家知道它們背后的遺傳學機制,并擁有必要的生物技術工具。
幾十年來,早在我進入這個領域之前,生命科學領域的研究人員就在兢兢業業地探索這些遺傳學機制,并開發這些工具。事實上,早在科學家知道大自然提供了這些手段之前,他們就夢想著有朝一日可以通過基因編輯進行臨床治療了。不過,為了實現這種技術,研究人員需要理解基因組:它由什么構成,以何種方式構成,以及更重要的是,它可能被修飾或者改造成什么樣子。有了這些知識,科學家才能夠嘗試幫助更多無力自愈的遺傳病患者。

圖1:DNA——生命的語言
基因組(genome),指的是一個細胞內的全套遺傳指令——這個術語是由德國植物學家漢斯·溫克勒(Hans Winkler)在1920年提出來的,他很可能是用基因(gene)和染色體(chromosome)兩個詞組合而成的。在生物體內,除了個別突變,絕大多數細胞的基因組都是一致的,基因組告訴生物體如何生長、如何維護自身、如何把基因傳給后代。魚的基因組指導它長出鰓和鰭,并讓它在水下呼吸、運動;樹的基因組則指導它長出葉片和葉綠體,從陽光中捕獲能量。我們內在或外在的身體特征——視力、身高、膚色、對疾病的易感性等——都是由基因組編碼的信息決定的。
組成基因組的分子叫作脫氧核糖核酸,即DNA,它由四種核苷酸組成。這四種核苷酸往往也被簡寫為A、G、C、T,這代表了它們的堿基,分別是腺嘌呤、鳥嘌呤、胞嘧啶、胸腺嘧啶。這些分子連接成串,兩串這樣的分子通過堿基配對形成雙螺旋結構。
雙螺旋有點像一個螺旋上升的長梯子。兩條DNA的單鏈圍繞著中心軸彼此纏繞,磷酸與核糖組成了螺旋的骨架,它們一起形成了梯子的兩條側軌。四種堿基位于螺旋內部,彼此相向,在內部配對,它們組成了梯子的橫梁。這個結構的一個優美之處在于,把兩條單鏈維系在一起組成橫梁的是化學作用力,它有點像是分子膠水:堿基A永遠與另一條鏈上的堿基T配對,而G永遠與C配對。這種組合叫作堿基互補配對。

圖2:DNA的雙螺旋結構
雙螺旋結構美妙地揭示了遺傳學的分子基礎,它解釋了為什么看似簡單的DNA分子可以攜帶遺傳信息,通過細胞分裂從親本傳遞到子代,以及遺傳信息如何進一步傳播到生物體的每一個細胞里。由于DNA分子由雙鏈組成,而且雙鏈的堿基遵守配對原則(A與T, G與C),每一條鏈都可以作為模板指導合成出互補鏈。在細胞復制之前,DNA雙鏈在一種解旋酶的作用下從中間打開,然后,其他的酶會以兩條單鏈為模板合成出兩條新的雙鏈,跟原來的雙鏈一模一樣。
在我認識DNA雙螺旋的過程中,我也逐漸意識到,雖然最強大的光學顯微鏡也無法觀察到它們,但科學家仍有辦法洞察其分子結構。大約在12歲時,有一天我放學回家,發現床上躺著一本舊書,是吉姆·沃森的《雙螺旋》(我父親偶爾會從舊書店里淘一些書回來,看看是否會激發我的興趣)。我以為這是本偵探小說(它的確是的?。?,所以過了幾周,等到一個下雨的周六我才開始閱讀。書里,沃森講述了他與弗朗西斯·克里克這段無比精彩的學術合作:利用羅莎琳德·富蘭克林收集到的關鍵數據,他們終于發現了這個簡單優美的分子結構。我第一次感到命運會把我送到相似的路上,多年之后,在我終于開始自己的學術生涯的時候,我的第一個課題就是解析RNA(核糖核酸)分子的三維結構——比起DNA、RNA的三維結構要更加復雜。
在沃森和克里克發現雙螺旋結構之后的幾年,科學家逐漸闡明了這種分子結構和它相對簡單的化學組成如何編碼了信息,并以此來解釋生物世界里豐富多彩的現象。人們發現,DNA更像是一種秘密語言,每一段特定的堿基序列都為細胞里的一個特殊的蛋白質提供了指令,然后蛋白質去執行體內的各種重要的功能,比如分解食物、識別并破壞病原體、感光等。

圖3:分子生物學的中心法則
要把DNA的指令轉化成蛋白質的組成信息,細胞需要一個關鍵的中間體分子,叫作核糖核酸,即信使RNA,它是由DNA模板通過一個叫作轉錄的過程而合成出來的。RNA里有三個字母跟DNA的相同(A、G、C),但是在RNA里,T(胸腺嘧啶)被U(尿嘧啶)替換了。此外,組成RNA骨架的是核糖,它比DNA中的脫氧核糖多了一個氧原子(因此DNA的全稱為脫氧核糖核酸,RNA的全稱為核糖核酸)。信使RNA把信息從細胞核(DNA儲藏在這里)運輸到細胞質(蛋白質在此合成)。細胞通過一個叫作翻譯的過程,利用信使RNA長鏈——上面包含了基因的序列——來合成出蛋白質分子。每三個RNA字母連起來閱讀的時候,就意味著一個氨基酸,蛋白質就是這樣由一個個的氨基酸組成的?;蚺c蛋白質的區別在于,前者是核苷酸的序列,而后者是氨基酸的序列。遺傳信息的整體流動——從DNA到RNA到蛋白質——被稱為分子生物學的中心法則。
基因組的大小和它包含的基因數目,在不同種類的生命體中差別巨大。比如,大多數病毒只有數千個DNA(或者RNA)堿基序列,即只有幾個基因。相比之下,細菌的基因組里包含上百萬個堿基,大約4000個基因。果蠅的基因組里有大約幾億個堿基,包含了大約1.4萬個基因。人類的基因組里包含了約32億對堿基,有約2.1萬對蛋白質編碼的基因。有趣的是,基因組的大小與生物體的復雜程度并不成正比,人類的基因組與小鼠或者青蛙的大致接近,但只有蠑螈的十分之一,尚不及某些植物的百分之一。
不同物種包裹基因組的方式也截然不同。大多數細菌的基因組都是一段單一連續的DNA片段;而人類的基因組卻由23個不同的片段組成,這些片斷叫作染色體,長度從5000萬到2.5億個堿基對不等。類似于大多數哺乳動物,人類細胞里的染色體通常包含兩個拷貝,一個來自父親,一個來自母親。雙親各自貢獻了23條染色體,所以后代含有46條染色體(當然也有例外,比如患有唐氏綜合征的個體具有第三條21號染色體)。在人體內,絕大多數細胞都有一套完整的染色體(血紅細胞是個顯著的例外,因為它們沒有細胞核),但是在細胞核之外也有一些DNA。人體的基因組里也包括了一個獨立的微小染色體,只有1.6萬個堿基對,它位于線粒體內。跟其他染色體上的遺傳信息不同,線粒體的DNA完全來自于母親。
在基因組內,任何地方(包括23對染色體和線粒體的微小染色體)的突變都可能會引起遺傳病。最簡單的突變是替換,即一個核苷酸換成了另外一個核苷酸,這可能會擾亂基因,導致蛋白質缺陷。比如,在鐮狀細胞病中,乙型球蛋白基因里的第17個字母由A變成了T,這就導致了本來的谷氨酸變成了纈氨酸,而且這個氨基酸剛好位于血紅蛋白結構的關鍵區域,對于運輸氧氣的功能來說非常重要。于是,蛋白質的這個微小突變(在8000多個原子里有10個發生了變化),就帶來了非常嚴重的后果。突變的血紅蛋白分子粘在一起,形成異常纖維,這就會改變紅細胞的形狀,引起貧血,增加了中風、感染和嚴重骨痛的風險。
鐮狀細胞病是隱性遺傳病的一個例子。所謂隱性遺傳病,是指只有當個體攜帶著兩份突變的HBB基因的時候,他/她才會表現出癥狀;如果一個拷貝出現突變,另一個正常拷貝仍可以合成出足夠多的正常的血紅蛋白,突變基因的影響就不會顯現出來。當然,這些個體仍然攜帶著一份突變的HBB基因,他們一樣可能把突變基因傳給后代。
另外一些遺傳病表現為顯性遺傳,這意味著一個拷貝的突變基因就足以致病。一個例子是WHIM綜合征,患者體內的CXCR4基因里第1000個堿基從C突變成了T,突變基因合成出超級活躍的蛋白質,正常基因的功能就被掩蓋了。
鐮狀細胞病和WHIM綜合征都是單個堿基替換突變引起的遺傳病,但是遺傳病也可能源于DNA插入或者缺失。比如,有一種叫作亨廷頓病的神經退行性疾病,就是因為HTT基因里同樣的3個堿基重復了太多次,引起了腦細胞合成出異常的蛋白質。與此相反,囊性纖維化疾病是一種感染肺部的致命性遺傳病,它最常見的起因是DNA缺失。CFTR基因中缺失了3個堿基,導致蛋白質中失去了一個重要的氨基酸,無法正常行使功能。還有一些遺傳病的起因是基因發生了反轉,某一段基因甚至整個染色體出現復制錯誤或者完全丟失。
幸虧最近有了DNA測序技術,科學家才能閱讀并記錄人類的基因組,繼而查明許多疾病的病灶基因。自從20世紀70年代第一代測序方法出現以來,科學家前赴后繼地闡明了許多遺傳病的分子機制。伴隨著人類基因組計劃的完成,該領域也經歷了跨越式的發展。自1990年以來,世界各地的科學家聯合起來,開始對人類的全基因組進行測序。這項浩大的工程,加上新的技術進步,使得科研人員可以在酵母里克隆大片段的人類DNA。與此同時,實驗室自動化水平升級與計算機算法的進步,使得人們可以解析測序數據。2001年,在投入了巨大的精力,花費了超過30億美元之后,科學家終于完成了人類基因組的草圖。
自從人類基因組計劃完成以來,基因測序變得越來越容易,也越來越便宜??茖W家已經精確鑒定出了4000多個會導致遺傳病的突變位點。基因測序可以揭示我們是否更容易患上某些癌癥,也可以幫助醫生根據病人的家族遺傳史進行針對性的治療。此外,現在商業DNA測序分析也日益普遍,數以百萬計的人進行了全基因組測序,你需要做的只是郵寄一份你的唾液樣品,再花上幾百美元就成了。于是,數據井噴了。這些數據幫助研究人員在上千個基因多樣性與某些身體和行為特征之間找到了顯著的關聯。
不過,雖然全基因組測序代表了遺傳病研究領域的巨大進步,但它只是一種診斷工具,并不是治療手段。它可以幫助我們找出遺傳病的根源何在,但我們依然沒辦法改寫DNA。畢竟,閱讀跟寫作是兩回事。要實現改寫DNA的目的,科學家需要一套全新的工具。
一直以來,研究人員就夢想著,我們只要闡明了遺傳病的基因機制,就能改寫它。事實上,早在遺傳病的根源被揭示之前,就有人開始探索治療遺傳病的新方法——不僅僅是讓患者服用藥物來暫時緩解突變基因的負面影響,而是修復基因本身,以徹底扭轉疾病的進程。舉一個常見的例子:鐮狀細胞病的治療方法包括經常性輸血、使用羥基脲、進行骨髓移植,如果我們可以從DNA突變的源頭進行治療,豈非治本之策?
研究人員早就知道,治療遺傳病的最好方法是修復缺陷基因,主動完成大自然在金女士等人身上完成的事情。不過,對于這些科學家來說,通過改寫突變的遺傳密碼來治療遺傳病似乎是無法完成的任務。修復一個缺陷基因無異于大海撈針,而且在取出針的過程中不能打亂任何一根海藻。但是他們也推測,另一個辦法是在缺陷細胞里添加一個完整的替代基因。問題在于,如何才能把這個珍貴的基因片段投遞進基因組?
病毒有時會把自身的遺傳信息拼接到細菌基因組里——受此啟發,早期嘗試基因治療的研究人員使用病毒作為載體,把治療基因運送到人體里。據報道,20世紀60年代,一位美國醫生斯坦菲爾德·羅杰斯(Stanfield Rogers)首次進行了嘗試。他當時在研究兔子里的致疣性病毒:肖普氏乳頭瘤病毒(Shope papillomavirus)。令他特別感興趣的是,該病毒會引起兔子過量分泌精氨酸酶,后者可以中和精氨酸。與正常兔子相比,患病的兔子身上精氨酸酶的含量更高,精氨酸水平更低。此外,羅杰斯發現,那些接觸過該病毒的研究人員血液中的精氨酸水平也更低。顯然,這些人從兔子身上感染了該病毒,而這些感染使得研究人員的身體發生了持久變化。
羅杰斯推測,可能是肖普氏乳頭瘤病毒把某個可以提高精氨酸酶水平的基因從兔子傳染到了人。他一邊驚嘆于病毒運送基因的能力如此之大,一邊也開始考慮是否可以改造病毒來運送其他基因。多年之后,羅杰斯回憶道:“顯然,在尋找致病原的時候,我們發現了一種藥物!”
沒過很久,羅杰斯就找到了一種疾病來檢驗他的理論。幾年之后,研究人員在兩位德國女孩身上發現了一種叫作高精氨酸血癥(hyperargininemia)的遺傳病,患者體內的精氨酸含量也出現了異常——但是她們的水平不是過低,而是過高。病人體內負責精氨酸轉化的基因——這也正是羅杰斯推測的病毒傳播的基因——可能缺失或者突變了。
高精氨酸血癥是一種很折磨人的疾病,患者會出現痙攣、癲癇,隨著病情越來越重,智力發育也嚴重遲緩。但是,在德國的這兩位小女孩身上,我們有機會進行早期干預,從而避免了狀況惡化。羅杰斯和德國的合作伙伴向兩位女孩的血液里注射了高劑量、純化過的肖普氏乳頭瘤病毒。
不幸的是,羅杰斯的基因治療實驗失敗了,這讓所有人都大為失望,不僅僅是他自己,患者和患者的家庭更是如此。這次注射對兩個小女孩沒起到什么作用,而羅杰斯也因為如此魯莽、不成熟的舉動而被同行批評。隨后的研究人員證實,與羅杰斯的理論相反,肖普氏乳頭瘤病毒的基因組里并沒有精氨酸酶基因,所以它根本無法達成期望的治療效果。
雖然羅杰斯再也沒有嘗試過基因治療,但他使用病毒作為載體運送基因的策略,徹底改變了生物學研究。這個實驗失敗了,但是它的基本假設是成立的。目前,病毒載體仍然是向活體生物的基因組里插入基因的最有效方式。
病毒之所以適合做載體,是因為它具有下述幾個特征。首先,病毒演化出了極為有效的方式,可以滲透進一切類型的細胞。無論是哪個種類的生物——細菌、植物、動物等——都必須對抗寄生性病毒,因為后者的唯一目的就是劫持細胞,把它們的DNA插入宿主,并借助宿主細胞完成自身的復制。在億萬年的演化過程中,病毒幾乎“摸清了”細胞防御系統的每一個弱點,它們向宿主中安插基因的策略近乎完美。作為工具,病毒載體極為可靠,研究人員使用病毒載體向目的細胞中投遞基因的成功率接近100%。對于這個領域的工作者來說,病毒載體是終極特洛伊木馬。

圖4:使用病毒載體進行基因治療
病毒不僅知道如何把自己的DNA導入宿主細胞,而且知道如何把它們融入宿主的基因組。二十世紀二三十年代,科學家開始利用細菌進行遺傳學研究。當時,令科學家感到困惑的是,細菌的病毒(噬菌體)看起來好像是憑空出現,引起了感染。后續研究表明,這些病毒實際上把它們的基因組打碎成幾個片段,插入基因組,并潛伏在那里,無聲無息,直到條件合適才引起感染。逆轉錄病毒(許多病毒都屬于這種類別,包括艾滋病病毒)在人體里也會做同樣的事情,它們把自身的遺傳信息打碎,安插進細胞的基因組里。由于這個特點,逆轉錄病毒很難被根除,結果,它們在我們的基因組里留下了不可磨滅的印記。人類基因組里有8%——超過2.5億個DNA堿基——是古老的逆轉錄病毒感染人類祖先所留下的“遺跡”。
自從20世紀60年代人們首次嘗試基因治療以來,這個領域迅速騰飛,這也得益于一系列生物技術革命,包括重組DNA技術(重組DNA泛指一切實驗室里制造的,而不是大自然里出現的遺傳物質)。通過新的生物技術和新的生物化學方法,科學家在20世紀70年代開始開辟新的途徑,剪切DNA片段,復制DNA片段,讓其進入基因組,或者分離出特定的基因序列。他們開始把治療性基因引入病毒,同時移除有害的基因,使病毒不會破壞受感染的細胞。實際上,科學家已經把這些病毒改造成了無害的“運載火箭”,把特定的遺傳物質運輸到指定位點。
到了20世紀80年代末,研究人員利用改造的逆轉錄病毒成功地在實驗室小鼠里引入了重組DNA,于是,用于臨床的基因治療競賽開始了。當時,我正在哈佛大學進行生物化學方面的博士研究,我還記得跟實驗室的伙伴討論一則新聞:國立衛生研究院的威廉·弗倫奇·安德森(William French Anderson)和同事第一個達成了目標。他們開發出了一種載體,搭載了一份健康的腺苷脫氨酶基因(adenosine deaminase,ADA),在重癥復合免疫缺陷患者身上,正是該基因發生了突變而失去了功能。他們的目的,是使用基因治療把健康的ADA基因永久性地嵌入患者的血細胞,彌補缺失的蛋白質,從而治愈疾病。不幸的是,早期臨床試驗結果不盡人意:改造后的病毒,安全性固然通過了考驗,但是治療效果微乎其微。具體來說,兩位患者接受治療后,免疫細胞的數量有所上升,但是這很可能是同時進行的其他治療措施的結果。更重要的是,患者體內似乎只有極少數細胞接受了健康的ADA基因,病毒進行基因拼接的效率并不像科學家期望的那么高。
雖然30年前早期的試驗沒有得出明確結果,但是基因治療領域還是取得了長足的進步。病毒載體的設計與投遞方法都得到了改進,這使得ADA基因治療的結果更加振奮人心,以至于FDA(美國食品藥品監督管理局)很快就批準一套叫作Strimvelis的治療方案上市。此外,截止到2016年,已經有2000多個基因治療的臨床試驗已經完成或者即將開始,它們針對的疾病癥狀也大幅拓展,包括單基因遺傳病,比如囊性纖維化、血友病、某些形式的失明,以及日漸增多的心血管與神經疾病。與此同時,癌癥免疫治療方興未艾,其中用到的免疫細胞可裝載專門針對腫瘤的基因,這再次說明,基因治療在生物醫藥領域仍然大有可為。
不過,盡管有些宣傳天花亂墜,但是基因治療并沒有成為靈丹妙藥。事實上,有時它弊大于利。1999年,在接受了高劑量的病毒載體注射之后,一位患者因劇烈的免疫反應而死亡,這讓該領域一度陷入停滯。那時,我剛開始在耶魯大學執教,正在研究病毒的RNA分子如何劫持了宿主細胞的核糖體。雖然我的研究領域跟基因治療相去甚遠,但這種悲劇性的新聞也更堅定了我更深入地理解病毒與細胞的決心。
21世紀初,5位重癥復合免疫缺陷患者接受基因治療之后都出現了白血病——這是一種骨髓癌癥,它的起因在于逆轉錄病毒激活了原癌基因,使得細胞不受控制地增殖。這次事件再次表明,向患者體內注射大量外源物質并向基因組隨機插入上千個堿基,風險多多。我當時就在想,這類臨床研究的理論依據固然激動人心,但實際操作似乎太過冒險。
此外,還有許多類型的遺傳病,其病因并不是基因缺失——對于這些疾病,單純地引入新基因并不會奏效。以亨廷頓疾病為例,突變基因產生的異常蛋白完全遮蔽了健康基因。既然突變基因占據了主導地位,簡單的基因治療——通過病毒載體引入一份正常的基因拷貝——對亨廷頓或者其他類似的疾病就沒有效果。
對于這些難治型的遺傳病,醫生們需要做的是修復缺陷基因,而不僅僅是替換掉它們。如果他們可以修復導致疾病的缺陷基因,也就可以治療顯性與隱性基因疾病,而不必擔心基因拼接出錯的后果。
我從開始職業生涯以來,就一直被這種可能性深深吸引。在20世紀90年代初,從哈佛博士畢業之后,我前往科羅拉多大學博爾德分校進行博士后研究。那個時候,我跟實驗室的伙伴布魯斯·薩倫格(Bruce Sullenger)經常就各種議題進行辯論——比如1992年的總統大選,我支持保羅·叢格思(Paul Tsongas),他支持比爾·克林頓,對基因治療的策略,我們也有不同的看法。當時我們經常聊到一個想法,也許RNA分子可以用來編輯并修復突變。事實上,這正是布魯斯自己的研究課題。不過,我們也討論過其他可能性,比如編輯這些缺陷RNA的源頭——即基因組里的DNA。我們都認為,如果可能,這會是劃時代的突破。問題在于,這是不是異想天開呢?
20世紀80年代,一些研究人員在繼續優化基于病毒的基因治療策略,與此同時,另一些人開始嘗試使用實驗室合成的重組DNA來轉化哺乳動物細胞,這套辦法顯然更簡單。一開始,這些方法主要用于基礎研究,但隨著技術的進步,科學家也開始探索它們臨床應用的潛力。
比起更復雜的基因轉移技術,這個方法有幾個關鍵的優勢。首先,它們更快,因為不必把基因包裹進病毒,科學家可以直接把重組DNA引入細胞,或者讓細胞自動吸收DNA與磷酸鈣的混合溶液。其次,它不必借助病毒把外源基因拼接到細胞的基因組,細胞本身就可以實現這一點,雖然效率略低。
這類技術的首選實驗對象往往是小鼠。科學家不無驚訝地發現,這種新方法對小鼠非常有效。研究人員向小鼠的受精卵里注射了新的DNA,然后將其植入雌性小鼠體內,他們發現,這足以把外源DNA永久地引入基因組,并導致后代發生顯著的變化。這些進展意味著,我們可以在實驗室里分離、克隆基因,并探究其功能。雖然我當時還在研究RNA分子的結構和功能,但我對這樣研究的巨大價值也有所耳聞。
問題在于,這些DNA到底是如何進入基因組的?在20世紀80年代初,猶他大學的一位教授,馬里奧·卡佩奇(Mario Capecchi)就開始試圖解答這個問題。當時,他注意到一個很奇怪的現象:當一個基因的許多拷貝進入基因組的時候,它們嵌入的模式并不是隨機的。事實上,這些拷貝并沒有隨機分散到基因組的各個角落,卡佩奇發現,這些基因總是聚集在一個或幾個位置,許多拷貝彼此重疊,好像是被特意安排在一起的。
在此之前,卡佩奇曾觀察到同源重組參與了這個過程——雖然人們對同源重組有一定的了解,但是沒人想到在這個實驗里會再次發現它。關于同源重組的最著名的例子,可能是精卵細胞的形成過程:來自父母的兩套染色體,經過減數分裂,數量減半,等到精卵結合的時候數目又恢復正常。在減數分裂的過程中,細胞會從雙親的染色體中選擇性地繼承一定比例的片段;每一對染色體會進行同源交換,從而增加了遺傳多樣性。這個過程涉及數百萬個堿基對,還要進行無比復雜的混合、配對、重組,但細胞卻執行得有條不紊。事實上,這個過程在所有的生物種類中都會發生,比如,細菌會通過同源重組交換遺傳信息,多年來生物學家就是利用同源重組在酵母中進行遺傳學實驗的。
但是卡佩奇發現,實驗室里培養的哺乳動物細胞也能進行同源重組——這一點至關重要。他在1982年的論文末尾提到:“如果我們能夠通過同源重組來‘靶向鎖定’染色體上的特定基因,那會很有意思?!睋Q言之,科學家可以通過同源重組把基因精確引入基因組內的特定位置——比起利用病毒進行隨機插入,這是一個巨大的進步。更妙的是,科學家甚至可以在突變位點插入正?;?,修正缺陷。
在卡佩奇的研究發表3年之后,奧利弗·史密斯(Oliver Smithies)和同事做到了這一點。他們利用實驗室合成的重組DNA,替換掉了人類膀胱癌細胞中原有的乙型球蛋白基因。沒有使用任何花哨的技巧——他們只是把DNA跟磷酸鈣混合,再灑到細胞上。顯然,其中一些細胞吸收了外源DNA,把重組DNA與基因組DNA上對應的區域配對,通過一些分子水平的“雜技”實現了同源交換。
看起來,要修飾基因組,細胞自己就可以完成其中最困難的工作。這意味著,科學家可以通過更溫和的手段運送基因,而不必使用病毒把DNA“硬塞”進基因組??茖W家可以“誘使”細胞“認為”重組DNA只是一段與它自身基因組配對的額外的染色體,從而確保新DNA通過同源重組與本來的基因組融合在一起。
科學家把這種新的基因操作的方法叫作基因打靶,今天,我們叫它基因編輯。
這種技術在遺傳學研究中的潛力非常吸引人,但是史密斯知道,同源重組也可以用于治療。如果科學家對鐮狀細胞病患者的血液干細胞進行類似的基因打靶,就可以把突變的乙型球蛋白基因替換成正?;?。這意味著,他發現的實驗方法,某一天可能會用于臨床治療。

圖5:通過同源重組進行基因編輯
其他實驗室馬上跟進,迅速優化該技術,這其中也包括卡佩奇的實驗室。1986年,當我博士二年級的時候,他的實驗表明,同源重組的精確度非常之高,甚至可以修復基因組里的單個堿基突變,更正細胞中變異的酶。兩年之后,他提出了一種適用范圍更廣的策略,可以靶向針對基因組中任何基因(只要我們知道它的序列)。他也提出,同源重組不僅可以用于修復基因,也可以進行基因敲除,以便研究其功能。
20世紀80年代末,在我讀完博士的時候,基因打靶已經廣泛用于編輯組織培養的細胞和活體小鼠的DNA。馬丁·埃文斯(Martin Evans)實驗室的工作表明,在小鼠的胚胎干細胞中進行基因打靶,然后把編輯過的干細胞注射回小鼠胚胎,科學家可以獲得“定制”小鼠。因為卡佩奇、史密斯以及埃文斯的突破性工作,他們榮膺2007年諾貝爾生理學或醫學獎。
雖然基因編輯的臨床應用潛力巨大,但在早期,它最吸引人的地方是其對基礎研究的價值。對于研究哺乳動物遺傳學的科學家來說,要研究基因的功能,基因打靶是劃時代的突破。但是,醫學研究人員對于在人類身上使用這項技術卻有些忐忑,這是因為,要把同源重組技術用于臨床治療,還有許多困難需要克服。
它最大的一個缺陷是所謂的非同源重組的問題,也叫“異常重組”(illegitimate recombination)。在這種情況下,新的DNA不是準確地進入配對序列,而是隨機嵌入基因組。事實上,異常重組與同源重組的比例大約是100:1。顯然,如果基因編輯的成功率只有1%,而錯配率高達99%,臨床應用是行不通的??茖W家還在尋找更好的解決方案,來避免細胞培養中的問題,他們也沒有放棄未來應用于醫學的希望??ㄅ迤嬖?0世紀90年代初曾說:“要在人類中進行基因治療,同源重組是必經之路。”但是,起碼就目前而言,基因編輯還不夠完善,無法用于人類。
20世紀80年代初,當許多科學家在思考如何把基因打靶用于人類細胞的時候,杰克·紹斯塔克(Jack Szostak)卻在關注酵母細胞分裂的過程。他當時是哈佛大學醫學院的教授,也是我博士研究課題的指導老師。紹斯塔克思考的是一個基礎問題:基因打靶和同源重組何以可能?具體來說,他試圖理解的是一條染色體上的DNA雙鏈如何與另一條染色體上的雙鏈結合,通過何種中間階段交換信息,然后重新分開,在細胞分裂之后再次形成單個染色體。
1983年,當我還在美國西海岸的波莫納(Pomona)學院讀本科的時候,紹斯塔克認為他找到了答案。依據酵母遺傳學實驗的結果,他和博士生特里·奧爾韋弗(Terry OrrWeaver),以及兩位教授——羅德尼·羅森斯坦(Rodney Rothstein)、弗蘭克·斯塔爾(Frank Stahl)——發表了一個大膽的模型。其中的誘發因素——即促使同源重組開始的信號——是兩條染色體分離導致的DNA雙鏈斷裂。在這個模型中,斷裂的雙鏈與DNA的自由端尤其容易發生融合,它兩側的序列更容易與配對的染色體交換遺傳信息(在基因編輯的例子里,它們與研究人員提供的外源DNA進行配對,發生交換)。
等我1986年加入紹斯塔克實驗室的時候,他的研究焦點已經轉向RNA分子在生命早期演化中的作用了。但是在實驗室里,我們一群人仍然在討論雙鏈斷裂模型和它的優美之處,以及科學同人對它的懷疑。然而,隨著時間推移,人們逐漸發現,這個模型跟許多實驗數據吻合。雙鏈斷裂修復不僅參與了精卵細胞形成時的同源重組,也參與了DNA受損之后的修復過程。事實上,所有細胞的DNA都可能遭到破壞,比如接觸到X射線或者致癌物的時候,但細胞能夠高效地修復這些斷裂,而不丟失遺傳信息。根據紹斯塔克提出的模型,修復的過程取決于染色體通過同源重組進行匹配的能力,這可能是兩條染色體所具備的演化優勢:單一染色體受到的任何破壞,都可以通過第二條染色體來進行修復。
如果雙鏈斷裂模型是正確的,而且酵母研究得出的結論同樣適用于哺乳動物,那么我們就有機會提高基因編輯的效率:我們可以在基因編輯的目標位點把基因組打斷。如果你想使用一個正常基因替換一個缺陷基因,你首先要做的是設法在缺陷基因處“切斷”染色體,引入局部的雙鏈斷裂,與此同時提供一個正常的基因拷貝。細胞一旦發現雙鏈斷裂,就會試圖尋找一個配對的染色體修復斷裂——這時,它有可能就會找到我們提供的基因。本質上,我們“欺騙”了細胞,讓它“認為”DNA受到了破壞,同時,我們提供了第二份DNA,將它“偽裝”成第二份染色體,細胞就利用它來修復斷點。
1994年,紐約斯隆-凱特琳癌癥中心的瑪利亞·賈辛(Maria Jasin)實驗室在哺乳動物細胞里最早嘗試了這個策略。當時,我已經結束了在科羅拉多的博士后研究,剛來到離這兒不遠的耶魯大學,熱切地關注著這方面的進展。這項突破性工作令我倍感振奮,首先,這個實驗是基于我的博士導師的雙鏈斷裂模型;其次,賈辛和我都是女性科學家,對核酸分子都有濃厚的興趣。
賈辛的基因編輯實驗別出心裁。她的策略是向小鼠細胞里引入一個可以把基因組切開的酶,從而制造出雙鏈斷裂;與此同時,她也引入了一段合成的DNA,作為修復模板,與切斷的DNA序列匹配。然后,她檢查了小鼠細胞是否修復了DNA斷裂。通過對照實驗(實驗組添加切斷DNA的酶,對照組則不添加),她就可以檢驗下述假說:人為引入的雙鏈斷裂提高了同源重組的效率。
這里的挑戰在于找到一個可用的酶,把基因組從一個特定的位點切開。為了解決這個問題,賈辛巧妙地從酵母里借用了一個分子機器:I型SceI核酸內切酶。
核酸酶是一類可以切開核酸的酶,有些會切開RNA,有些會切開DNA。核酸內切酶會從核酸的內部切開雙鏈,而核酸外切酶則從核酸的末端切除堿基。有些內切酶對細胞有毒,因為它們在DNA的任何位置都可以切割,跟堿基序列無關;另一些內切酶則高度特異,只在特定的序列切開雙鏈;此外,還有一些內切酶的特異性介于二者之間。
賈辛選擇的I型SceI內切酶是當時所知的特異性最高的內切酶之一,它需要準確識別18個連續的DNA堿基之后才進行剪切。選擇一個高度特異的內切酶至關重要——如果賈辛選擇的酶專一性沒那么高,在基因組里到處剪切,這不僅會令結果難以解釋,更可能傷害宿主細胞。不過,I型SceI的特異性如此之高,它的切割位點出現的頻率只有1/(418),即,在680億個堿基里才出現一次。說來好笑,小鼠的基因組里甚至沒有這樣的序列,所以在開始嘗試基因編輯的實驗之前,賈辛首先在基因組里引入了這樣一個位點,以便I型SceI內切酶進行切割。
賈辛的實驗結果非常驚人。通過同源重組,她在10%的細胞中準確修復了突變基因。回頭看來,這個比例好像沒什么了不起,但是這比之前的實驗成功率提高了近百倍。這是當時最富希望的證據,表明了科學家可以通過同源重組重新編寫基因組,而不必擔心逆轉錄病毒載體引起的非同源重組或者隨機插入——我們只要在準確的位置引入雙鏈斷裂,細胞會完成余下的工作。
但一個關鍵的問題是:要用上這項技術,科學家必須得在特定的位點切開基因組。在賈辛的驗證實驗中,I型SceI內切酶識別的序列是事先人為引入的,但是,與疾病相關的基因序列卻無從改變,我們不可能為了使用某些罕見的內切酶而特地修改基因序列,而且,一旦基因組被切開,它會非常有效地修復自身——問題在于如何在正確的位置引入雙鏈斷裂。
從20世紀90年代中期開始,當我投身于研究RNA的分子結構以及生化特征的時候,研究人員爭先恐后地開始設計新的類似I型SceI內切酶的系統,以精確地作用于特定DNA序列。只要能夠解決這個問題,我們就可以充分釋放基因編輯的潛力。
新一代的基因編輯系統包含了三項關鍵要素:一是它必須能夠特異性地識別一段對我們而言有價值的DNA序列;二是它必須能夠切開DNA序列;三是它必須易于重新編輯,以便針對不同的DNA序列進行剪切。前兩項特征使它可以產生一個雙鏈斷裂,第三項特征則能擴大其適用范圍。I型SceI內切酶在前兩項特征上特別優秀,但是第三項特征卻非常糟糕。要構建一個可以編輯的DNA剪切系統,生物工程人員有兩個選擇:要么重新改造I型SceI內切酶,使其可以切開新的DNA序列,要么尋找天然存在的新型核酸酶。
可惜,科學家改造I型SceI內切酶的努力失敗了(考慮到蛋白質分子的復雜性,這并不意外)。很快人們就意識到,尋找新的核酸酶是更有潛力的方向。事實上,在賈辛使用I型SceI內切酶的時候,科學家已經從許多生物體中分離出了更多的核酸酶,而且鑒定出了它們針對的DNA序列。但是,這里有一個根本的問題:大多數核酸酶識別的堿基序列只有6個或8個——這太短了,完全不適于基因編輯。這些序列在人類基因組里出現了上萬次甚至數十萬次,這意味著,這個酶會把整個基因組切成許多段,細胞恐怕還來不及修復DNA就死去了。
研究人員無法依賴之前發現的核酸酶,但是每次進行基因編輯之前都尋找類似I型SceI的內切酶也不現實。如果要在臨床上針對致病基因進行基因編輯,醫生不可能等待科學家再發現一個剛好可以針對患者身上突變基因的酶??茖W家需要立即找到一個可以針對該基因的內切酶,或者有辦法根據需求很快合成出來。
事實上,早在1996年,有人已經開始嘗試用新的策略來解決這個問題。約翰·霍普金斯大學的教授斯里尼瓦桑·赫曼德拉斯格恩(Srinivasan Chandrasegaran)意識到,除了從頭開始構建核酸酶或者在自然界尋找新型內切酶,還有第三種折中的辦法:重新改造天然存在的內切酶,使得它們滿足進行基因編輯的前兩項要求:識別特定的位點,并進行剪切。
具體來說,赫曼德拉斯格恩采取的策略是從兩類天然存在的蛋白質中拼接出一個雜合體內切酶,這兩類蛋白質一個擅長DNA識別,一個擅長DNA剪切。要實現DNA剪切,赫曼德拉斯格恩選擇了一種叫作FokI的細菌核酸酶作為模塊,它可以切開DNA,但沒有序列偏好;要實現DNA識別,他借助了另一類廣泛存在的天然蛋白質,叫作鋅指核酸酶。所謂鋅指,指的是它依賴于鋅離子與DNA結合,像兩根手指那樣夾住DNA。由于這些鋅指核酸酶由多個重復單元組合而成,每個單元識別特定的三個DNA序列,看起來,科學家有可能通過重新設計蛋白質使它識別其他DNA序列。
令人振奮的是,赫曼德拉斯格恩的雜合內切酶似乎可行。他的團隊融合了FokI的剪切模塊和鋅指核酸酶中的DNA識別模塊,并進一步表明,這個重新設計的核酸酶可以精確識別并切割目標DNA,雖然這兩類蛋白質的來源完全不同。
很快,赫曼德拉斯格恩就與猶他大學的達娜·卡羅爾(Dana Carroll)教授合作,開始把這些新的鋅指核酸酶(zinc finger nucleases,簡稱ZFNs)用于實驗。他們的工作表明,鋅指核酸酶可以在青蛙的受精卵(這是生物學家常用的模式生物之一)中工作,而且鋅指核酸酶引起的DNA切割激發了同源重組。緊接著,卡羅爾改造了一個新的鋅指核酸酶,針對的是果蠅體內與色素有關的基因YELLOW,他們的實驗再次在成體中進行了精確的基因改造。對基因編輯而言,這是一個影響深遠的進展。鋅指核酸酶不僅可以用于動物實驗,更重要的是,它們可以經過重新設計來剪切新基因。
更多的研究人員加入了進來,他們開始針對自己的研究方向設計鋅指核酸酶,在新的模式生物中剪切新的基因。2003年,馬修·波特斯(Matthew Porteus)和大衛·巴爾的摩(David Baltimore)首次在人類細胞中利用定制的鋅指核酸酶進行了基因編輯;緊接著,費奧多爾·烏爾諾夫(Fyodor Urnov)和同事在人類細胞中更正了導致重癥復合免疫缺陷的基因突變。從此,利用基因編輯技術來治療遺傳病變得觸手可及。
與此同時,通過鋅指核酸酶進行的基因編輯也被用于其他場合,比如精準改造農作物或者模式動物。到了21世紀初,這項技術已經成功地應用于擬南芥、煙草、玉米,證實了DNA雙鏈斷裂可以在多種細胞類型中(不僅僅是哺乳動物)促進高效的同源重組。與此同時,一些論文也陸續報道了鋅指核酸酶可以在斑馬魚、昆蟲、小鼠中進行基因編輯。這些工作引人入勝,富有應用前景,在參加許多學術會議期間,我也為之吸引。
不過,雖然潛力巨大,但是鋅指核酸酶的使用局限于少數幾個實驗室。使用鋅指核酸酶,需要研究人員有豐富的蛋白編輯經驗,或者有機會跟有這些經驗的實驗室合作,或者有足夠的經費可以支付定制核酸酶的高昂費用。從理論上來說,設計鋅指核酸酶不難——只要把不同鋅指核酸酶的片段以特定的方式組合起來,識別感興趣的DNA序列即可。但是在實際操作中,它非常困難。很大比例的鋅指核酸酶無法識別目標DNA;另外有一些專一性太低,到處切割,導致細胞死亡;還有一些鋅指核酸酶模塊可以識別DNA,但是無法完成剪切。
除了改造蛋白質的重重困難,鋅指核酸酶的靈活性也有限,難于推廣使用。毋庸置疑,鋅指核酸酶的結果表明,如果要進行基因編輯,定制核酸酶是必由之路,但是這個領域仍然期待著一種更可靠、更便捷的技術。
2009年,第一代基因編輯技術出現了,它依靠的是從黃單胞桿菌里發現的一種新型蛋白質,叫作類轉錄活化因子(TALEs)。這些蛋白質與鋅指核酸酶的構造非常類似:它們都是由多個重復片段組成,每個片段識別特定的DNA序列。區別在于:每個鋅指核酸酶的手指識別三個DNA堿基,而每個類轉錄活化因子的片段可以識別單個DNA堿基。這使得科學家很容易推斷出哪個片段識別哪個DNA堿基,于是他們可以重新編輯,來識別更長的DNA序列。在鋅指核酸酶中,這項工作聽起來簡單,實際上頗為困難,但在類轉錄活化因子中,它的確很簡單。
研究人員轉而探索這種新技術。類轉錄活化因子的編碼序列一經破解,三個實驗室就把類轉錄活化因子與鋅指核酸酶的剪切模塊融合,創造出了類轉錄活化因子核酸酶(簡稱TALENs)。類轉錄活化因子核酸酶在細胞內引發基因編輯的效果非常驚人,科學家對它做了某些設計上的改進,更方便了它們的構建和使用。
“但是,可憐的類轉錄活化因子核酸酶恐怕沒有機會一展身手了。”卡羅爾在一篇關于基因編輯起源的綜述文章中寫到。因為就在人們發現類轉錄活化因子核酸酶并用于基因編輯不久,最新的(也許是終極的)基因編輯技術出現了。這項技術叫作CRISPR——正是在這里,我的故事跟基因編輯的故事銜接了起來?;蚓庉嫾夹g經歷了漫長的發展歷史,但它馬上要進入一個激動人心的新時代。