1.3 轉錄組親緣學及其他
全基因組測序花費高,對于重復序列占比大、雜合度高和非二倍體基因組,序列正確拼接組裝十分困難(陳等,2010)。顯然大規模比較轉錄組研究更具可行性。轉錄組測序(RNA-Seq)數據基于表達的mRNA,不包括內含子信息,沒有重復序列和倍性的干擾。初始的轉錄組親緣學概念指多物種的基因共表達分析(Kohonen等,2007),物種間進化距離分析可基于轉錄組信息。顯然轉錄組親緣學也可應用于藥用植物研究,例如,從19種植物(包括虎杖、紅豆杉、銀杏和人參等藥用植物)轉錄組數據中提取50個單拷貝直系同源基因(郝等,2012),可用于系統樹構建和進化分析。從紫菜屬(P. umbilicalis)和P. purpurea的454焦磷酸測序獲得482個編碼紅藻植物門頭發菜綱紫菜屬(Porphyra)膜轉運蛋白的EST序列(Chan等,2012),發現存在內共生和與原生藻菌有關的水平基因轉移。此研究提供了海洋藻類鈉偶聯的轉運系統的分子特征和共調控機制。重建陸生植物和藻類的起源和進化過程是植物系統發育的基本課題,對理解關鍵適應性性狀的產生十分重要。由于物種快速多樣化導致一些進化關系分辨不清,少數幾個分子標志明顯不夠,基因組尺度的數據顯著增加了有信息位點數量。中藥資源和中藥鑒定是應用性很強的領域,盡管考慮的是中藥材,但應避免一葉障目不見泰山的尷尬,全面挖掘中藥資源和物種的準確界定都離不開其所在族屬完全物種取樣的分子系統學研究(黃等,2014)。轉錄組代表能表達的那部分在功能上活躍的基因組,測序費用的大幅降低和生信分析方法的改進使得密集物種取樣的轉錄組親緣學研究成為可能。例如,從92種streptophyte綠藻轉錄組數據和11種陸生植物基因組序列中提取共有的直系同源基因(Wickett等,2014),用其中852個核基因(1701170個序列聯配位點)構建系統進化樹,發現陸生植物和綠藻Zygnematophyceae為姊妹關系(圖1-5),地錢(liverwort)和地衣(moss)組成的分支與維管植物分支為姊妹關系,而角苔(hornwort)與所有非角苔陸生植物為姊妹關系,從而證偽了之前關于早期陸生植物進化的假說。轉錄組親緣學加深對基本植物性狀進化的認識,包括藥用植物化學多樣性和相關生合路徑的進化。

圖1-5 獲支持證據最多的陸生植物系統發育假說
盡管只被應用了極短的時間尺度,人工選擇已經極大地改變了馴化植物的形態、生理、植化和生活史。比較RNA-Seq數據可用于解析種植番茄和五個近緣野生物種間基因序列和基因表達差異(Koenig等,2013)。基于序列差異發現>50個基因經受正選擇,數千個基因的表達水平有顯著差異,許多是由于選擇壓力所導致。許多快速進化基因與環境應答和應激耐受有關。野生和種植品系間光反應共表達網絡的大規模變化進一步強調了環境輸入量對于基因表達進化的重要性。人工定向雜交和間接有利于非同義替換的馴化和改良過程已經極大地改變了番茄轉錄組。比較轉錄組有助于深入了解人工選擇和自然選擇對野生和種植品系的普遍效應,基于轉錄組的親緣樹構建有助于定量研究各近緣物種的起源時間和進化歷程,這對藥用物種研究的重要性是不言而喻的。
類似地,基于蛋白質組數據進行系統發育分析,有蛋白質組親緣學(phyloproteomics)(Villar等,2013),但尚未用于植物研究。表觀基因組親緣學(phyloepigenomics)(Martin等,2011)在表觀遺傳修飾層面考察物種親緣關系,用于藥用植物研究將有新穎發現。宏基因組親緣學(phylometagenomics)(Brindefalk等,2011)可用于研究藥用植物根際微生物和植物內生菌等。例如,對中國西南地區7種石斛植物的內生真菌進行抗菌活性篩選,考察活性菌株之間的遺傳關系(崔等,2012)。采用組織塊法分離真菌,瓊脂擴散法進行抑菌活性篩選,通過rDNA的ITS序列鑒定真菌,用鄰接法(NJ)和最大簡約法(MP)考察遺傳關系。從7種石斛屬植物分離到98株真菌,它們對Escherichia coli、Bacillus subtilis、Staphylococcus aureus、Candida albicans、Cryptococcus neoformans和Aspergillus fumigatus的抑制率分別是1.02%、10.2%、18.4%、1.02%、1.02%、10.2%,其中DL-3、DL-18、DL-21、DM-2、DG-10和DN-1對B. subtilis、S. aureus和A. fumigatus有較強的生長抑制。24株活性真菌隸屬于7個目、11個屬、14個種,NJ和MP系統樹闡明活性菌之間的親緣關系。本研究有助于考察珍稀瀕危石斛屬植物的內生真菌的生物活性以及它們之間的遺傳關系和生態價值,為石斛根莖部活性真菌的研究提供參考。比較分析來自南京和大連紅豆杉根際的15個16S rRNA和15個ITS MiSeq測序文庫(Hao等,2016),并從根際分離高產漆酶真菌和多環芳烴(PAH)高效降解真菌菌株,研究紅豆杉根際微生物群落的物種變異性和潛在的環境/化工制藥應用。高通測序得到的讀序分屬31個細菌門的2141個操作分類單位(OTUs),以及至少7個真菌門的2904個OTUs。構建所有細菌/真菌OTUs的16S rRNA/ITS親緣樹,明確各根際樣品微生物群落的親緣關系(圖1-6)。矮紫杉和曼迪亞紅豆杉根際浮霉菌(Planctomycetes)、放線菌(Actinobacteria)和綠彎菌(Chloroflexi)豐度高于南方紅豆杉根際(NF),而酸桿菌(Acidobacteria)、變形桿菌(Proteobacteria)、硝化螺菌(Nitrospirae)和未分類菌在后者豐度更高(圖1-7)。NF富含子囊菌門(Ascomycota)和接合菌門(Zygomycota),而兩種溫帶紅豆杉根際富含未分類真菌擔子菌門(Basidiomycota)和壺菌門(Chytridiomycota)。NF的細菌/真菌群落富裕度和多樣性低于其他種紅豆杉根際。紅豆杉根際分離的3株高產漆酶真菌可以高效脫色3類活性染料,而2株PAH降解真菌能轉化難降解的致癌物苯并芘。該研究拓展了根際微生物多樣性的知識譜系,例證了資源植物根際研發的范式轉變。

圖1-6 來自不同紅豆杉根際微生物群落對比
基于β-多樣性距離矩陣的層次聚類分析顯示不同紅豆杉根際微生物群體間的關系。用Qiime和Bray-Curtis算法計算β-多樣性距離矩陣;用UPGMA(非加權配對算術平均法)算法建樹。枝長代表樣品間距離。(a)細菌(XJ),(b)真菌(Z);ZS,矮紫杉,MD,曼迪亞紅豆杉,NF,南方紅豆杉

圖1-7 紅豆杉根際不同微生物綱的相對組成豐度
圖1-7(a)~(c),細菌。鞘脂桿菌綱(Sphingobacteria)、纖維黏網菌(Cytophagia)和黃桿菌綱(Flavobacteria)屬于擬桿菌門(Bacteroidetes);Phycisphaerae屬于浮霉菌門(Planctomycetes);厭氧繩菌綱(Anaerolineae)屬于綠彎菌門(Chloroflexi);Spartobacteria屬于疣微菌門(Verrucomicrobia)。(d)~(f),真菌。座囊菌綱(Dothideomycetes)、散囊菌綱(Eurotiomycetes)、錘舌菌綱(Leotiomycetes)和糞殼菌綱(Sordariomycetes)屬于子囊菌門(Ascomycota);銀耳綱(Tremellomycetes)、微球黑粉菌綱(Microbotryomycetes)和傘菌綱(Agaricomycetes)屬于擔子菌門(Basidiomycota)。
系統發育基因組學對計算能力和分析方法提出了新的挑戰,故有計算基因組系統學。