官术网_书友最值得收藏!

第3章 藥用植物基因組/轉錄組研究和高通量測序

3.1 研究背景

傳統上是由化學家和植物化學家引領藥用植物產品的研究,但隨著植物次生代謝物(SMs)和活性基因間關聯的揭示,愈來愈顯示遺傳學和基因組學手段在促進天然產物發現中的巨大作用。在漫長的進化過程中,植物發展出合成無數SMs的機制,SMs的生化篩選對發現新穎化合物結構,開發植物基新藥不可或缺。深入研究SMs生合和相關遺傳機制,促進分子育種、代謝工程和轉基因植物開發,方便大規模生產植物基藥物,也有助于從化學分類和分子系統發育兩個角度探索藥用植物親緣關系。與全基因組測序相比,RNA高通量測序更經濟可行,故在近十年被藥用植物領域廣泛采用,明顯提升了植物基因表達的研究速度。羅氏454焦磷酸測序和Illumina高通量測序是很受歡迎的測序平臺,已廣泛用于藥用植物轉錄組研究。測序流程持續進展,從測序樣品制備到海量數據分析各環節不斷更新換代,使得快速獲取藥用植物轉錄組輪廓和深入調查基因型和化學表型關聯成為可能。高通量轉錄組測序的隨機性有保證(圖3-1),從圖中可見讀序在組裝的unigene中的分布大體上是均一的。從unigene預測蛋白質編碼序列(CDS),是基于轉錄組數據的基因功能注釋的必要步驟(圖3-2)。本章論述藥用植物轉錄組/基因組研究中高通量測序應用的最新進展。

圖3-1  從鼠尾草屬(Salvia sclarea)葉轉錄組讀序分布推測高通測序的隨機性(Hao等,2015)

(a)7.5mmol/L MeJA處理0h;(b)10h;(c)26h

對聯配到參考基因不同位置的讀序數量求和。由于基因長度不同,將參考基因中被讀序覆蓋的位置歸一化為相對位置(即參考基因中讀序位置與基因長度的比值)。若mRNA碎片化的隨機性理想,參考基因中讀序分布應大致均勻。橫坐標是從基因5′端至3′端的相對位置,縱坐標是相應讀序數量

圖3-2  從組裝的南方紅豆杉(T. mairei unigenes)預測蛋白編碼序列(CDS)

用BLASTX(e值<0.00001)聯配unigene和蛋白質數據庫,優先順序為nr、Swiss-Prot、KEGG和COG。與高排位數據庫聯配的unigene不再與其他數據庫聯配。所有數據庫依次聯配完即結束。用BLAST結果中排位最高的蛋白質決定unigene的編碼區序列,將其翻譯成氨基酸序列。不能與任何數據庫聯配的unigene用ESTScan(http://www.ch.embnet.org/software/ESTScan.html)掃描,得到編碼區的核苷酸序列(5′-3′)和氨基酸序列。(a)預測CDS的長度分布,(b)預測CDS的空位(N)分布

主站蜘蛛池模板: 台中县| 阜康市| 新邵县| 上高县| 土默特左旗| 玉门市| 二手房| 海盐县| 昆山市| 白玉县| 尉犁县| 正阳县| 云安县| 乌审旗| 同仁县| 闽侯县| 霍州市| 娄底市| 华亭县| 祁东县| 武定县| 青铜峡市| 怀宁县| 阳朔县| 梁山县| 小金县| 岐山县| 通州市| 灵璧县| 阿鲁科尔沁旗| 台安县| 正定县| 海原县| 新乡市| 定兴县| 淮北市| 西贡区| 玉树县| 崇仁县| 新郑市| 巴楚县|