2.4 化學信息學和數據庫
可用的甘草屬DNA標記序列較少,使得推測系統發育關系比較困難(圖2-17)。綜合文獻報道化合物數據,構建甘草化合物數據庫有助于深入系統研究化學成分和化學分類(Xiang等,2012)。利用數據庫分類化合物,從而能定量分析甘草各類型化合物的分布。已報道甘草化合物至少422個,5大類,即黃酮、香豆素、三萜、二苯乙烯化合物和其他(表2-5)。目前從各物種分離的化合物,甘草170個、洋甘草134個、脹果甘草52個、云南甘草31個。二苯乙烯化合物單列一類別,二苯甲酰甲烷應屬于查耳酮類。該類數據庫方便化學分類研究。

圖2-17

圖2-17 甘草屬(Glycyrrhiza)系統發育樹(ML法)
(a)細胞核ITS序列;(b)葉綠體matK序列;(c)葉綠體rbcL序列
甘草(G.uralensis),洋甘草(G.glabra)和脹果甘草(G.inflata)是《中國藥典》收錄的甘草原植物
最常用于模式識別和分類的ANN(人工神經網絡)是自組織映射(SOM)。菊科向日葵族(Heliantheae)、堆心菊族(Helenieae)和澤蘭族(Eupatorieae)SLs分子描述符的SOMs明顯類似,春黃菊族(Anthemideae)和旋覆花族(Inuleae)相似(Scotti等,2012),這些結果符合Bremer提出的基于形態和分子數據的系統分類。通過SL結構片段或二維表示獲得的描述符足以取得顯著結果,使用三維表示獲得的描述符并不能得到更好的結果。