官术网_书友最值得收藏!

1.4.2 蛋白質(zhì)-配體結(jié)合位點預(yù)測

幾種類型的算法已發(fā)展用來預(yù)測配體結(jié)合位點。一些算法主要分析蛋白質(zhì)表面的口袋。許多研究表明,結(jié)合位點通常位于最大口袋。一種算法分析放置在蛋白質(zhì)周圍的網(wǎng)格上探針的結(jié)合能,探針聚類和能量輪廓分析可以用來預(yù)測配體結(jié)合位點。另外,更復(fù)雜的模擬方法也可用于預(yù)測結(jié)合位點,例如用分子動力學(xué)模擬來識別配體結(jié)合位點,重要殘基往往位于靜電不利的位置。

一系列功能比較工具也可用來識別結(jié)合位點,包括3D模板[2930]、圖論[3132]、模糊模式匹配[33]和進化跟蹤方法[34]。這些工具可用于為新解析的蛋白質(zhì)結(jié)構(gòu)進行功能注釋,通常不用在基于結(jié)構(gòu)的藥物設(shè)計(structure-based drug design,SBDD)結(jié)合位點的預(yù)測研究,它們更經(jīng)常被用來為來自結(jié)構(gòu)基因組學(xué)項目的新解析蛋白質(zhì)結(jié)構(gòu)注釋功能。其他方法包括結(jié)合位點上氨基酸在進化過程中發(fā)生同步變異(相關(guān)突變),已應(yīng)用于蛋白質(zhì)-蛋白質(zhì)結(jié)合位點預(yù)測[35]。也有人指出,脯氨酸殘基往往存在于蛋白質(zhì)-蛋白質(zhì)結(jié)合位點中[36]。應(yīng)當指出的是,蛋白質(zhì)-蛋白質(zhì)結(jié)合位點預(yù)測通常需要不同的計算方法,后續(xù)將討論這一內(nèi)容。

預(yù)測配體結(jié)合位點存在著許多問題。一個主要的問題是誘導(dǎo)契合。配體結(jié)合時,結(jié)合位點可以顯著改變形狀。另一個問題是配體結(jié)合位點會位于亞基界面之間。有些算法只測試過單亞基,已被證明在復(fù)合體數(shù)據(jù)集測試時較差。第三個問題是存在著配體的絕對多樣性,以及相應(yīng)多樣的結(jié)合位點,很難設(shè)計一個算法,對所有構(gòu)象上和物理化學(xué)上不同的配體結(jié)合位點進行較準確的預(yù)測。目前還存在著結(jié)合位點預(yù)測工具驗證的問題。通常,一個成功的預(yù)測是指涵蓋了一定數(shù)量的配體原子。然而,如果預(yù)測的位點非常大(例如,覆蓋了整個蛋白質(zhì)),預(yù)測仍然可能是成功的,盡管它不是很精確。在一般情況下,基于結(jié)構(gòu)的藥物設(shè)計需要對配體結(jié)合位點做準確定義,以限制蛋白質(zhì)相關(guān)區(qū)域的搜索空間,減少假陽性結(jié)果。我們探索了作為基于結(jié)構(gòu)的藥物設(shè)計的第一步、用于預(yù)測蛋白質(zhì)-配體結(jié)合位點的一些不同方法,以幾何和能量為基礎(chǔ)的口袋檢測方法作為主要的結(jié)合位點預(yù)測方法,因此,以下集中介紹這些方法。另外,越來越多的功能點預(yù)測和“盲對接”的方法在基于結(jié)構(gòu)的藥物設(shè)計中發(fā)揮作用,因此,以下也會涉及一些相關(guān)的進展。

1.4.2.1 基于幾何的方法

蛋白質(zhì)口袋檢測是一種廣泛使用的技術(shù),可用來識別潛在的配體結(jié)合位點。它采用幾何因素來定義口袋,并且有研究表明,結(jié)合位點通常是在最大的口袋里找到的。例如,SurfNet[37]用來分析67個蛋白質(zhì)結(jié)構(gòu),并在83%的情況下發(fā)現(xiàn)配體結(jié)合位點在最大的口袋里[23]。APROPOS[38]通過發(fā)現(xiàn)可以容納分子基團的洞穴的特征模式,取得較高的預(yù)測成功率。其他的口袋檢測算法有Cavity Search[39]、POCKET[40]、VOIDOO[41]、LIGSITE[42]、CAST[4344]、PASS[45]、LigandFit[46]以及Delaney[47]、Del Carpio等[48]、Masuya和Doi[49]開發(fā)的算法。

口袋檢測算法經(jīng)常采用圍繞蛋白質(zhì)的三維網(wǎng)格或一個分子表面定義。分子表面可以只使用網(wǎng)格來定義,即通過查找碰不到蛋白質(zhì)(的)原子的格點組成的界面。這種技術(shù)已經(jīng)被LIGSITE、POCKET和Delaney的方法所使用。分子表面算法也能使用,這類算法的優(yōu)勢是不依賴網(wǎng)格的分辨率。分子表面算法一般依賴于在表面滾動的“溶劑”探針的半徑(通常為水,具有1.4?的半徑)。Lee和Richards的溶劑可及表面[50]是由探針中心定義的表面,而分子表面或Connolly表面[51]定義為蛋白質(zhì)溶劑的界面,即完全排除了溶劑體積表面,因此定義了溶劑探針與蛋白質(zhì)原子范德華表面之間的接觸點。下面,詳細地說明幾個口袋檢測算法。

(1)POCKET算法 一個半徑為3?的探針球沿蛋白質(zhì)三維網(wǎng)格中笛卡爾坐標XYZ方向上遍歷每條線。如果蛋白質(zhì)的一個原子的中心位于探針球范圍內(nèi),可判斷為蛋白質(zhì)和探針球之間相互作用。如果一段相互作用后跟著一段沒有相互作用的空間,緊跟著又出現(xiàn)相互作用,就發(fā)現(xiàn)了一個口袋。在圖1.12中口袋為“小點”區(qū)域。該算法的主要缺點是,口袋里的確切性質(zhì)依賴于蛋白質(zhì)的相對旋轉(zhuǎn)角度的坐標參考框架。

圖1.12 POCKET算法[40][探針球(黑色圓形)掃描一個蛋白,點區(qū)域標志被算法識別的口袋和穴]

(2)LIGSITE算法和Pocket-Finder算法 LIGSITE非常相似于POCKET。然而,LIGSITE還可以沿著立方體對角線方向掃描,即七個掃描方向,而不是三個方向。這使得蛋白質(zhì)口袋較少依賴于蛋白質(zhì)的三維網(wǎng)格取向(比較圖1.12和圖1.13)。LIGSITE具有被稱為MINPSP(minimum protein-site-protein,最小的蛋白質(zhì)-位點-蛋白質(zhì))的閾值變量。一單網(wǎng)格點有七條探針線穿過它(XYZ和四個立方對角線)。該格點可以多至七次被定義為一個口袋(PSP事件)。MINPSP閾值可以定義一個格點必須發(fā)生多少次PSP事件才被定義為一個口袋的部分。通過設(shè)置高閾值,淺口袋被排除在外。LIGSITE進行了十個蛋白質(zhì)結(jié)構(gòu)的驗證,并表現(xiàn)出良好效果,其中,七個蛋白質(zhì)的結(jié)合位點在最大口袋中。這一類算法的準確性、便捷性,非常適合并且已在若干后續(xù)研究,包括在CavBase[52]和SuperStar[53]中使用。

圖1.13 LIGSITE掃描立方對角線(XYZ軸除外)[42]

(3)Delaney的算法 蛋白質(zhì)置于一個三維網(wǎng)格中,凡是與蛋白質(zhì)相交的格點設(shè)置為‘true’,否則設(shè)置為‘false’[圖1.14(a)]。口袋檢測操作如下:首先,將與蛋白質(zhì)表面(和腔邊界)相交的格點設(shè)置為‘true’,而其相鄰格點設(shè)置為‘false’;然后,進行表面膨脹操作,即將單層的粒子添加到蛋白質(zhì)表面(表面膨脹),再重新設(shè)置‘true’和‘false’[圖1.14(b)];接著進行表面收縮操作,即使表面上的單層粒子被刪除[圖1.14(c)]。經(jīng)過反復(fù)擴展和收縮(通常為5~10次),蛋白質(zhì)腔充滿顆粒[圖1.14(d)]。這是因為通過口袋擴展添加的粒子并不會被定義為蛋白質(zhì)表面部分。

圖1.14 Delaney的算法[47]

(4)PASS算法 PASS使用了類似于Delaney的算法,所不同的是該算法著眼于三個蛋白質(zhì)原子的所有可能組合。如果三個原子足夠接近在一起,該算法只計算出探針球接觸到的所有三個蛋白原子的兩個可能的表面位置(圖1.13)。如果它們與蛋白質(zhì)原子之間有碰撞,探針將被拒絕。其他過程類似于Delaney的算法。

圖1.15 PASS算法[45][探針(深灰色)的位置由三個蛋白質(zhì)原子(淺灰色)的位置計算得來。存在有兩個可能的探針位置,每個都與三個蛋白質(zhì)原子相切]

(5)Del Carpio等的算法 該算法采用了表面“生長”的過程,以確定腔和口袋。分子表面首先利用Lee和Richards方法識別。首先標記距離該蛋白質(zhì)重心最近的表面原子[圖1.16(a)],然后標記周圍的表面原子(第一個原子的視準線以內(nèi)),從而識別出第一個凹口袋。然后,搜索一個離重心最近的未標記(unflagged)原子,重復(fù)此過程。該算法將持續(xù)到表面上沒有更多的凹區(qū)域可識別[圖1.16(b)]。

圖1.16 Del Carpio等的算法[48]

(6)APROPOS算法 APROPOS算法基于一個蛋白質(zhì)的α-形狀(α-shape)表示展開。α-形狀表示即是使用α-形狀生成算法創(chuàng)建的蛋白質(zhì)Delaunay表示。α-形狀的性質(zhì)依賴于參數(shù)‘α’,這可以被認為是一個從蛋白質(zhì)表面滾過的探針球的半徑。探針可以清除兩側(cè)和三角形的邊緣,但不是頂點(原子中心)。當探針球半徑趨于無窮大時形成凸殼(圖1.17)。實際操作時,使用約20?的實驗值,否則假陽性口袋會被發(fā)現(xiàn)。通過使用介于2.8?(氧原子半徑)和4.5?(甲基半徑)的α,發(fā)現(xiàn)可以結(jié)合配體基團的口袋。口袋通過比較α-形狀和凸殼的結(jié)構(gòu)來確定,若兩者結(jié)構(gòu)差異很大,則可認為存在口袋。

圖1.17 APROPOS算法[38]

人們已經(jīng)注意到,配體基團往往適應(yīng)蛋白質(zhì)分子中的小“洞穴”。APROPOS還通過搜索這些特征“洞穴”來預(yù)測哪個口袋里是配體結(jié)合位點,該算法被證明對一個由亞基組成的蛋白質(zhì)數(shù)據(jù)集有95%的成功率,但當用蛋白復(fù)合物進行測試時,準確率要低得多。

(7)CAST算法 CAST采用類似于APROPOS的方法來檢測蛋白口袋,并用離散流理論來確定哪類口袋滿足要求(圖1.18)。該算法測試了含67個蛋白結(jié)構(gòu)的數(shù)據(jù)集。當使用CAST時,74%的配體結(jié)合位點被確定在最大的口袋,而使用SurfNet時是83%。然而,由于口袋大小和性質(zhì)所產(chǎn)生的差別,將這些結(jié)論之間進行直接比較非常困難。CAST已推出CASTp(表1.3)可在網(wǎng)上使用。

圖1.18 CAST算法和選擇口袋的離散流理論[4344]

表1.3 能識別配體結(jié)合位點的在線服務(wù)器的web網(wǎng)址

(8)SurfNet算法 SurfNet通過選中蛋白質(zhì)上的原子對,在它們之間形成了一個測試球。如果測試球與蛋白原子有任何重疊,則減小測試球的半徑,直到不再有重疊[圖1.19(a)為一個蛋白質(zhì)口袋,白色圓形代表蛋白質(zhì)原子。對于每對原子(條紋標識),做出一個測試球(淺灰色圓形,并有點狀輪廓)。如果測試球與蛋白質(zhì)原子重疊,其半徑就縮小直到它們不再重疊(深灰色圓形)。如果半徑低于一個設(shè)定值(比如1.0?),測試球就不放在這個位置。這個過程將繼續(xù),并測試所有相關(guān)原子對,直到口袋被球填滿。]因此,測試球聚集在口袋和洞穴中[圖1.19(b)],半徑在1~4?之間的測試球保留。SurfNet已可供下載(見表1.4)。

圖1.19 SurfNet算法[37]

表1.4 可供下載的配體結(jié)合位點識別工具的網(wǎng)址

1.4.2.2 基于能量的方法

目前,已經(jīng)形成了一些估算在一個給定點上探針分子(如亞甲基,羥基或胺基)和蛋白之間的相互作用能的方法,其可用來識別與探針親和的位點。以下對這些方法做一簡要的介紹。

(1)Goodford的方法 Goodford等發(fā)展了一種GRID方法,它識別與特定探針類型親和的位點,這對于從能量輪廓角度分析蛋白質(zhì)表面以找到有利的位點是特別有用的,該方法目前已廣泛應(yīng)用于以結(jié)構(gòu)為基礎(chǔ)的藥物設(shè)計。因為它能識別蛋白質(zhì)哪些部分可能與一個類似藥物分子的官能團相互作用,例如,已經(jīng)使用GRID方法識別了類似藥物分子的氫鍵勢能[5455]。同時Miranker等的多拷貝同步搜索(MCSS)方法[56]也被用于檢測不同官能基團的有利結(jié)合位點。然而,無論是什么方法都不能直接用于定位一個蛋白質(zhì)上的配體結(jié)合位點。

(2)Ruppert等的方法 Ruppert等發(fā)展了在給定點上估算探針和蛋白質(zhì)之間相互作用能的方法。他們利用 Jain開發(fā)的打分函數(shù)[57]優(yōu)化三個不同探針類型的相互作用能(疏水性的氫原子;氫鍵供體:NH,氫鍵受體:CO等)。他們保留了最有利的相互作用能探針,然后確定“粘點”,這是探針具有最高相互作用能量密度的區(qū)域。下一步,口袋生長,通過在“粘點”周圍的蛋白空白區(qū)定義非蛋白球。最后,增長過程發(fā)生,通過把口袋定義的附近的可及探針加進去,擴大粘點為更大的口袋。因此,能量和幾何標準都用來定義一個配體結(jié)合位點。他們的算法被證明在九個配體結(jié)合和兩個非配體結(jié)合的蛋白質(zhì)中取得良好的效果。

(3)Q-SiteFinder方法 Q-SiteFinder通過聚類蛋白質(zhì)表面上范德華力(甲基)探針有利的區(qū)域來定位配體結(jié)合位點(圖1.18)。它使用的GRID力場參數(shù)[58]估算在一個涵蓋整個蛋白質(zhì)的三維網(wǎng)格所有點上探針的相互作用能。具有有利能量的探針被保留,并根據(jù)它們的空間距離聚集成類。各類根據(jù)自己的總相互作用能進行排序。

該算法已被證明在前三名有正確預(yù)測的情況下,對于Nissink等描述的GOLD對接測試集(134個蛋白質(zhì)-配體復(fù)合體)取得了90%的預(yù)測成功率[59]。而對于非結(jié)合態(tài)蛋白測試集,成功率(86%)呈小幅下降,這可能是因為誘導(dǎo)契合的影響。

Q-SiteFinder使用一個精確度閾值來判斷預(yù)測成功與否。精確度定義為與配體距離小于1.6?的探針在一個集群內(nèi)的百分比。精確度閾值25%用來定義一個成功的預(yù)測,即Q-SiteFinder預(yù)測發(fā)現(xiàn)的一個探針集群中,如果與配體距離小于1.6?的探針所占的比例超過25%,那么就判定這個探針集群預(yù)測成功。對于蛋白質(zhì)分子來說,這個探針集群所占據(jù)的區(qū)域是一個真實的結(jié)合位點。Q-SiteFinder把它發(fā)現(xiàn)的所有位點按照精確度標準由大到小進行排序,在排名第一的位點作為結(jié)合位點的原則下取得了平均68%的準確率。Q-SiteFinder還與口袋檢測類算法Pocket-Finder進行了比較、優(yōu)化,并在與Q-SiteFinder相同的數(shù)據(jù)集下進行了測試。只有在當精確度閾值下降到0時,Pocket-Finder才能夠取得與Q-SiteFinder相近的成功率。Pocket-Finder以最大口袋為預(yù)測結(jié)合位點取得了平均29%的準確率。另外,Q-SiteFinder和Pocket-Finder均提供在線預(yù)測服務(wù)(表1.3)。

(4)Pocketome方法 該算法類似于Q-SiteFinder,它通過創(chuàng)建一個三維網(wǎng)格,計算出每個點的范德華勢能。然后,勢能圖平滑處理,識別有利結(jié)合能和可能結(jié)合配體的封套(ligand binding envelopes),體積超過100?3的封套區(qū)域被保留。該算法使用預(yù)測發(fā)現(xiàn)的封套區(qū)域與真實配體結(jié)合位點的覆蓋率閾值[60]來判別預(yù)測成功與否,當覆蓋率閾值設(shè)定為80%時,5616個蛋白-配體結(jié)合位點中有85.7%能被正確識別。這些被識別的位點絕大多數(shù)是最大口袋。

1.4.2.3 統(tǒng)計和機器學(xué)習(xí)方法

統(tǒng)計蛋白配體的接觸和取向分析也可以用來預(yù)測配體結(jié)合位點,例如PATCH[61]的開發(fā)是為了檢測碳水化合物結(jié)合位點,在測試包含40個蛋白質(zhì)的數(shù)據(jù)集時取得了65%的成功率。神經(jīng)網(wǎng)絡(luò)基于活性位點的相似性[6263]辨識,也被用來進行酶的分類。同樣,基于表面性質(zhì)的方法也被用于預(yù)測蛋白質(zhì)相互作用,包括支持向量機的使用[64]。Stahl等使用Connolly算法來計算溶劑可及表面積,并定義表面點的相互作用類型(共五種,分別為脂肪、氫鍵供體、氫鍵受體、芳香面和芳香邊)。研究工作使用176個蛋白質(zhì)進行神經(jīng)網(wǎng)絡(luò)訓(xùn)練,使用18個含鋅酶進行測試。這些含鋅酶中的16個,其配體結(jié)合口袋被正確識別。這也說明該神經(jīng)網(wǎng)絡(luò)可以用于結(jié)合位點的分類,也可應(yīng)用于蛋白質(zhì)結(jié)構(gòu)鑒定。

1.4.2.4 盲對接

盲對接是一個標準對接工具應(yīng)用到整個蛋白質(zhì)的過程。這一過程隱含著結(jié)合位點預(yù)測能力,同時還能提供正確的配體結(jié)合方向相關(guān)信息。盲對接的使用前提是配體結(jié)構(gòu)為已知,而其他的結(jié)合位點預(yù)測工具沒有這個條件限制。但是,盲對接速度很慢,尤其是當使用配體來篩選大量蛋白質(zhì)的時候。因此,盲對接最有用的場景為兩個結(jié)合分子(受體和配體)結(jié)構(gòu)均為已知,而用戶試圖找出一種生物相關(guān)的結(jié)合模式。

Hetenyi和van der Spoel[65]用AutoDock[66]進行了盲對接并成功復(fù)現(xiàn)了八個復(fù)合體的蛋白-配體取向。盲對接項目已經(jīng)被加入到了CASP2對接競賽[67]中。CASP2提出了挑戰(zhàn)問題是:給予配體和蛋白質(zhì)的三維結(jié)構(gòu),確定其中配體的結(jié)合位置。九個小組提交了七個蛋白-配體復(fù)合體和一個蛋白質(zhì)-蛋白質(zhì)復(fù)合體。這次競賽項目的預(yù)測整體效果較好,提交的77個預(yù)測中,幾乎所有的構(gòu)象都在實際取向的3?范圍之內(nèi)。因此,盡管這種對接模擬速度慢,但其結(jié)果對于識別生物結(jié)合模式似乎是有所助益的。

1.4.2.5 應(yīng)用要點

結(jié)合位點識別對于虛擬配體篩選和基于結(jié)構(gòu)的藥物設(shè)計非常重要。它限制搜索空間于蛋白復(fù)合物的相關(guān)部分,加快了這一進程,減少了假陽性結(jié)果。功能位點定位對于從結(jié)構(gòu)到功能也是極為重要的。當進行基于結(jié)構(gòu)的藥物設(shè)計時,如果對接前沒有關(guān)于配體結(jié)合位點或功能的信息,最好使用幾種不同類型的可用工具同時預(yù)測虛擬篩選靶標的配體結(jié)合位點。另外,以口袋檢測和能量為基礎(chǔ)的方法也可為基于結(jié)構(gòu)的藥物設(shè)計確定合適的搜索空間。

主站蜘蛛池模板: 德钦县| 长春市| 衡南县| 濮阳县| 黑河市| 大兴区| 富宁县| 宜兴市| 潍坊市| 七台河市| 金昌市| 陕西省| 连云港市| 湘阴县| 彰武县| 河南省| 兴山县| 额济纳旗| 澜沧| 英吉沙县| 五原县| 板桥市| 鄄城县| 北碚区| 台北市| 青川县| 五华县| 英超| 泰兴市| 双柏县| 长丰县| 米脂县| 保山市| 平定县| 汉川市| 商洛市| 镇沅| 鸡东县| 莆田市| 霍山县| 大连市|