- 新生兒基因篩查
- 趙正言 周文浩 梁德生主編
- 10553字
- 2025-03-19 15:08:06
第六節(jié) 基因數(shù)據(jù)庫(kù)與人工智能
一、基因組數(shù)據(jù)分析和深度學(xué)習(xí)的應(yīng)用
高通量測(cè)序技術(shù)的出現(xiàn)對(duì)人類的遺傳疾病的診斷和檢測(cè)帶來(lái)了革命性的發(fā)展。全基因組和全外顯子組測(cè)序極大促進(jìn)了罕見(jiàn)病的科研和臨床應(yīng)用,同時(shí)也提高了對(duì)常見(jiàn)病的致病基因和位點(diǎn)的認(rèn)知。我們現(xiàn)在處于遺傳數(shù)據(jù)大暴發(fā)的階段,全世界有成千上萬(wàn)的人類基因組測(cè)序結(jié)果。而隨著數(shù)據(jù)指數(shù)的增長(zhǎng),如何有效分析并解讀這些數(shù)據(jù)并精準(zhǔn)地輔助臨床診斷,是目前面臨的極具挑戰(zhàn)的工作,而解決這一障礙最有希望的方法是深度學(xué)習(xí)。深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一種變體,在圖像識(shí)別或機(jī)器人技術(shù)等領(lǐng)域已成功實(shí)施,它的一個(gè)特性是在大量數(shù)據(jù)的時(shí)候最有效。因此,深度學(xué)習(xí)完全適合于基因組學(xué)領(lǐng)域的工具。盡管目前基因組學(xué)的深度學(xué)習(xí)還處于早期階段,但它在癌癥診斷和治療、臨床遺傳診斷、人群基因組學(xué)、功能基因組學(xué)等領(lǐng)域有重大的潛在應(yīng)用價(jià)值。本章節(jié)主要談一下基因組數(shù)據(jù)的分析及機(jī)器學(xué)習(xí)在基因組數(shù)據(jù)研究中的應(yīng)用。
數(shù)據(jù)分析的步驟通常包括數(shù)據(jù)收集、數(shù)據(jù)質(zhì)量檢查、過(guò)濾,數(shù)據(jù)處理,建模、可視化以及數(shù)據(jù)報(bào)告。利用生物信息學(xué)手段對(duì)含變異的基因進(jìn)行基因功能注釋并解讀,挖掘基因功能和潛在機(jī)制,建立基因網(wǎng)絡(luò)圖譜是對(duì)基因組數(shù)據(jù)執(zhí)行分析的常見(jiàn)操作。在基因組時(shí)代,隨著對(duì)基因組數(shù)據(jù)的全面分析在臨床和科研中越來(lái)越流行,對(duì)用于數(shù)據(jù)處理的工具和方法的需求也日益上升。不斷有科研人員或商業(yè)公司開(kāi)發(fā)新的分析軟件對(duì)數(shù)據(jù)進(jìn)行快速有效地分析。但目前最常用的基因組數(shù)據(jù)分析工具是基于Broad研究所科研人員開(kāi)發(fā)的一系列相關(guān)分析工具,如BWA-GATK分析流程。GATK是GenomeAnalysisToolKit的縮寫(xiě),是目前最主流的用于高通量測(cè)序數(shù)據(jù)中分析變異信息的軟件。我們接下去主要介紹一下以Illumina下一代測(cè)序(next generation sequencing,NGS)基因組數(shù)據(jù)為基礎(chǔ)的分析流程以及相應(yīng)開(kāi)發(fā)的一系列工具。
(一)基因組數(shù)據(jù)分析流程
1.數(shù)據(jù)的收集
Illumina公司采用邊合成邊測(cè)序的方法,首先將DNA分子用超聲波打斷成一定長(zhǎng)度的小DNA片段,然后在每個(gè)小片段的兩端加上接頭,構(gòu)建單鏈DNA文庫(kù);將建好的文庫(kù)在Illumina測(cè)序流動(dòng)槽上進(jìn)行橋式PCR擴(kuò)增和變性,同時(shí)在反應(yīng)體系中添加DNA聚合酶、接頭引物和帶有堿基特異熒光標(biāo)記的4種dNTP。在測(cè)序反應(yīng)過(guò)程中,光學(xué)設(shè)備每次記錄一個(gè)堿基的熒光信號(hào)記錄并利用計(jì)算機(jī)將其轉(zhuǎn)化為測(cè)序堿基直到所有堿基反應(yīng)完成。測(cè)序數(shù)據(jù)下機(jī)后的圖像信息根據(jù)樣本清單利用bcl2fastq將測(cè)序的文件轉(zhuǎn)化成后續(xù)分析所需要的Fastq文件。因此每個(gè)Fastq文件里包含了許多隨機(jī)分布的基因組上的短序列(reads)。
2.數(shù)據(jù)質(zhì)控
由于測(cè)序原理、測(cè)序儀器或?qū)嶒?yàn)操作等原因,會(huì)導(dǎo)致測(cè)序數(shù)據(jù)中部分?jǐn)?shù)據(jù)的質(zhì)量出現(xiàn)問(wèn)題,測(cè)序數(shù)據(jù)質(zhì)量的好壞會(huì)對(duì)后期的數(shù)據(jù)分析造成困擾,因此在拿到原始的Fastq文件后我們需要對(duì)數(shù)據(jù)進(jìn)行質(zhì)量控制,去掉一些低質(zhì)量的序列。我們首先拿到數(shù)據(jù)后,一般需要了解各個(gè)位置的堿基質(zhì)量值分布,也即堿基的錯(cuò)誤率分布情況。數(shù)據(jù)質(zhì)控常用的是FastQC和Trimmomatic。FastQC是基于Java的一款快速進(jìn)行測(cè)序數(shù)據(jù)評(píng)估的軟件,運(yùn)行結(jié)束后會(huì)給出兩份格式的報(bào)告,后綴為html的文件可以直接用瀏覽器打開(kāi)輸出圖表化的數(shù)據(jù)質(zhì)量報(bào)告。報(bào)告首先會(huì)給出測(cè)序數(shù)據(jù)一個(gè)基本的信息,如測(cè)了多少序列堿基、平均測(cè)序長(zhǎng)度是多少,以及基因組上的GC含量是多少。隨后的幾張表格分別會(huì)給出測(cè)序堿基的質(zhì)量。質(zhì)量值為10時(shí)說(shuō)明該堿基的錯(cuò)誤率為10%;20時(shí)表示錯(cuò)誤率為1%;30時(shí)表示錯(cuò)誤率為0.1%。另外,會(huì)給出測(cè)序數(shù)據(jù)的GC含量分布、N堿基的含量,重復(fù)序列、是否有接頭序列等。Trimmomatic主要用來(lái)去除Fastq 序列中的接頭和引物序列,從序列的5'端開(kāi)始,進(jìn)行滑窗質(zhì)量過(guò)濾,切掉堿基質(zhì)量平均值低于閾值的滑窗。根據(jù)堿基質(zhì)量值對(duì)Fastq序列進(jìn)行頭尾修剪等。
3.數(shù)據(jù)預(yù)處理
測(cè)序數(shù)據(jù)在去掉低質(zhì)量的序列后,我們需要開(kāi)始對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。測(cè)序預(yù)處理包括序列的比對(duì)排序、去重復(fù)序列以及堿基質(zhì)量校正。由于NGS的原理,我們知道測(cè)序下機(jī)后Fastq文件里的短序列在基因組上的順序關(guān)系被打亂并隨機(jī)分布,因此,需要將這一堆數(shù)據(jù)用已知的參考序列進(jìn)行比對(duì),將每一條read在參考序列中的位置最大化進(jìn)行對(duì)應(yīng)并排序,這個(gè)按圖索驥搜索定位的過(guò)程就是序列的比對(duì)(mapping)。對(duì)于人類基因組這樣海量的短序列數(shù)據(jù),需要快速的算法來(lái)搜索定位短序列在基因組中的位置,目前最常用的工具是BWA(Burrows-Wheeler Aligner)。首先通過(guò)壓縮算法(Burrows-Wheeler Transformation)對(duì)參考序列建立索引,然后將短序列比對(duì)到基因組上。其特點(diǎn)是快速、準(zhǔn)確,省內(nèi)存空間。BWA包含三種算法:BWA-backtrack一般用來(lái)比對(duì)Illumina序列70bp以下的片段,BWA-SW比較多用于短序列之間有很多gap的情況,可以支持70bp~1Mb的reads序列。首推的是BWA-MEM算法,它利用壓縮和后綴樹(shù)結(jié)合的算法對(duì)序列進(jìn)行比對(duì),其相對(duì)于BWA-SW更加快速和準(zhǔn)確;同時(shí)相對(duì)BWA-bactrack,在對(duì)70~100bp reads的比對(duì)上有更優(yōu)的性能。該算法先使用MEM(maximal exact matches)局部比對(duì),再使用SW算法進(jìn)行延伸。因此對(duì)于一條序列的不同部位可能會(huì)有各自最優(yōu)匹配結(jié)果,從而產(chǎn)生多個(gè)最佳匹配位點(diǎn),這對(duì)于長(zhǎng)讀長(zhǎng)序列很有優(yōu)勢(shì),但也會(huì)導(dǎo)致后續(xù)一些分析軟件的不兼容。因此,我們需要在執(zhí)行該工具的時(shí)候,選擇合適的參數(shù)進(jìn)行擇優(yōu)序列比對(duì)。比對(duì)后的數(shù)據(jù)輸出文件格式為SAM格式,可以通過(guò)SAMtools工具將其轉(zhuǎn)化成BAM文件格式以方便后續(xù)的分析。BWA比對(duì)完的數(shù)據(jù)是按照Fastq文件的順序逐一定位到參考基因組上,比對(duì)后的位置先后順序未定,故需要按照同一染色體中對(duì)應(yīng)的坐標(biāo)順序?qū)⑿蛄袕男〉酱筮M(jìn)行排序。同樣可以用SAMtools來(lái)進(jìn)行排序。
在前期準(zhǔn)備樣本或建庫(kù)的過(guò)程中,有整體或局部的樣本DNA濃度不達(dá)標(biāo),我們需要對(duì)目標(biāo)序列進(jìn)行PCR擴(kuò)增以達(dá)到測(cè)序濃度要求,因而保持測(cè)序過(guò)程中讀取的DNA片段樣本具有相對(duì)一致的機(jī)會(huì),從而保持整體序列的完整性。然而,PCR反應(yīng)同時(shí)也會(huì)放大原本濃度不低的DNA片段,從而被選擇測(cè)序的機(jī)會(huì)更多。但是,DNA在前期打斷中可能會(huì)引起一些堿基人為變換,PCR擴(kuò)增會(huì)放大信號(hào)從而導(dǎo)致堿基變異假陽(yáng)性率的上升,而PCR本身也會(huì)引起擴(kuò)增錯(cuò)誤,帶來(lái)假陽(yáng)性結(jié)果。并且PCR反應(yīng)也會(huì)對(duì)某一些堿基序列偏向性擴(kuò)增,如果偏向的是參考序列上的堿基序列,可能會(huì)弱化真實(shí)的變異堿基信號(hào)而導(dǎo)致假陰性的產(chǎn)生。因此,我們需要在進(jìn)行變異檢測(cè)之前對(duì)序列進(jìn)行重復(fù)序列的標(biāo)記或去除,減少假陽(yáng)性和假陰性的發(fā)生。這一步我們可以用SAMtools或Picard來(lái)操作。目前的GATK4版本整合了Picard軟件的一系列功能。
數(shù)據(jù)預(yù)處理的最后一步需要對(duì)堿基的質(zhì)量值進(jìn)行校正(base quality score recalibration,BQSR)。堿基的質(zhì)量值是衡量后期變異位點(diǎn)鑒定正確性的重要依據(jù)。上文提到,原始數(shù)據(jù)本身就提供了每個(gè)堿基對(duì)應(yīng)的質(zhì)量值,它來(lái)自測(cè)序圖像數(shù)據(jù)的堿基鑒定。某個(gè)位點(diǎn)前后堿基的種類、測(cè)序儀器、測(cè)序反應(yīng)等都會(huì)影響堿基的質(zhì)量值。測(cè)序儀提供的堿基質(zhì)量值是不完全準(zhǔn)確,存在誤差的,需要進(jìn)行堿基校正。BQSR主要通過(guò)機(jī)器學(xué)習(xí)的方法構(gòu)建測(cè)序堿基的錯(cuò)誤率模型,再對(duì)這些堿基的質(zhì)量值進(jìn)行相應(yīng)的調(diào)整。BQSR主要有兩步:第一步,利用GATK工具里的Base Recalibrator,根據(jù)一些已知的位點(diǎn)數(shù)據(jù)(known sites),計(jì)算生成一個(gè)校正質(zhì)量值所需要的校準(zhǔn)表文件;第二步,利用得到的校準(zhǔn)表文件重新調(diào)整原來(lái)BAM文件中的堿基質(zhì)量值,并使用這個(gè)新的質(zhì)量值重新輸出一份新的BAM文件,使其堿基的質(zhì)量值能夠更加接近真實(shí)的與參考基因組之間錯(cuò)配的概率。
4.變異位點(diǎn)的檢測(cè)
數(shù)據(jù)質(zhì)量控制、過(guò)濾及校正后,我們進(jìn)行遺傳變異位點(diǎn)的鑒定。變異位點(diǎn)的鑒定一般用貝葉斯方法來(lái)計(jì)算,通常是在假設(shè)不同位點(diǎn)相互獨(dú)立,同一位點(diǎn)測(cè)序錯(cuò)誤或比對(duì)誤差相互獨(dú)立的基礎(chǔ)上,利用已知的基因組信息,計(jì)算每個(gè)位點(diǎn)基因型的概率。GATK開(kāi)發(fā)的Haplotype Caller模塊同直接推算位點(diǎn)的概率不一樣,它首先推斷群體基因組上單倍體的組合情況,并計(jì)算各個(gè)組合的概率,再根據(jù)單倍體的概率推算每個(gè)位點(diǎn)的概率,最后用貝葉斯計(jì)算每個(gè)樣本最可能的基因型組合。由于這個(gè)方法在計(jì)算時(shí)同一時(shí)間考慮所有的位點(diǎn),因此在變異鑒定的時(shí)候極少會(huì)因基因組上小結(jié)構(gòu)改變引起堿基錯(cuò)配,從而導(dǎo)致變異檢測(cè)出現(xiàn)錯(cuò)誤。Haplotyper Caller方法是目前最適合用于對(duì)二倍體基因組進(jìn)行變異(SNP+Indel)檢測(cè)的算法。這一步得到一個(gè)變異位點(diǎn)的vcf文件。
5.變異位點(diǎn)過(guò)濾
在獲得原始的變異檢測(cè)結(jié)果之后,我們要做的就是質(zhì)控和過(guò)濾。在變異位點(diǎn)數(shù)足夠多的情況下,我們可以用變量質(zhì)量分?jǐn)?shù) 重 新 校 準(zhǔn)(variant quality score recalibration,VQSR)的方式進(jìn)行質(zhì)控。VQSR根據(jù)機(jī)器學(xué)習(xí)的算法利用自身的數(shù)據(jù)和已知變異位點(diǎn)的數(shù)據(jù)集的交集,通過(guò)GMM模型構(gòu)建一個(gè)分類器來(lái)對(duì)變異數(shù)集進(jìn)行打分,從而評(píng)估每個(gè)位點(diǎn)的可信度。簡(jiǎn)單來(lái)說(shuō),已知變異數(shù)集會(huì)告訴我們?nèi)后w中存在變異的位點(diǎn),由此可以增加該位點(diǎn)在個(gè)體中是真實(shí)位點(diǎn)的可能性。可以從個(gè)體數(shù)據(jù)中篩出和已知位點(diǎn)相同的變異,作為真實(shí)的變異結(jié)果。VQSR可以通過(guò)這個(gè)篩出來(lái)的數(shù)據(jù)作為真實(shí)數(shù)據(jù)來(lái)訓(xùn)練,并構(gòu)建模型。如果變異位點(diǎn)不足夠的情況下,可以人為根據(jù)需要把不滿足閾值的變異位點(diǎn)直接過(guò)濾去除。
6.位點(diǎn)注釋
過(guò)濾后的VCF文件里的變異位點(diǎn)需要進(jìn)行變異類型、變異位置、功能變化、在人群中的頻率等的注釋。注釋的工具最常用的有ANNOVAR、snpEff及VEP等。不同的注釋軟件功能大同小異,在注釋時(shí)可能稍微有差異,因此可以作為臨床解讀的互補(bǔ)文件作為參考。
ANNOVAR由perl編寫(xiě),收集整理了目前最常用的堿基位點(diǎn)信息和頻率數(shù)據(jù)庫(kù)(dbSNP、gnomad、exAC 等)、位點(diǎn)功能預(yù)測(cè)工具(SIFT、CADD 等)、位點(diǎn)解讀信息數(shù)據(jù)庫(kù)(ClinVar等),以及ACMG對(duì)位點(diǎn)解讀的參考標(biāo)準(zhǔn)。同時(shí)提供參考基因組不同版本的下載鏈接,臨床醫(yī)生和科研人員可以根據(jù)不同需求下載對(duì)應(yīng)版本。ANNOVAR主要包含三種不同的注釋方法:基于基因的注釋(gene-based Annotation)揭示變異位點(diǎn)與已知基因直接的關(guān)系及對(duì)其產(chǎn)生的功能性影響,包括在基因上的位置,外顯子上氨基酸功能的變化及具體信息,可以靈活地使用RefSeq基因、UCSC基因、ENSEMBL基因、GENCODE基因或其他基因定義系統(tǒng)進(jìn)行位點(diǎn)基因定位注釋;基于區(qū)域的注釋(region-based annotation)揭示變異位點(diǎn)與不同基因組特定段的關(guān)系,如它是否在保守區(qū),是否落在轉(zhuǎn)錄因子結(jié)合區(qū)域等;基于篩選的注釋(filter-based annotation)則給出一系列變異位點(diǎn)的信息,如是否在指定的數(shù)據(jù)庫(kù),如dbSNP、ExAC、gnomoad等數(shù)據(jù)庫(kù)中報(bào)道過(guò),以及不同的算法對(duì)變異位點(diǎn)注釋的結(jié)果(SIFT/PolyPhen/MetaSVM/CADD等),位點(diǎn)與疾病的關(guān)聯(lián)注釋(ACMG位點(diǎn)解讀指南及ClinVar等)。
snpEff是一款基于 Java語(yǔ)言開(kāi)發(fā)的軟件,它對(duì)變異位點(diǎn)在基因組上的注釋有相對(duì)更詳細(xì)的信息。它根據(jù)基因組不同版本的參考序列給出相應(yīng)變異位點(diǎn)的位置,定義突變類型,對(duì)變異位點(diǎn)進(jìn)行簡(jiǎn)單的功能評(píng)估,給出基因名稱、變異在外顯子上的位置、轉(zhuǎn)錄本類型,變異位點(diǎn)與最近的特征的距離:當(dāng)變異位點(diǎn)位于基因間區(qū)時(shí),會(huì)給出與最近的基因之間的距離;當(dāng)變異位點(diǎn)位于exon區(qū)域時(shí),會(huì)給出與最近的內(nèi)含子邊界的距離。它還能對(duì)注釋結(jié)果的可靠程度進(jìn)行評(píng)估。
VEP是國(guó)際三大數(shù)據(jù)庫(kù)之一的ENSEMBL提供的,它是基于perl語(yǔ)言開(kāi)發(fā)的軟件。跟snpEFF一樣,是對(duì)遺傳變異信息提供更具體的注釋,而不僅是基于位點(diǎn)區(qū)域和基因。
三款軟件對(duì)變異位點(diǎn)的注釋方面都很專業(yè),臨床醫(yī)生或科研人員可以根據(jù)需要選擇不同的軟件進(jìn)行注釋補(bǔ)充。
7.位點(diǎn)解讀
注釋后的文件,我們需要進(jìn)一步的過(guò)濾解讀篩出致病或相關(guān)的變異位點(diǎn)。這一步是結(jié)合臨床問(wèn)題做進(jìn)一步數(shù)據(jù)報(bào)告的關(guān)鍵一步。具體的解讀過(guò)程在上一章節(jié)中有詳細(xì)說(shuō)明,這里簡(jiǎn)單而言,就是需要根據(jù)疾病的發(fā)病率、遺傳特征、臨床表型來(lái)篩選出相關(guān)的致病位點(diǎn)。通常來(lái)說(shuō),成功鑒定臨床相關(guān)基因變異位點(diǎn)的概率為20%~30%。成功率取決于對(duì)疾病之前的遺傳認(rèn)知、詳細(xì)的臨床資料挖掘及家族史的了解。通常,我們會(huì)鑒定出一些意義不明的位點(diǎn)(variants of unknown significance)或功能不明的基因。對(duì)于這些結(jié)果,臨床上是否可以報(bào)道往往很難決定。因此需要專業(yè)人士包括臨床人員、遺傳學(xué)家及基礎(chǔ)科學(xué)家對(duì)潛在的致病位點(diǎn)進(jìn)行有效評(píng)估并進(jìn)行判斷。盡管臨床上對(duì)于意義不明的位點(diǎn)很困擾,但往往很有研究的價(jià)值,有可能為疾病提供了新的致病基因或新的信號(hào)通路。
(二)遺傳大數(shù)據(jù)分析未來(lái)展望
高通量測(cè)序從根本上改變了臨床和科學(xué)研究上遺傳問(wèn)題的范圍和本質(zhì)。隨著技術(shù)的突破及價(jià)格的不斷下降,許多之前未知未診斷的臨床和科研問(wèn)題得以應(yīng)用解決,越來(lái)越多的遺傳數(shù)據(jù)得以累積。然而由于生命的整體性和疾病的復(fù)雜性,病因?qū)W的研究涉及基因、環(huán)境,由此產(chǎn)生的海量數(shù)據(jù)和醫(yī)院信息化迅速發(fā)展累積的其他學(xué)科數(shù)據(jù),如電子病歷、醫(yī)學(xué)影像、醫(yī)療設(shè)備檢測(cè)等數(shù)據(jù),為生命科學(xué)領(lǐng)域帶來(lái)了重大的機(jī)會(huì)和挑戰(zhàn)。未來(lái)的數(shù)據(jù)分析,不僅是基因組上變異位點(diǎn)的分析解讀,還需要結(jié)合不同組學(xué),如蛋白組學(xué)、代謝組學(xué)、宏基因組學(xué)、表觀遺傳學(xué)、藥物組學(xué)的數(shù)據(jù)甚至個(gè)體細(xì)胞水平的分析,利用各種數(shù)據(jù)進(jìn)行綜合分析,網(wǎng)絡(luò)化管理,為疾病的發(fā)生、預(yù)防和治療提供全面、全新的認(rèn)識(shí)。然而,數(shù)據(jù)的不斷累積,需要面臨的問(wèn)題也很多,如如何規(guī)范有效地存儲(chǔ)各種數(shù)據(jù),如何從大數(shù)據(jù)里篩選有用信息,如何快速地處理海量數(shù)據(jù),如何建立合理的模型對(duì)數(shù)據(jù)進(jìn)行分析等。因此,專門(mén)針對(duì)基因組數(shù)據(jù)分析的高性能計(jì)算的需求日益增加,從算法技術(shù)到硬件設(shè)備的要求也在不斷改進(jìn)。把復(fù)雜的分析步驟切割成微服務(wù),部署在商業(yè)或?qū)I(yè)云端,增加每一步的可伸縮性,可以減少世界各地需要進(jìn)行組學(xué)分析的小型實(shí)驗(yàn)室購(gòu)買(mǎi)高性能服務(wù)器搭建分析軟件環(huán)境的壓力,提高分析效率,也是未來(lái)趨勢(shì)之一。另外,對(duì)各類數(shù)據(jù)的處理,需要臨床醫(yī)學(xué)、基礎(chǔ)科學(xué)、遺傳學(xué)、計(jì)算機(jī)專業(yè)的復(fù)合型人才,推動(dòng)計(jì)算科學(xué)和生物科學(xué)的交叉學(xué)科如何更清晰有效地傳遞和報(bào)道這些數(shù)據(jù),如何將數(shù)據(jù)可視化、如何統(tǒng)計(jì)數(shù)據(jù),以什么樣的方式呈現(xiàn)數(shù)據(jù)也是未來(lái)必須要面臨的問(wèn)題。
針對(duì)海量組學(xué)數(shù)據(jù)帶來(lái)的巨大的計(jì)算問(wèn)題,多核學(xué)習(xí)(multiple kernel learning)算法、人工智能、有參模型、無(wú)參模型大數(shù)據(jù)機(jī)器學(xué)習(xí)、統(tǒng)計(jì)建模等技術(shù)不斷被開(kāi)發(fā)利用。未來(lái)利用計(jì)算機(jī),解決多組學(xué)數(shù)據(jù)分析面臨的多維度、數(shù)據(jù)結(jié)構(gòu)復(fù)雜、不完整等問(wèn)題是未來(lái)大數(shù)據(jù)分析極其期待的領(lǐng)域。
二、人工智能、深度學(xué)習(xí)及其臨床應(yīng)用
人工智能(artificial intelligence,AI)是一門(mén)通過(guò)計(jì)算機(jī)系統(tǒng)來(lái)實(shí)現(xiàn)任務(wù)的新興技術(shù),這些任務(wù)既往通常需要人類智慧來(lái)完成。隨著AI軟件與硬件的發(fā)展,尤其是深度學(xué)習(xí)算法和圖形處理單元(graphics processing unit,GPU)的升級(jí),AI在醫(yī)療領(lǐng)域的應(yīng)用引發(fā)了人們的關(guān)注。
AI技術(shù),尤其是深度學(xué)習(xí)技術(shù),具有強(qiáng)大的學(xué)習(xí)能力。深度學(xué)習(xí)技術(shù)是AI的一個(gè)技術(shù)分支,能夠通過(guò)深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)從復(fù)雜龐大的數(shù)據(jù)集中學(xué)習(xí)規(guī)律和特征,對(duì)已由人類進(jìn)行解讀的醫(yī)療數(shù)據(jù)進(jìn)行學(xué)習(xí),處理同一類型的新數(shù)據(jù),從而對(duì)疾病進(jìn)行判斷和預(yù)測(cè)。
在臨床診斷中,AI能夠?qū)υ嫉尼t(yī)療數(shù)據(jù)進(jìn)行高效解讀,并處理多種類型的數(shù)據(jù),因此能運(yùn)用于多種醫(yī)療診斷任務(wù):
(一)計(jì)算機(jī)視覺(jué)
計(jì)算機(jī)視覺(jué)主要用于獲取、處理和分析圖像和/或視頻,主要步驟包括圖像采集、預(yù)處理、特征提取、圖像模式檢測(cè)/分割和分類。計(jì)算機(jī)視覺(jué)可用于處理放射影像和病理圖像,分析腫瘤、視網(wǎng)膜病變、心腦血管病變、脊柱病變和皮膚病變等。在遺傳學(xué)領(lǐng)域中,肺癌組織病理的深度學(xué)習(xí)不僅能夠鑒別腫瘤細(xì)胞及其類型,還能預(yù)測(cè)腫瘤中的體細(xì)胞突變類型;面部圖像識(shí)別可以提取表型特征,辨認(rèn)罕見(jiàn)遺傳疾病并指導(dǎo)分子診斷。
(二)時(shí)間序列分析
時(shí)間序列分析通過(guò)處理時(shí)間數(shù)據(jù)來(lái)對(duì)一系列觀察結(jié)果中的離散狀態(tài)或異常情況進(jìn)行檢測(cè)或預(yù)測(cè),可應(yīng)用于產(chǎn)生連續(xù)輸出信號(hào)的醫(yī)療設(shè)備,如應(yīng)用于心電圖檢測(cè)心臟收縮功能障礙及心房顫動(dòng)等心律失常。任何有序數(shù)據(jù)都可以運(yùn)用時(shí)間序列分析,包括DNA序列:時(shí)間序列算法可用于預(yù)測(cè)選擇性剪接的模式和非編碼DNA的功能。
(三)語(yǔ)音識(shí)別
語(yǔ)音識(shí)別算法能夠提取并處理人聲中的原始聲波,從而識(shí)別語(yǔ)音的語(yǔ)速、音調(diào)、音色、音量等基本元素和情緒變化等更復(fù)雜的特征。語(yǔ)音識(shí)別在檢測(cè)神經(jīng)系統(tǒng)疾病或精神障礙中具有一定潛力,如阿爾茨海默病、帕金森病、重度抑郁癥和創(chuàng)傷后應(yīng)激障礙等。在遺傳學(xué)領(lǐng)域,語(yǔ)音識(shí)別可以檢測(cè)潛在的遺傳疾病,為后續(xù)的檢測(cè)提供線索。
(四)自然語(yǔ)言處理
自然語(yǔ)言處理提取人類語(yǔ)言中的含義,將輸入的文件進(jìn)行轉(zhuǎn)換輸出,轉(zhuǎn)換功能包括語(yǔ)言翻譯、文檔分類、摘要總結(jié)和其他更高級(jí)內(nèi)容的提取。自然語(yǔ)言處理可用于從電子病歷(electronic health record,EHR)中進(jìn)行信息提取,識(shí)別患者臨床特征、疾病診斷、人口統(tǒng)計(jì)學(xué)數(shù)據(jù)和用藥方案等,有助于后續(xù)對(duì)患者療效、預(yù)后、再次入院率或死亡率的預(yù)測(cè)。自然語(yǔ)言處理還可將醫(yī)療術(shù)語(yǔ)轉(zhuǎn)換為更易于非醫(yī)療行業(yè)人士理解的語(yǔ)句,有助于醫(yī)療咨詢和健康教育等的進(jìn)行。如AI機(jī)器人可協(xié)助遺傳咨詢師更好地與咨詢對(duì)象進(jìn)行溝通。結(jié)合基因數(shù)據(jù),自然語(yǔ)言處理能夠用于罕見(jiàn)病的診斷,并有助于以表型為基礎(chǔ)的遺傳分析。
三、人工智能在臨床遺傳學(xué)的臨床應(yīng)用
臨床遺傳學(xué)和精準(zhǔn)醫(yī)學(xué)的實(shí)現(xiàn)以大數(shù)據(jù)為基礎(chǔ),而AI技術(shù)為大數(shù)據(jù)的挖掘分析提供了有力的武器。在臨床遺傳學(xué)中,AI技術(shù)已適用于多個(gè)基因組分析步驟,包括變異識(shí)別、基因組注釋、變異分類和表型基因型匹配等,還有助于解讀表觀遺傳學(xué)研究中的大數(shù)據(jù)。遺傳咨詢中運(yùn)用AI技術(shù)將有助于提高效率、優(yōu)化服務(wù)。
(一)變異識(shí)別
臨床基因組學(xué)中,變異識(shí)別需要有極高的準(zhǔn)確性。標(biāo)準(zhǔn)的變異識(shí)別工具容易因樣品制備、測(cè)序技術(shù)或體細(xì)胞嵌合等因素出現(xiàn)系統(tǒng)錯(cuò)誤。雖然有多種統(tǒng)計(jì)技術(shù)旨在解決這些錯(cuò)誤,但仍存在偏差。AI算法可以通過(guò)學(xué)習(xí)這些偏差來(lái)輸出更準(zhǔn)確的變異識(shí)別。如基于卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)的 AI工具 Deep Variant,在變異識(shí)別任務(wù)中展現(xiàn)出比現(xiàn)有識(shí)別工具更高的精確度。
(二)基因組注釋和變異分類
對(duì)于編碼區(qū)的變異,目前已有多種算法可用于對(duì)非同義突變進(jìn)行注釋和分類。如聯(lián)合注釋依賴耗盡(combined annotation-dependent depletion,CADD)法基于機(jī)器學(xué)習(xí)算法,可將不同的注釋整合到單個(gè)度量中,來(lái)預(yù)測(cè)每個(gè)變異的致病性;在CADD基礎(chǔ)上進(jìn)一步拓展的DANN法基于深度學(xué)習(xí)算法,可以捕獲CADD無(wú)法捕獲的非線性關(guān)系,錯(cuò)誤率也更低。還有一些AI算法可以直接對(duì)DNA序列或蛋白質(zhì)序列數(shù)據(jù)進(jìn)行分析預(yù)測(cè),如Primate AI和 Deep Sequence。Primate AI采用的CNN經(jīng)過(guò)了非人靈長(zhǎng)類種群常見(jiàn)變異數(shù)據(jù)的訓(xùn)練,能夠以88%的準(zhǔn)確性識(shí)別罕見(jiàn)病致病基因,有助于對(duì)意義不明確變異的解讀,在辨別發(fā)育障礙候選基因中的良性和致病性新發(fā)變異時(shí)優(yōu)于其他預(yù)測(cè)工具。Deep Sequence是一種深度生成模型,在預(yù)測(cè)遺傳變異,尤其是復(fù)雜的變異,對(duì)于蛋白質(zhì)功能的影響中具有潛力。
非編碼區(qū)變異的鑒別和預(yù)測(cè)是一個(gè)較大的挑戰(zhàn),AI技術(shù)將有助于我們對(duì)非編碼變異的解讀。Splice AI是一種能夠預(yù)測(cè)mRNA轉(zhuǎn)錄前序列剪接點(diǎn)及引發(fā)剪接的非編碼變異的深度神經(jīng)網(wǎng)絡(luò)。由于DNA片段間復(fù)雜的相互作用,剪接變異通常難以識(shí)別,但Splice AI能夠精準(zhǔn)地進(jìn)行預(yù)測(cè),并有助于罕見(jiàn)遺傳病新發(fā)致病變異的預(yù)測(cè)。深度學(xué)習(xí)算法還能用于檢測(cè)基因組調(diào)控元件,并預(yù)測(cè)遺傳變異對(duì)這些調(diào)控元件的影響。如多任務(wù)分層結(jié)構(gòu)CNN DeepSEA能夠?qū)D(zhuǎn)錄因子結(jié)合位點(diǎn)、DNase超敏位點(diǎn)和遺傳變異對(duì)調(diào)控元件的影響等進(jìn)行預(yù)測(cè),并具有較高的準(zhǔn)確性,可用于孤獨(dú)癥譜系障礙家系的WGS數(shù)據(jù)分析,以尋找候選非編碼變異。
(三)表型-基因型匹配
疾病的分子診斷不僅需要鑒別候選致病變異,還需要確定患病個(gè)體的表型與候選致病變異可能產(chǎn)生的表型之間的對(duì)應(yīng)性。AI技術(shù)能夠通過(guò)提取醫(yī)學(xué)影像和EHR中的信息,來(lái)幫助匹配表型和基因型。
在識(shí)別面部畸形時(shí),醫(yī)務(wù)工作者會(huì)單獨(dú)識(shí)別異常的表型并整合到臨床診斷中,從而指導(dǎo)基因測(cè)序或更全面的遺傳數(shù)據(jù)分析。然而,由于不同的遺傳綜合征可能具有相似的表型,由醫(yī)務(wù)工作者得出的臨床診斷通常不能與分子診斷精確地匹配。而AI技術(shù)則能更精確地進(jìn)行臨床診斷工作?;贑NN的面部圖像分析算法Deep Gestalt量化了數(shù)百種綜合征的相似性,能夠?qū)ζヅ涞酵慌R床診斷的分子診斷進(jìn)行區(qū)分,識(shí)別出疾病亞型。整合Deep Gestalt的基因解讀系統(tǒng)PEDIA還可采用面部相片中提取的表型特征,預(yù)測(cè)單基因疾病的候選致病變異。
在癌癥的診斷中,AI技術(shù)同樣也能發(fā)揮作用。生存卷積神經(jīng)網(wǎng)絡(luò)(survival convolutional neural network,SCNN)可以將自適應(yīng)機(jī)器學(xué)習(xí)算法與傳統(tǒng)的生存模型結(jié)合,并將腫瘤組織學(xué)圖像形態(tài)學(xué)特征與基因組特征整合,從而預(yù)測(cè)膠質(zhì)瘤患者的臨床結(jié)局。AI技術(shù)還能識(shí)別肺癌組織病理學(xué)圖像中的形態(tài)特征,區(qū)分較長(zhǎng)生存期和較短生存期的患者。
AI技術(shù)除了從面部圖像和病理圖像中識(shí)別疾病表型,還擅長(zhǎng)從EHR中的各類記錄或檢測(cè)和檢查指標(biāo)中進(jìn)行識(shí)別工作。AI通過(guò)自然語(yǔ)言處理從EHR中提取臨床特征,模仿醫(yī)師的臨床推理方式,從而生成診斷體系,能夠以92%的精確度鑒別55種常見(jiàn)的兒科疾病診斷。當(dāng)結(jié)合基因解讀系統(tǒng)時(shí),自然語(yǔ)言處理系統(tǒng)能夠自動(dòng)從HER中提取表型描述,并與候選致病變異的表型特征進(jìn)行匹配和排序,實(shí)現(xiàn)快速而準(zhǔn)確的自動(dòng)化診斷,還能識(shí)別出既往無(wú)法判斷的因單個(gè)變異而致病的疾病亞型個(gè)體。
(四)基因型-表型預(yù)測(cè)
從遺傳數(shù)據(jù)中預(yù)測(cè)表型是AI技術(shù)的應(yīng)用之一,如預(yù)測(cè)身高或疾病風(fēng)險(xiǎn)等。深度學(xué)習(xí)可以結(jié)合影像學(xué)、HER和可穿戴設(shè)備數(shù)據(jù)等其他資料,強(qiáng)化表型預(yù)測(cè)模型。從中間的分子入手將更易于對(duì)表型進(jìn)行預(yù)測(cè),如通過(guò)預(yù)測(cè)基因表達(dá)或基因剪接對(duì)應(yīng)的表型,進(jìn)一步進(jìn)行疾病表型預(yù)測(cè)。此外,遺傳數(shù)據(jù)可作為疾病發(fā)生發(fā)展的生物標(biāo)志,但通常需要進(jìn)行復(fù)雜的分析。深度學(xué)習(xí)有助于提高這些生物標(biāo)志的測(cè)定質(zhì)量,如DNA序列、甲基化和基因表達(dá)等。
遺傳學(xué)的最終臨床目的是對(duì)可能發(fā)生的疾病進(jìn)行診斷預(yù)測(cè)和風(fēng)險(xiǎn)估計(jì)。AI技術(shù)能對(duì)多種類型的健康數(shù)據(jù)和危險(xiǎn)因素進(jìn)行整合,將有助于全面分析和預(yù)測(cè)疾病風(fēng)險(xiǎn)。疾病是遺傳、環(huán)境和行為三者相互作用的結(jié)果,結(jié)合遺傳和非遺傳相關(guān)的危險(xiǎn)因素能提高風(fēng)險(xiǎn)預(yù)測(cè)的準(zhǔn)確性,優(yōu)化疾病風(fēng)險(xiǎn)分層。目前的模型僅僅將遺傳和非遺傳因素放入簡(jiǎn)單的相加模型中進(jìn)行整合,并不能捕捉不同危險(xiǎn)因素之間復(fù)雜的因果關(guān)系。AI技術(shù)算法則擅長(zhǎng)分析危險(xiǎn)因素之間的復(fù)雜性,將在未來(lái)具有很好的發(fā)展前景。
(五)表觀遺傳學(xué)
DNA甲基化與腫瘤等疾病發(fā)展相關(guān),能夠反映環(huán)境暴露情況,提高診斷和預(yù)測(cè)的準(zhǔn)確性,并有望成為個(gè)性化治療的靶標(biāo)。監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)是機(jī)器學(xué)習(xí)的兩種形式。監(jiān)督學(xué)習(xí)可以解決回歸和分類問(wèn)題,通過(guò)對(duì)表觀遺傳數(shù)據(jù)的監(jiān)督學(xué)習(xí),可以對(duì)轉(zhuǎn)移性腦腫瘤、前列腺癌、冠心病、神經(jīng)發(fā)育綜合征和中樞神經(jīng)系統(tǒng)腫瘤進(jìn)行分類。而非監(jiān)督學(xué)習(xí)有助于對(duì)帶有大量數(shù)據(jù)點(diǎn)的數(shù)據(jù)集進(jìn)行模式檢測(cè),可以用于檢測(cè)患病個(gè)體和正常個(gè)體的甲基化模式。深度學(xué)習(xí)目前也已被應(yīng)用于對(duì)神經(jīng)膠質(zhì)瘤中的基因突變進(jìn)行分類,并對(duì)單細(xì)胞DNA甲基化狀態(tài)進(jìn)行預(yù)測(cè)。
(六)遺傳咨詢
AI技術(shù)將有助于在患者識(shí)別、風(fēng)險(xiǎn)評(píng)估和輔助診斷等各方面提高遺傳咨詢的工作效率和效力。在遺傳檢測(cè)實(shí)驗(yàn)室中,AI被運(yùn)用于生物信息分析流程中,協(xié)助分析復(fù)雜的表型、評(píng)估基因變異或?qū)蚪M中的新發(fā)現(xiàn)進(jìn)行分類。因此遺傳咨詢師將會(huì)獲得由AI技術(shù)參與分析的遺傳檢測(cè)結(jié)果。AI技術(shù)可以運(yùn)用面部識(shí)別算法對(duì)從面部照片中提取的特征進(jìn)行分析,提供可能的診斷匹配項(xiàng),協(xié)助遺傳醫(yī)師的診斷。機(jī)器學(xué)習(xí)和自然語(yǔ)言處理技術(shù)能夠幫助醫(yī)務(wù)工作者和咨詢者識(shí)別疾病高風(fēng)險(xiǎn)人群,并提供健康教育?;贏I技術(shù)的臨床決策支持系統(tǒng)能夠匯集易感基因信息、藥物批準(zhǔn)情況和診療指南,為乳腺癌的診治提供建議。
風(fēng)險(xiǎn)評(píng)估是遺傳咨詢的重要步驟,有助于識(shí)別高危人群,為臨床決策提供依據(jù)。AI技術(shù)不僅可以協(xié)助咨詢師收集家庭健康信息并進(jìn)行風(fēng)險(xiǎn)評(píng)估,還能將評(píng)估通過(guò)電子郵件發(fā)送給咨詢者、自動(dòng)生成患者文檔、追蹤樣本和進(jìn)行后續(xù)隨訪。
基于自然語(yǔ)言處理算法的聊天機(jī)器人是AI在遺傳咨詢中的另一項(xiàng)應(yīng)用。心理健康領(lǐng)域的研究認(rèn)為,聊天機(jī)器人這一輔助治療模式是可行且能被患者接受的。并且相比于電話溝通,參與者更傾向于與機(jī)器人溝通。在遺傳咨詢領(lǐng)域,目前聊天機(jī)器人被應(yīng)用于回答患者的提問(wèn)并收集信息,以便于預(yù)約后續(xù)與遺傳咨詢師的會(huì)面;或可被應(yīng)用于收集健康信息、構(gòu)建家系圖并進(jìn)行風(fēng)險(xiǎn)評(píng)估。
四、人工智能目前的局限和面臨的挑戰(zhàn)
雖然AI技術(shù)具有強(qiáng)大的處理復(fù)雜數(shù)據(jù)的能力,但當(dāng)應(yīng)用于人類健康數(shù)據(jù)時(shí),受過(guò)訓(xùn)練的AI系統(tǒng)可能導(dǎo)致虛假的、不符合倫理或帶有歧視的結(jié)論。AI算法的開(kāi)發(fā)需要考量許多監(jiān)管和倫理方面的問(wèn)題,這些問(wèn)題涉及用于訓(xùn)練AI算法的數(shù)據(jù)的來(lái)源和隱私、算法本身的透明性和通用性、算法升級(jí)帶來(lái)的數(shù)據(jù)更新的監(jiān)管過(guò)程以及錯(cuò)誤預(yù)測(cè)的責(zé)任歸屬等。如在數(shù)據(jù)來(lái)源方面:開(kāi)發(fā)AI的企業(yè)是否能正確評(píng)估數(shù)據(jù)的使用條件?企業(yè)是否遵守相應(yīng)地區(qū)或運(yùn)用群體所在地區(qū)的數(shù)據(jù)保護(hù)條例?數(shù)據(jù)是否包含遺傳信息等涉及特殊監(jiān)管規(guī)定的敏感信息?在AI產(chǎn)品開(kāi)發(fā)方面:AI訓(xùn)練數(shù)據(jù)是否能準(zhǔn)確代表來(lái)源人群?是否有樣本代表性?開(kāi)發(fā)者是否能解釋算法的邏輯?產(chǎn)品的安全性和有效性是否有證據(jù)支持?在臨床應(yīng)用方面:AI系統(tǒng)的使用是否已告知患者?靶向治療方案是否公平地面向所有的患者?何種監(jiān)控機(jī)制被用于評(píng)估產(chǎn)品的表現(xiàn)情況?當(dāng)發(fā)生預(yù)測(cè)錯(cuò)誤時(shí),由誰(shuí)承擔(dān)責(zé)任?
這些問(wèn)題的解決需要從以下幾個(gè)方面進(jìn)行:
1.透明性
在科技界和醫(yī)療界共享AI模型的各項(xiàng)具體信息,包括源代碼、模型權(quán)重和元圖等。算法內(nèi)在邏輯應(yīng)透明。醫(yī)師本身應(yīng)掌握所使用的AI系統(tǒng)的基本運(yùn)行機(jī)制,才能向患者提供更好的解釋,從而提高AI的可信度和可接受度。AI的自動(dòng)化屬性不能減弱患者的自主權(quán)和決策的參與度。此外,必須明確使用AI發(fā)生的不良事件的責(zé)任歸屬。當(dāng)人工智能決策失誤引發(fā)醫(yī)療糾紛時(shí),錯(cuò)誤的歸責(zé)和法律責(zé)任的歸屬亟須相應(yīng)的法律體系來(lái)規(guī)范。
2.隱私保護(hù)
開(kāi)發(fā)者在數(shù)據(jù)處理的每個(gè)階段都應(yīng)該密切關(guān)注倫理要求和監(jiān)管條例。數(shù)據(jù)的使用和再次使用都應(yīng)該注意數(shù)據(jù)來(lái)源和知情同意。不同的數(shù)據(jù)來(lái)源可能受不同地區(qū)的法律條例保護(hù)。
3.可解釋性
改進(jìn)解讀模式,使得預(yù)測(cè)結(jié)果的解讀易于患者的理解,保護(hù)患者的自主權(quán)和決策權(quán)。在臨床應(yīng)用中,AI系統(tǒng)不僅要回答“是什么”的問(wèn)題,也要提供“為什么”的解釋,從而利于醫(yī)師和患者對(duì)于結(jié)果的理解和對(duì)決策的考量。
4.公平性
應(yīng)加強(qiáng)對(duì)算法偏差的監(jiān)管力度,并開(kāi)發(fā)有助于解決機(jī)器偏差的工具。用于訓(xùn)練和驗(yàn)證AI模型的數(shù)據(jù)應(yīng)符合倫理規(guī)范,避免偏見(jiàn),保證公平性。訓(xùn)練數(shù)據(jù)本身應(yīng)具有樣本代表性,并反映真正無(wú)偏的流行病學(xué)情況。在基因數(shù)據(jù)或其他健康數(shù)據(jù)中,部分子結(jié)構(gòu)是由于危險(xiǎn)因素和健康結(jié)局的不同因果關(guān)系而產(chǎn)生,但部分子結(jié)構(gòu)是因社會(huì)經(jīng)濟(jì)地位、文化習(xí)俗、樣本代表性不足或影響醫(yī)藥資源可獲得性的因素而導(dǎo)致的。因此,在訓(xùn)練AI系統(tǒng)時(shí),應(yīng)注意區(qū)分不同影響因素帶來(lái)的偏倚,從而保證預(yù)測(cè)結(jié)果的公平性。
AI系統(tǒng)在多種醫(yī)療應(yīng)用中展現(xiàn)了令人矚目的性能,部分產(chǎn)品已獲得美國(guó)食品藥品監(jiān)督管理局(Food and Drug Administration,F(xiàn)DA)的批準(zhǔn),中國(guó)AI產(chǎn)品的相關(guān)政策制定和注冊(cè)審批也在逐步實(shí)現(xiàn)突破?;蚪M數(shù)據(jù)等大數(shù)據(jù)集的不斷涌現(xiàn),加上AI算法及GPU系統(tǒng)的升級(jí),推動(dòng)著AI技術(shù)的不斷進(jìn)步。卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)適用于臨床遺傳學(xué)的多項(xiàng)工作。目前,在臨床遺傳學(xué)中最具有前景的AI應(yīng)用,是從圖像、EHR或其他醫(yī)療資源中提取表型信息,指導(dǎo)后續(xù)的遺傳分析。除此之外,AI的重要遺傳學(xué)應(yīng)用還包括變異識(shí)別、基因組注釋、變異分類和變異功能影響預(yù)測(cè)。測(cè)序技術(shù)的發(fā)展使得基因組數(shù)據(jù)得以大規(guī)模生成,但未來(lái)仍需要積累大量表型數(shù)據(jù),使AI技術(shù)能在臨床遺傳學(xué)中有更廣泛深入的應(yīng)用。最后,完善AI技術(shù)的透明性、可解釋性、公平性和隱私保護(hù)問(wèn)題將有助于提高AI技術(shù)的可接受度和信任度,擴(kuò)大其應(yīng)用范圍。
(余 嵐)
- 小兒頭顱畸形與健康
- 常見(jiàn)出生缺陷防治學(xué)習(xí)指導(dǎo)及習(xí)題集
- 兒童健康好幫手:兒童骨科矯形與創(chuàng)傷外科疾病分冊(cè)
- 小兒呼吸系統(tǒng)疑難重癥病例解析
- 新生兒基因篩查
- 兒童健康好幫手:兒童眼科疾病分冊(cè)
- 康復(fù)治療師臨床工作指南:兒童疾患物理治療技術(shù)
- 基層兒科常見(jiàn)癥狀與疾病
- 兒童糖尿病家庭管理
- 兒科學(xué)TBL教程
- 早產(chǎn)兒母乳喂養(yǎng)
- 兒童發(fā)育遲緩居家康復(fù)指導(dǎo)
- 兒科危重病癥防治手冊(cè)
- 癲癇兒的療育
- 北京兒童醫(yī)院診療常規(guī):口腔科診療常規(guī)(第2版)