- 深度醫療
- (美)埃里克·托普
- 969字
- 2020-11-12 12:11:42
深度學習有潛力“馴服”數據爆炸
人工智能正滲入我們生活的方方面面。從打字時的自動單詞補全功能,到自動搜索建議功能和基于播放歷史的歌單推薦功能,再到人工智能Alexa問答互動和智能關燈功能,人工智能已活躍在我們的日常生活中。人工智能的起源可以追溯到80多年前,它得名于20世紀50年代,但直到最近,它的潛力才得到醫學界的關注。人工智能在醫療領域中的應用包括:提供個人醫療數據的復雜全景圖、優化醫療決策、減少誤診和過度醫療操作等失誤、幫助梳理和解讀相應的檢查、推薦治療方案等,而這些應用都是由數據驅動的。我們正處于大數據時代:全世界每年都會生成澤字節(ZB)(1)的數據。在醫療領域,大數據集表現為:全基因組序列、高分辨率圖像、可穿戴設備的連續數據輸出等形式。雖然數據不斷涌現,但我們至今所處理的只是其中很小的一部分,估計連5%都不到。從某種意義上來說,在此之前,這些收集來的數據一直都整裝待發,卻無用武之地。而人工智能的進步正在融合、發揮大數據的作用,并逐漸“馴服”這種肆無忌憚的數據增長態勢。
人工智能有許多分支。傳統機器學習包括邏輯回歸、貝葉斯網絡、隨機森林(2)、支持向量機(3)、專家系統,以及許多其他數據分析工具。其中,貝葉斯網絡是一種提供概率的模型。假設有一位患者,基于其癥狀,通過這一模型就可以生成診斷列表以及每種診斷的可能性。有趣的是,在20世紀90年代,我們用收集來的數據做了分類回歸樹,讓數據進入“自動分析”模式,從而消除了人類對數據解讀產生的偏差,當時我們還沒有使用“機器學習”這一術語。而如今,這一模式的數據分析能力已經有了顯著提高,并得到了認可。近年來,人工智能工具已經擴展到深度學習和強化學習等深層網絡模型。
2012年,一篇關于圖像識別的經典論文發表之后,人工智能的分支之一——深度學習,開始展現其非凡的發展勢頭。2
新的人工智能深度學習的算法數量和出版物數量激增(見圖1-1),基于大型數據集模式的機器識別呈指數級增長。人工智能訓練中每天運算的千萬億次浮點運算(每秒1015浮點運算速度)增長了30萬倍,這進一步反映了自2012年以來人工智能的變化(見圖1-2)。

圖1-1 基于深度學習的人工智能算法數量和出版物數量增長情況
資料來源:左圖改編自A. Mislove,“To Understand Digital Advertising, Study Its Algorithms,”Economist (2018);右圖改編自C. Mims,“Should Artificial Intelligence Copy the Human Brain?”Wall Street Journal (2018)。

圖1-2 人工智能訓練的最快運算速度增長情況
資料來源:D.Hernandez and D.Amodei,“AI and Compute,”OpenAI (2018)。