- 智能計算系統:從深度學習到大模型
- 陳云霽等編著
- 2255字
- 2024-11-13 10:37:45
序言一
未來20年或更長的時期內,人工智能將是科學技術和經濟發展的重要方向,智能化技術有可能觸發新一輪經濟長波甚至第四次產業革命。世界各國都制定了發展人工智能技術和產業的長期規劃,在這些規劃中,適應智能化社會需求的人才培養都已被列為一項艱巨而緊迫的任務。
由于巨大的市場潛力和國家高技術研究發展計劃(863計劃)等國家科技計劃形成的長期科研積累,我國的人工智能應用和算法研究走在世界前列。但是,我國人工智能基礎層、技術層和應用層的人才數量占比分別為3.3%、34.9%和61.8%,基礎層人才比例嚴重偏低。這種現狀是我國計算機領域長期不重視系統教育造成的。
我國近千所大學設立了計算機專業,近年來有上百所高校創辦了人工智能專業。由于缺乏師資力量和合適的教材,目前一些學校的人工智能課程重點教授流行的機器學習算法和圖像處理等應用,培養出來的學士、碩士和博士只會用算法調參數,并不真正理解人工智能應用到底是怎樣運轉起來的。對于人工智能算法究竟如何調用編程框架、編程框架如何與操作系統打交道、編程框架中的算子在芯片中如何運行,很多學生并沒有清晰且全面的理解。缺乏系統知識和系統思維,學到的知識點就是零碎的,沒有打通“任督二脈”。學生畢業后參加實際工作,懂不懂系統知識帶來的工作成效差別巨大。同樣一個程序,一個普通的程序員來寫和一個懂體系結構的程序員來寫,性能可能差幾萬倍。
中國科學院計算技術研究所從1956年成立起就一直從事計算機系統研究。1990年依托中科院計算所成立的國家智能計算機研究開發中心繼承了計算所的學術傳統,既做系統結構研究,又做人工智能理論、算法和應用研究。陳云霽、陳天石研究員領導的團隊研制的“寒武紀”智能芯片就是在這樣的環境中孕育出來的??吹絿鴥热斯ぶ悄芟到y人才十分短缺的現狀,陳云霽研究員主動請纓,2018年在中國科學院大學率先主講了“智能計算系統”課程,后來又在北京大學、北京航空航天大學、天津大學、中國科學技術大學、南開大學、北京理工大學、華中科技大學等高校獨立或聯合開設了同樣的課程。2019年8月他辦了一次導教班,全國40多所高校的60多位老師參加了這次導教班。他的“智能計算系統”課程受到老師和學生的普遍歡迎。經過兩年的打磨,這門課的內容已基本成熟。中科院計算所智能處理器研究中心多位同人努力將講課的錄音整理成文字,形成了這本書。
一個完整的智能計算系統涉及芯片、系統結構、編程環境、軟件等諸多方面,內容十分龐雜,要在一個學期講完所有的內容十分困難。這本書采用“應用驅動,全棧貫通”的原則,以“圖像風格遷移”這一具體的智能應用為牽引,對智能計算系統各層軟硬件技術棧的奧妙和聯系進行精確、扼要的介紹,使學生對系統全貌有深刻印象,達到舉一反三、觸類旁通的效果。
人工智能過去不是大學教育的必修課,培養人工智能專業的人才需要本科教育再加3~6年時間的碩士或博士教育。目前阻礙人工智能在各個行業落地的因素之一是人員成本太高,加速培養研究生只是解決困難的路徑之一,但不能從根本上解決問題。對任何行業而言,技術人才的構成都是金字塔結構,而構成金字塔底層的技術人員主力應該是大學畢業生。因此,如何讓大學畢業生在推廣智能應用中發揮重要作用是本科教育應該考慮的問題。中國科學院大學啟動了一個計劃,讓本科生在全開源的EDA工具鏈上設計出開源處理器芯片并完成流片,實現帶著自己設計的芯片畢業的夢想。這本書的初衷也是希望能培養更多懂智能計算系統的本科生,加速彌補人工智能的人才缺口。由于我國系統結構方向的師資力量較薄弱,也許很多學校一開始會將這本書作為研究生教材。希望通過大規模教學實踐的檢驗,這本書能進一步修改完善,成為一本廣泛采用的高年級本科生教材。
互聯網服務業的發展得益于開源軟件和公共開發平臺,豐富的網絡軟件開發工具使得開發互聯網App成為一件輕松的事情。同樣,提供容易掌握的成套抽象化工具,可以大幅度降低人工智能的應用人才門檻。這本書除了講述深度學習等智能算法和加速處理器外,特別用了兩章篇幅詳細闡述編程框架的使用和機理。所謂編程框架可以從兩方面來理解:一方面將算法中的常用操作(如卷積、池化等)封裝成“算子”,方便程序員直接調用;另一方面像操作系統一樣,作為軟硬件的界面,起到承上啟下的作用。目前,我國的技術人員使用的編程框架基本上都是外國公司提供的開源軟件,使用最多的是Google公司開發的TensorFlow。從長遠來講,如果中國的技術人員離不開外國公司的編程框架等開發平臺,智能產業的發展一定不平衡、不協調。會用編程框架和會自己寫編程框架是差別懸殊的兩種本領。希望通過本課程的教學,中國能培養出可以自己創立編程框架的研發隊伍,為技術領先、有市場競爭力的人工智能開源平臺貢獻中國力量。
陳云霽研究員不但善于做基礎研究,寫了不少引領世界潮流的高水平論文,而且長期從事芯片設計工作,有豐富的工程實踐經驗。他主持編寫的這本書具有理論與實踐相結合的特點。這本書不但每一章都有從實踐中總結出來的習題,而且專門安排了一個大實驗,要學完本課程的學生實際動手開發一個能完成圖像風格遷移(如把一幅風景照片轉換成梵高風格的畫)的簡單智能計算系統。國外一流大學的計算機系統課程都有較多的課程實驗,中國科學院大學開設的操作系統等課程也配有大量的實驗內容,學生反映做實驗的收獲很大?!凹埳系脕斫K覺淺,絕知此事要躬行?!庇嬎銠C系統方面的課程如果停留在“紙上談兵”,學生學到的知識往往是空洞的名詞術語,畢業后仍然會“眼高手低”。希望采用這本書作為教材的學校盡量創造條件,讓學生有動手做實驗的機會。
李國杰 中國工程院院士
2019年12月