- 大模型入門:技術(shù)原理與實(shí)戰(zhàn)應(yīng)用
- 程絮森等編著
- 1983字
- 2024-06-21 21:31:26
前言
幾年前,我受北京大學(xué)光華管理學(xué)院領(lǐng)導(dǎo)的委托,負(fù)責(zé)籌劃學(xué)院的商業(yè)分析專業(yè)碩士項(xiàng)目。為此,我請團(tuán)隊(duì)成員幫忙從互聯(lián)網(wǎng)上爬取了幾十萬份與數(shù)據(jù)分析相關(guān)的招聘簡章,并對其中需要的專業(yè)技能做了粗糙分析,然后將這些技能需求與現(xiàn)有的各個(gè)高等院校相關(guān)專業(yè)的教學(xué)大綱做了簡單對比。我們從中很容易可以看到,商業(yè)分析專業(yè)的教學(xué)課程設(shè)置存在較大問題。例如,關(guān)于人工智能相關(guān)課程設(shè)置的問題:一方面,市場對該領(lǐng)域人才具有巨大需求;另一方面,由于院校師資力量匱乏導(dǎo)致課程開設(shè)困難。而課程開設(shè)困難的另一個(gè)重要原因就是缺少相關(guān)教材,尤其是缺乏簡單易懂、容易上手的教材。
如果想要使該項(xiàng)目能為同學(xué)們提供一流的、前瞻性的教育,該專業(yè)就必須開設(shè)與人工智能相關(guān)的課程。從技術(shù)實(shí)施角度看,與人工智能相關(guān)的課程至少有兩個(gè):一個(gè)是機(jī)器學(xué)習(xí),另一個(gè)是深度學(xué)習(xí)。開設(shè)與機(jī)器學(xué)習(xí)相關(guān)的課程相對容易,因?yàn)檫@個(gè)學(xué)科歷史悠久,理論豐富、完備,師資儲備也相對充足。但是,開設(shè)與深度學(xué)習(xí)相關(guān)的課程就比較困難:一是國內(nèi)相關(guān)領(lǐng)域的學(xué)者較少,各個(gè)大學(xué)的師資儲備較為薄弱;二是這些領(lǐng)域的學(xué)者和教師大都集中在計(jì)算機(jī)學(xué)院、大數(shù)據(jù)學(xué)院、數(shù)學(xué)學(xué)院、統(tǒng)計(jì)學(xué)院等理工科學(xué)院,這些學(xué)院的學(xué)生群體都具有理工科背景,教師即使使用相對傳統(tǒng)的教學(xué)方法也能達(dá)到良好的教學(xué)效果。然而,商業(yè)分析專業(yè)碩士項(xiàng)目面對的學(xué)生群體較為復(fù)雜,他們中的一部分人具有理工科背景,而另一部分人具有偏文科背景(如管理學(xué)、經(jīng)濟(jì)學(xué)、文學(xué)等),這些具有文科背景的同學(xué)也是商業(yè)分析專業(yè)碩士項(xiàng)目非常重要的學(xué)生群體,他們有著獨(dú)特的跨領(lǐng)域優(yōu)勢。如果這部分學(xué)生群體也能快速上手深度學(xué)習(xí),入門人工智能這一關(guān)鍵技術(shù),我相信他們肯定會為相關(guān)的應(yīng)用領(lǐng)域帶來豐富多彩的可能性,這也是多學(xué)科交融的魅力所在!但是,要學(xué)習(xí)深度學(xué)習(xí)就必須要用GPU,而調(diào)用GPU必須通過TensorFlow或者PyTorch完成。并且,任何一個(gè)編程框架都最好要有一定的Python基礎(chǔ)。為了解決這個(gè)問題,北京大學(xué)光華管理學(xué)院的商業(yè)分析專業(yè)碩士項(xiàng)目為同學(xué)們準(zhǔn)備了有關(guān)Python的前期課程,使Python基礎(chǔ)學(xué)習(xí)不再是難事。除了商業(yè)分析專業(yè)碩士外,光華管理學(xué)院中還有很多MBA同學(xué)也想學(xué)習(xí)深度學(xué)習(xí),他們中的大多數(shù)人沒有任何Python基礎(chǔ),但也想通過學(xué)習(xí)這門課程,結(jié)合自己的工作經(jīng)歷思考如何在各種合適的商業(yè)場景下開拓人工智能應(yīng)用的新領(lǐng)域。如何照顧這部分同學(xué)的需求,讓他們也能享受深度學(xué)習(xí)的快樂,是值得我深思熟慮的問題。
基于以上原因,我下決心不僅要教這門課,還要寫一本大家都能看懂、都能上手的關(guān)于深度學(xué)習(xí)的教材。但是,到底怎么學(xué),怎么開發(fā)課程,怎么編寫教材,我一開始真是一籌莫展。后來,在日本麻將平臺上用深度學(xué)習(xí)算法打麻將的陳昱、北大信息科學(xué)學(xué)院的孫本元、中國人民大學(xué)統(tǒng)計(jì)學(xué)院的朱映秋等團(tuán)隊(duì)伙伴的幫助下,我終于收集到開發(fā)此課程所需的所有案例,并使案例中的所有代碼都可以在Jupyter Notebook中實(shí)現(xiàn)。另外,我還對每一段代碼做了詳細(xì)的語音講解,并將其一并加載在Jupyter Notebook里。之后,我將音頻和PPT進(jìn)一步整合,制作成教學(xué)視頻,這些教學(xué)視頻已被狗熊會的慕課平臺收錄。
通過開發(fā)以上提到的案例,我們團(tuán)隊(duì)里有20多人都可以上手深度學(xué)習(xí)了,大家都能寫基于Keras的代碼了,這給了我很大的信心,并嘗試在2019年開課。第一次開課是給我們的MBA項(xiàng)目授課,面對專業(yè)背景不同的40多名同學(xué),整個(gè)學(xué)習(xí)過程很辛苦,但同學(xué)們確實(shí)學(xué)到了很多東西,收獲滿滿!可是,還有一個(gè)最大遺憾就是沒有教材!很幸運(yùn)的是,這時(shí)一直對深度學(xué)習(xí)具有極大興趣的周靜老師,愿意將我錄制的音頻轉(zhuǎn)化成規(guī)范的文字,并在此基礎(chǔ)上豐富理論基礎(chǔ),最后整理成適合作為教材的內(nèi)容。
本書是整個(gè)團(tuán)隊(duì)集體努力的結(jié)果,有來自北京大學(xué)、中國人民大學(xué)、中央財(cái)經(jīng)大學(xué)等多個(gè)院校的老師、同學(xué)付出的心血。沒有一個(gè)強(qiáng)大的團(tuán)隊(duì)支撐,我是無法完成這個(gè)艱巨任務(wù)的。本書的寫作邏輯與一般的深度學(xué)習(xí)教材不同。首先強(qiáng)調(diào)一點(diǎn),深度學(xué)習(xí)仍然是一個(gè)關(guān)于x和y的回歸分析問題。但是,它獨(dú)特的地方在于,這里的x常常是高度非結(jié)構(gòu)化的數(shù)據(jù)(如圖像、文本)。在這個(gè)框架結(jié)構(gòu)下,我們嘗試去建立深度學(xué)習(xí)與普通回歸分析的親密聯(lián)系,希望由此降低同學(xué)們學(xué)習(xí)的難度。從這里出發(fā),同學(xué)們可以學(xué)習(xí)TensorFlow、Keras,學(xué)習(xí)如何在它們的幫助下完成線性回歸、邏輯回歸;接著,再學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)、各種關(guān)鍵技術(shù)和各種有趣的應(yīng)用。通過以上的學(xué)習(xí)方式,我們嘗試在降低學(xué)習(xí)難度的同時(shí),提高同學(xué)們的學(xué)習(xí)效果。
本書的完成要特別感謝周靜老師,感謝她的接力支持。參與本書編寫的成員還有(按姓名拼音順序):常象宇、陳昱、黃丹陽、劉進(jìn)、魯偉、馬瑩瑩、潘文耕、潘蕊、任圖南、孫本元、王菲菲、許可、朱雪寧、朱映秋。此外,還要感謝在書稿整理過程中付出辛苦勞動的高天辰、漆岱峰、向悅、謝貝妮等同學(xué)。最后,我想把這本書獻(xiàn)給狗熊會的研究團(tuán)隊(duì),是你們強(qiáng)有力的支持,我才完成了一個(gè)又一個(gè)看似不可能的任務(wù);是你們的支持,我才具備了讓數(shù)據(jù)科學(xué)教學(xué)變得更加有趣的能力。
- 物聯(lián)網(wǎng)射頻識別(RFID)技術(shù)與應(yīng)用
- DevSecOps企業(yè)級實(shí)踐:理念、技術(shù)與案例
- 數(shù)字化轉(zhuǎn)型架構(gòu):方法論與云原生實(shí)踐
- 百度SEO一本通
- 大模型入門:技術(shù)原理與實(shí)戰(zhàn)應(yīng)用
- 從隱秩序到顯規(guī)則:工程體系基于V++規(guī)則引擎的生態(tài)演進(jìn)
- 軟件開發(fā)大講堂·從入門到精通-第一輯(套裝共5冊)
- 36個(gè)創(chuàng)意電子小制作:安全衛(wèi)士
- 測試開發(fā)實(shí)戰(zhàn)教程
- MATLAB函數(shù)速查手冊(修訂版)
- Google Android開發(fā)入門與實(shí)戰(zhàn)
- C#從入門到精通(第2版)
- PHP與MySQL高性能應(yīng)用開發(fā)
- IEC算法及其在多目標(biāo)優(yōu)化中的應(yīng)用
- 區(qū)塊鏈:交易系統(tǒng)開發(fā)指南