- 模型思維:簡(jiǎn)化世界的人工智能模型
- 龔才春
- 1634字
- 2021-06-10 20:06:18
前言
讓人又愛(ài)又恨的模型
對(duì)從事算法研究與算法開(kāi)發(fā)的人來(lái)說(shuō),模型的學(xué)習(xí)與使用必不可少。尤其是在目前備受關(guān)注的人工智能領(lǐng)域里,人人談模型,新模型也是層出不窮,讓人眼花繚亂。
模型讓人又愛(ài)又恨:可愛(ài)的地方在于它確實(shí)能夠解決我們的實(shí)際問(wèn)題,而且其有效性一般都經(jīng)過(guò)了檢驗(yàn);可恨的地方在于學(xué)習(xí)它是一件非常痛苦的事情,尤其是對(duì)人工智能領(lǐng)域的初學(xué)者來(lái)說(shuō)。
筆者自2001年開(kāi)始從事光學(xué)字符識(shí)別的研究,2004年以后從事自然語(yǔ)言處理的研究,算是國(guó)內(nèi)人工智能行業(yè)中的“老鳥(niǎo)”了。在多年的學(xué)術(shù)研究和產(chǎn)業(yè)落地推進(jìn)的過(guò)程中,筆者認(rèn)為模型的學(xué)習(xí)是最讓人頭疼的事情。在攻讀博士學(xué)位的過(guò)程中,筆者經(jīng)常發(fā)現(xiàn):自己花了很大工夫,終于對(duì)某個(gè)模型有了初步的理解,忽然有同學(xué)說(shuō)他又看到另一個(gè)更好的模型……筆者覺(jué)得學(xué)習(xí)模型就像玩打地鼠游戲,這個(gè)洞里冒出來(lái)一只地鼠,你剛打下去,另一個(gè)洞里又冒出新的地鼠。打地鼠的速度總是跟不上地鼠冒出來(lái)的速度。筆者在學(xué)習(xí)累了的時(shí)候,就會(huì)產(chǎn)生一堆奇怪的疑問(wèn):到底什么是模型?為什么那些“大牛”提出的任何想法都能成為模型?到底多厲害的人提出的想法才能成為模型?如果沒(méi)有這些“大牛”,那么我們的學(xué)習(xí)是不是就不會(huì)這么累了?有沒(méi)有一本書(shū)可以把所有模型都介紹清楚?如果沒(méi)有,那么有沒(méi)有一本書(shū)可以把人工智能領(lǐng)域中常見(jiàn)的模型都介紹清楚?
久病成醫(yī),降低模型的學(xué)習(xí)難度
2018年,筆者創(chuàng)業(yè)失敗,重新回到職場(chǎng),此時(shí)面臨的第一個(gè)問(wèn)題就是向團(tuán)隊(duì)中相對(duì)年輕的同事介紹自然語(yǔ)言處理技術(shù)。于是筆者萌生了整理各類人工智能模型的念頭。筆者并不是什么模型領(lǐng)域中的“大牛”,也沒(méi)有提出過(guò)什么靠譜的模型。筆者只是想把在近20年的模型學(xué)習(xí)過(guò)程中的痛苦進(jìn)行沉淀和總結(jié),也算是痛定思痛吧。筆者的許多朋友在看了本書(shū)的樣稿后,都以為筆者對(duì)模型頗有研究,而筆者都會(huì)自我調(diào)侃:筆者不是職業(yè)的醫(yī)生,只是久病成醫(yī)而已。
筆者在閱讀大量前輩的作品及大量的網(wǎng)絡(luò)技術(shù)文檔后發(fā)現(xiàn),前輩們都博覽群書(shū),理論功底深厚,數(shù)學(xué)基礎(chǔ)扎實(shí),因此他們的作品中都有大量的公式推導(dǎo)和理論證明。這些都是筆者的弱項(xiàng)。于是,筆者又產(chǎn)生了“久病成醫(yī)”的聯(lián)想:既然筆者的理論水平欠缺,數(shù)學(xué)基礎(chǔ)不牢,那么或許還有許多人工智能的初學(xué)者跟筆者一樣。于是,筆者在寫(xiě)作本書(shū)時(shí),盡量更多地結(jié)合模型的使用場(chǎng)景,更多地介紹實(shí)際業(yè)務(wù)需求之間的關(guān)系,更多地采用生活中淺顯易懂的例子。這樣一方面可以彌補(bǔ)筆者在理論功底方面的欠缺,另一方面可以方便人工智能領(lǐng)域的初學(xué)者學(xué)習(xí)模型。
網(wǎng)絡(luò)中的許多技術(shù)文檔經(jīng)常會(huì)出現(xiàn)公式顯示異常、圖片丟失、格式混亂的情況,這也增加了初學(xué)者學(xué)習(xí)模型的難度。筆者認(rèn)為:大篇幅的文字描述,在很多情況下不如一張示意圖生動(dòng);高深的專業(yè)術(shù)語(yǔ)和技術(shù)原理,在很多情況下不如與生活中的場(chǎng)景做類比淺顯;復(fù)雜的公式計(jì)算與理論推導(dǎo),在很多情況下不如舉一個(gè)實(shí)際例子計(jì)算一遍更直觀。因此,筆者在本書(shū)中列舉大量的人工智能場(chǎng)景中的真實(shí)案例,將許多現(xiàn)實(shí)生活中的場(chǎng)景與高深的模型進(jìn)行類比,希望可以降低讀者的理解難度。
筆者試圖將人工智能在現(xiàn)實(shí)生活場(chǎng)景中解決的問(wèn)題分類,并根據(jù)這個(gè)分類來(lái)介紹各種模型。本書(shū)將人工智能問(wèn)題分為權(quán)重問(wèn)題、狀態(tài)問(wèn)題、序列問(wèn)題、表示問(wèn)題、相似問(wèn)題和分類問(wèn)題六大類,方便讀者了解各個(gè)模型之間的關(guān)系,也方便讀者理解各個(gè)模型的適用場(chǎng)景。當(dāng)然,這個(gè)分類體系只是筆者的一家之言,并不一定是最科學(xué)的方法。筆者權(quán)且以本書(shū)拋磚引玉,期待人工智能行業(yè)的專家的批評(píng)與指正。
模型日新月異,許多模型在本書(shū)中還未來(lái)得及介紹,如深度學(xué)習(xí)中的許多優(yōu)秀模型、自然語(yǔ)言處理中的許多模型等。雖然筆者非常認(rèn)真地寫(xiě)作本書(shū),但由于水平有限,經(jīng)驗(yàn)欠缺,對(duì)許多模型的理解還不夠到位,書(shū)中一定還有許多錯(cuò)誤或紕漏之處。懇請(qǐng)同行多多給予批評(píng)與指導(dǎo),懇請(qǐng)讀者多提寶貴意見(jiàn)與建議。
致謝
感謝白碩老師、劉群老師、王斌老師對(duì)本書(shū)的指導(dǎo),感謝電子工業(yè)出版社的編輯王靜、吳宏偉、石倩、白濤的辛勤工作。
說(shuō)明
為方便讀者學(xué)習(xí),書(shū)中所涉及的參考文獻(xiàn)請(qǐng)掃描本書(shū)讀者服務(wù)二維碼獲取(見(jiàn)本書(shū)封底)。
作者
- 機(jī)器學(xué)習(xí):Python實(shí)踐
- 人工智能改變世界:走向社會(huì)的機(jī)器人
- 機(jī)器學(xué)習(xí)算法評(píng)估實(shí)戰(zhàn)
- 機(jī)器學(xué)習(xí)
- 模式識(shí)別與智能計(jì)算:Matlab技術(shù)實(shí)現(xiàn)(第2版)
- 人工智能:從科幻中復(fù)活的機(jī)器人革命
- AI繁榮
- 人工智能視域下機(jī)器學(xué)習(xí)在教育研究中的應(yīng)用
- 開(kāi)啟AI新紀(jì)元(全2冊(cè))
- 樂(lè)高創(chuàng)意機(jī)器人教程(初級(jí) 上冊(cè) 6-12歲)
- 深度學(xué)習(xí)高手筆記(卷2):經(jīng)典應(yīng)用
- 人工智能導(dǎo)論
- 智能簡(jiǎn)史:從大爆炸到元宇宙
- AIGC提示詞美學(xué)定義
- 機(jī)器人操作中的力學(xué)原理