書(shū)名：模型思維：簡(jiǎn)化世界的人工智能模型
作者名：龔才春
本章字?jǐn)?shù)： 1634字
更新時(shí)間： 2021-06-10 20:06:18

前言

讓人又愛(ài)又恨的模型

對(duì)從事算法研究與算法開(kāi)發(fā)的人來(lái)說(shuō)，模型的學(xué)習(xí)與使用必不可少。尤其是在目前備受關(guān)注的人工智能領(lǐng)域里，人人談模型，新模型也是層出不窮，讓人眼花繚亂。

模型讓人又愛(ài)又恨：可愛(ài)的地方在于它確實(shí)能夠解決我們的實(shí)際問(wèn)題，而且其有效性一般都經(jīng)過(guò)了檢驗(yàn)；可恨的地方在于學(xué)習(xí)它是一件非常痛苦的事情，尤其是對(duì)人工智能領(lǐng)域的初學(xué)者來(lái)說(shuō)。

筆者自2001年開(kāi)始從事光學(xué)字符識(shí)別的研究，2004年以后從事自然語(yǔ)言處理的研究，算是國(guó)內(nèi)人工智能行業(yè)中的“老鳥(niǎo)”了。在多年的學(xué)術(shù)研究和產(chǎn)業(yè)落地推進(jìn)的過(guò)程中，筆者認(rèn)為模型的學(xué)習(xí)是最讓人頭疼的事情。在攻讀博士學(xué)位的過(guò)程中，筆者經(jīng)常發(fā)現(xiàn)：自己花了很大工夫，終于對(duì)某個(gè)模型有了初步的理解，忽然有同學(xué)說(shuō)他又看到另一個(gè)更好的模型……筆者覺(jué)得學(xué)習(xí)模型就像玩打地鼠游戲，這個(gè)洞里冒出來(lái)一只地鼠，你剛打下去，另一個(gè)洞里又冒出新的地鼠。打地鼠的速度總是跟不上地鼠冒出來(lái)的速度。筆者在學(xué)習(xí)累了的時(shí)候，就會(huì)產(chǎn)生一堆奇怪的疑問(wèn)：到底什么是模型？為什么那些“大牛”提出的任何想法都能成為模型？到底多厲害的人提出的想法才能成為模型？如果沒(méi)有這些“大牛”，那么我們的學(xué)習(xí)是不是就不會(huì)這么累了？有沒(méi)有一本書(shū)可以把所有模型都介紹清楚？如果沒(méi)有，那么有沒(méi)有一本書(shū)可以把人工智能領(lǐng)域中常見(jiàn)的模型都介紹清楚？

久病成醫(yī)，降低模型的學(xué)習(xí)難度

2018年，筆者創(chuàng)業(yè)失敗，重新回到職場(chǎng)，此時(shí)面臨的第一個(gè)問(wèn)題就是向團(tuán)隊(duì)中相對(duì)年輕的同事介紹自然語(yǔ)言處理技術(shù)。于是筆者萌生了整理各類人工智能模型的念頭。筆者并不是什么模型領(lǐng)域中的“大牛”，也沒(méi)有提出過(guò)什么靠譜的模型。筆者只是想把在近20年的模型學(xué)習(xí)過(guò)程中的痛苦進(jìn)行沉淀和總結(jié)，也算是痛定思痛吧。筆者的許多朋友在看了本書(shū)的樣稿后，都以為筆者對(duì)模型頗有研究，而筆者都會(huì)自我調(diào)侃：筆者不是職業(yè)的醫(yī)生，只是久病成醫(yī)而已。

筆者在閱讀大量前輩的作品及大量的網(wǎng)絡(luò)技術(shù)文檔后發(fā)現(xiàn)，前輩們都博覽群書(shū)，理論功底深厚，數(shù)學(xué)基礎(chǔ)扎實(shí)，因此他們的作品中都有大量的公式推導(dǎo)和理論證明。這些都是筆者的弱項(xiàng)。于是，筆者又產(chǎn)生了“久病成醫(yī)”的聯(lián)想：既然筆者的理論水平欠缺，數(shù)學(xué)基礎(chǔ)不牢，那么或許還有許多人工智能的初學(xué)者跟筆者一樣。于是，筆者在寫(xiě)作本書(shū)時(shí)，盡量更多地結(jié)合模型的使用場(chǎng)景，更多地介紹實(shí)際業(yè)務(wù)需求之間的關(guān)系，更多地采用生活中淺顯易懂的例子。這樣一方面可以彌補(bǔ)筆者在理論功底方面的欠缺，另一方面可以方便人工智能領(lǐng)域的初學(xué)者學(xué)習(xí)模型。

網(wǎng)絡(luò)中的許多技術(shù)文檔經(jīng)常會(huì)出現(xiàn)公式顯示異常、圖片丟失、格式混亂的情況，這也增加了初學(xué)者學(xué)習(xí)模型的難度。筆者認(rèn)為：大篇幅的文字描述，在很多情況下不如一張示意圖生動(dòng)；高深的專業(yè)術(shù)語(yǔ)和技術(shù)原理，在很多情況下不如與生活中的場(chǎng)景做類比淺顯；復(fù)雜的公式計(jì)算與理論推導(dǎo)，在很多情況下不如舉一個(gè)實(shí)際例子計(jì)算一遍更直觀。因此，筆者在本書(shū)中列舉大量的人工智能場(chǎng)景中的真實(shí)案例，將許多現(xiàn)實(shí)生活中的場(chǎng)景與高深的模型進(jìn)行類比，希望可以降低讀者的理解難度。

筆者試圖將人工智能在現(xiàn)實(shí)生活場(chǎng)景中解決的問(wèn)題分類，并根據(jù)這個(gè)分類來(lái)介紹各種模型。本書(shū)將人工智能問(wèn)題分為權(quán)重問(wèn)題、狀態(tài)問(wèn)題、序列問(wèn)題、表示問(wèn)題、相似問(wèn)題和分類問(wèn)題六大類，方便讀者了解各個(gè)模型之間的關(guān)系，也方便讀者理解各個(gè)模型的適用場(chǎng)景。當(dāng)然，這個(gè)分類體系只是筆者的一家之言，并不一定是最科學(xué)的方法。筆者權(quán)且以本書(shū)拋磚引玉，期待人工智能行業(yè)的專家的批評(píng)與指正。

模型日新月異，許多模型在本書(shū)中還未來(lái)得及介紹，如深度學(xué)習(xí)中的許多優(yōu)秀模型、自然語(yǔ)言處理中的許多模型等。雖然筆者非常認(rèn)真地寫(xiě)作本書(shū)，但由于水平有限，經(jīng)驗(yàn)欠缺，對(duì)許多模型的理解還不夠到位，書(shū)中一定還有許多錯(cuò)誤或紕漏之處。懇請(qǐng)同行多多給予批評(píng)與指導(dǎo)，懇請(qǐng)讀者多提寶貴意見(jiàn)與建議。

致謝

感謝白碩老師、劉群老師、王斌老師對(duì)本書(shū)的指導(dǎo)，感謝電子工業(yè)出版社的編輯王靜、吳宏偉、石倩、白濤的辛勤工作。

說(shuō)明

為方便讀者學(xué)習(xí)，書(shū)中所涉及的參考文獻(xiàn)請(qǐng)掃描本書(shū)讀者服務(wù)二維碼獲取（見(jiàn)本書(shū)封底）。

作者

官术网_书友最值得收藏!

模型思維：簡(jiǎn)化世界的人工智能模型

前言