官术网_书友最值得收藏!

前言

讓人又愛(ài)又恨的模型

對(duì)從事算法研究與算法開(kāi)發(fā)的人來(lái)說(shuō),模型的學(xué)習(xí)與使用必不可少。尤其是在目前備受關(guān)注的人工智能領(lǐng)域里,人人談模型,新模型也是層出不窮,讓人眼花繚亂。

模型讓人又愛(ài)又恨:可愛(ài)的地方在于它確實(shí)能夠解決我們的實(shí)際問(wèn)題,而且其有效性一般都經(jīng)過(guò)了檢驗(yàn);可恨的地方在于學(xué)習(xí)它是一件非常痛苦的事情,尤其是對(duì)人工智能領(lǐng)域的初學(xué)者來(lái)說(shuō)。

筆者自2001年開(kāi)始從事光學(xué)字符識(shí)別的研究,2004年以后從事自然語(yǔ)言處理的研究,算是國(guó)內(nèi)人工智能行業(yè)中的“老鳥(niǎo)”了。在多年的學(xué)術(shù)研究和產(chǎn)業(yè)落地推進(jìn)的過(guò)程中,筆者認(rèn)為模型的學(xué)習(xí)是最讓人頭疼的事情。在攻讀博士學(xué)位的過(guò)程中,筆者經(jīng)常發(fā)現(xiàn):自己花了很大工夫,終于對(duì)某個(gè)模型有了初步的理解,忽然有同學(xué)說(shuō)他又看到另一個(gè)更好的模型……筆者覺(jué)得學(xué)習(xí)模型就像玩打地鼠游戲,這個(gè)洞里冒出來(lái)一只地鼠,你剛打下去,另一個(gè)洞里又冒出新的地鼠。打地鼠的速度總是跟不上地鼠冒出來(lái)的速度。筆者在學(xué)習(xí)累了的時(shí)候,就會(huì)產(chǎn)生一堆奇怪的疑問(wèn):到底什么是模型?為什么那些“大牛”提出的任何想法都能成為模型?到底多厲害的人提出的想法才能成為模型?如果沒(méi)有這些“大牛”,那么我們的學(xué)習(xí)是不是就不會(huì)這么累了?有沒(méi)有一本書(shū)可以把所有模型都介紹清楚?如果沒(méi)有,那么有沒(méi)有一本書(shū)可以把人工智能領(lǐng)域中常見(jiàn)的模型都介紹清楚?

久病成醫(yī),降低模型的學(xué)習(xí)難度

2018年,筆者創(chuàng)業(yè)失敗,重新回到職場(chǎng),此時(shí)面臨的第一個(gè)問(wèn)題就是向團(tuán)隊(duì)中相對(duì)年輕的同事介紹自然語(yǔ)言處理技術(shù)。于是筆者萌生了整理各類人工智能模型的念頭。筆者并不是什么模型領(lǐng)域中的“大牛”,也沒(méi)有提出過(guò)什么靠譜的模型。筆者只是想把在近20年的模型學(xué)習(xí)過(guò)程中的痛苦進(jìn)行沉淀和總結(jié),也算是痛定思痛吧。筆者的許多朋友在看了本書(shū)的樣稿后,都以為筆者對(duì)模型頗有研究,而筆者都會(huì)自我調(diào)侃:筆者不是職業(yè)的醫(yī)生,只是久病成醫(yī)而已。

筆者在閱讀大量前輩的作品及大量的網(wǎng)絡(luò)技術(shù)文檔后發(fā)現(xiàn),前輩們都博覽群書(shū),理論功底深厚,數(shù)學(xué)基礎(chǔ)扎實(shí),因此他們的作品中都有大量的公式推導(dǎo)和理論證明。這些都是筆者的弱項(xiàng)。于是,筆者又產(chǎn)生了“久病成醫(yī)”的聯(lián)想:既然筆者的理論水平欠缺,數(shù)學(xué)基礎(chǔ)不牢,那么或許還有許多人工智能的初學(xué)者跟筆者一樣。于是,筆者在寫(xiě)作本書(shū)時(shí),盡量更多地結(jié)合模型的使用場(chǎng)景,更多地介紹實(shí)際業(yè)務(wù)需求之間的關(guān)系,更多地采用生活中淺顯易懂的例子。這樣一方面可以彌補(bǔ)筆者在理論功底方面的欠缺,另一方面可以方便人工智能領(lǐng)域的初學(xué)者學(xué)習(xí)模型。

網(wǎng)絡(luò)中的許多技術(shù)文檔經(jīng)常會(huì)出現(xiàn)公式顯示異常、圖片丟失、格式混亂的情況,這也增加了初學(xué)者學(xué)習(xí)模型的難度。筆者認(rèn)為:大篇幅的文字描述,在很多情況下不如一張示意圖生動(dòng);高深的專業(yè)術(shù)語(yǔ)和技術(shù)原理,在很多情況下不如與生活中的場(chǎng)景做類比淺顯;復(fù)雜的公式計(jì)算與理論推導(dǎo),在很多情況下不如舉一個(gè)實(shí)際例子計(jì)算一遍更直觀。因此,筆者在本書(shū)中列舉大量的人工智能場(chǎng)景中的真實(shí)案例,將許多現(xiàn)實(shí)生活中的場(chǎng)景與高深的模型進(jìn)行類比,希望可以降低讀者的理解難度。

筆者試圖將人工智能在現(xiàn)實(shí)生活場(chǎng)景中解決的問(wèn)題分類,并根據(jù)這個(gè)分類來(lái)介紹各種模型。本書(shū)將人工智能問(wèn)題分為權(quán)重問(wèn)題、狀態(tài)問(wèn)題、序列問(wèn)題、表示問(wèn)題、相似問(wèn)題和分類問(wèn)題六大類,方便讀者了解各個(gè)模型之間的關(guān)系,也方便讀者理解各個(gè)模型的適用場(chǎng)景。當(dāng)然,這個(gè)分類體系只是筆者的一家之言,并不一定是最科學(xué)的方法。筆者權(quán)且以本書(shū)拋磚引玉,期待人工智能行業(yè)的專家的批評(píng)與指正。

模型日新月異,許多模型在本書(shū)中還未來(lái)得及介紹,如深度學(xué)習(xí)中的許多優(yōu)秀模型、自然語(yǔ)言處理中的許多模型等。雖然筆者非常認(rèn)真地寫(xiě)作本書(shū),但由于水平有限,經(jīng)驗(yàn)欠缺,對(duì)許多模型的理解還不夠到位,書(shū)中一定還有許多錯(cuò)誤或紕漏之處。懇請(qǐng)同行多多給予批評(píng)與指導(dǎo),懇請(qǐng)讀者多提寶貴意見(jiàn)與建議。

致謝

感謝白碩老師、劉群老師、王斌老師對(duì)本書(shū)的指導(dǎo),感謝電子工業(yè)出版社的編輯王靜、吳宏偉、石倩、白濤的辛勤工作。

說(shuō)明

為方便讀者學(xué)習(xí),書(shū)中所涉及的參考文獻(xiàn)請(qǐng)掃描本書(shū)讀者服務(wù)二維碼獲取(見(jiàn)本書(shū)封底)。

作者

主站蜘蛛池模板: 兖州市| 昌黎县| 桐庐县| 尚志市| 禄丰县| 潢川县| 确山县| 柳林县| 从化市| 布拖县| 惠州市| 巴南区| 舒城县| 湾仔区| 武强县| 乡城县| 河池市| 霞浦县| 永安市| 兰州市| 松滋市| 五家渠市| 鄂托克旗| 辉县市| 康马县| 巴南区| 青神县| 城口县| 左权县| 崇州市| 光山县| 林甸县| 台北县| 南阳市| 伽师县| 常州市| 彭山县| 凌海市| 巨野县| 香格里拉县| 呼图壁县|