官术网_书友最值得收藏!

第1章
緒論

1.1 引言

傍晚小街路面上沁出微雨后的濕潤,和煦的細風吹來,抬頭看看天邊的晚霞,嗯,明天又是一個好天氣。走到水果攤旁,挑了個根蒂蜷縮、敲起來聲音濁響的青綠西瓜,一邊滿心期待著皮薄肉厚瓤甜的爽落感,一邊愉快地想著,這學期狠下了工夫,基礎概念弄得清清楚楚,算法作業也是信手拈來,這門課成績一定差不了!

希望各位在學期結束時有這樣的感覺。作為開場,我們先大致了解一下什么是“機器學習”(machine learning)。

回頭看第一段話,我們會發現這里涉及很多基于經驗做出的預判。例如,為什么看到微濕路面、感到和風、看到晚霞,就認為明天是好天呢?這是因為在我們的生活經驗中已經遇見過很多類似情況,頭一天觀察到上述特征后,第二天天氣通常會很好。為什么色澤青綠、根蒂蜷縮、敲聲濁響,就能判斷出是正熟的好瓜?因為我們吃過、看過很多西瓜,所以基于色澤、根蒂、敲聲這幾個特征我們就可以做出相當好的判斷。類似的,我們從以往的學習經驗知道,下足了工夫、弄清了概念、做好了作業,自然會取得好成績。可以看出,我們能做出有效的預判,是因為我們已經積累了許多經驗,而通過對經驗的利用,就能對新情況做出有效的決策。

上面對經驗的利用是靠我們人類自身完成的。計算機能幫忙嗎?

[Mitchell, 1997] 給出了一個更形式化的定義:假設用來評估計算機程序在某任務類上的性能,若一個程序通過利用經驗在中任務上獲得了性能改善,則我們就說關于和,該程序對進行了學習。

機器學習正是這樣一門學科,它致力于研究如何通過計算的手段,利用經驗來改善系統自身的性能,在計算機系統中,“經驗”通常以“數據”形式存在,因此,機器學習所研究的主要內容,是關于在計算機上從數據中產生“模型”(model)的算法,即“學習算法”(learning algorithm)。有了學習算法,我們把經驗數據提供給它,它就能基于這些數據產生模型;在面對新的情況時(例如看到一個沒剖開的西瓜),模型會給我們提供相應的判斷(例如好瓜)。如果說計算機科學是研究關于“算法”的學問,那么類似的,可以說機器學習是研究關于“學習算法”的學問。

例如[Hand et al., 2001].

本書用“模型”泛指從數據中學得的結果。有文獻用“模型”指全局性結果(例如一棵決策樹),而用“模式”指局部性結果(例如一條規則)。

主站蜘蛛池模板: 纳雍县| 灵台县| 江川县| 遂平县| 丰镇市| 荃湾区| 红安县| 长治市| 三原县| 西乌珠穆沁旗| 呈贡县| 重庆市| 景洪市| 景德镇市| 武陟县| 井陉县| 江华| 余庆县| 乐都县| 唐河县| 池州市| 屯留县| 苗栗市| 商丘市| 仙居县| 旬邑县| 铁力市| 凭祥市| 祁阳县| 阆中市| 调兵山市| 信宜市| 济宁市| 友谊县| 利辛县| 潮州市| 焦作市| 云霄县| 航空| 修武县| 敖汉旗|