官术网_书友最值得收藏!

1.1 什么是機器學習

著名學者赫伯特·西蒙教授(Herbert Simon)曾對“學習”下了一個定義:“如果一個系統能夠通過執行某個過程來改進其性能,那么這個過程就是學習。”從西蒙教授的定義中可以看出,學習的核心目的是改善。對于計算機系統而言,它通過運用數據及某種特定的方法(例如統計的方法或推理的方法)來提升機器系統的性能,就是機器學習。

有關機器學習的定義,卡內基梅隆大學的湯姆·米切爾(Tom Mitchell)教授給出的解釋是:“對于某類任務(Task,簡稱T)和某項性能度量準則(Performance,簡稱P),如果一個計算機程序在T上,以P作為性能的度量,隨著很多經驗(Experience,簡稱E)不斷自我完善,則說明該計算機程序在從E中學習了?!?/p>

圖1.1 機器學習可以看作一個函數

如果覺得米切爾教授的定義比較抽象,可以參考臺灣大學李宏毅博士的說法:機器學習在形式上,近似于在數據對象中通過統計或推理的方法尋找一個適用特定輸入和預期輸出功能的函數。如圖1.1所示。

所謂機器學習,在形式上,可以看作一個函數,通過對特定的輸入進行處理,得到一個預期的結果。例如,f(一段音頻)=“你好”、f(含有貓的圖片)=“cat”等。但是如何才能讓計算機在接收一串語音后知道這句話是“你好”而不是其他的內容呢?這就需要構建一個評估體系來判斷計算機通過學習是否能夠輸出理想的結果,如此便可以通過訓練數據(training data)來“培養”機器學習算法的能力,如圖1.2所示。

圖1.2 機器學習的過程

從圖1.2可以看出,f2對圖像的識別是錯誤的,學習效果并不理想,經過訓練數據的“培養”,將輸出結果不理想的f2改善為輸出結果較為理想的f1,判定的準確度提高了,這種改善的過程便可以被稱為學習!如果這個學習過程是由機器完成的,那就是“機器學習”了。

主站蜘蛛池模板: 德清县| 庄河市| 蓬安县| 惠来县| 喀喇沁旗| 江门市| 南投市| 郧西县| 西昌市| 青海省| 陇南市| 竹北市| 白山市| 鹰潭市| 社旗县| 郓城县| 长沙市| 荆门市| 东台市| 龙胜| 南阳市| 泗洪县| 台北市| 荆州市| 灵寿县| 桂林市| 枞阳县| 高台县| 云安县| 马山县| 天祝| 汝阳县| 霍林郭勒市| 兰州市| 龙岩市| 宁强县| 杭州市| 镇平县| 察雅县| 获嘉县| 镇远县|