官术网_书友最值得收藏!

1.2 機器學習的重要性

為什么機器學習變得如此受人關注呢?(咔嚓咔嚓)

其實機器學習的基礎理論和算法本身并不是新出現的。

欸,原來是以前就有的啊?

無論是過去還是現在,計算機都特別擅長處理重復的任務。所以計算機能夠比人類更高效地讀取大量的數據、學習數據的特征并從中找出數據的模式。這樣的任務也被稱為機器學習或者模式識別,以前人們就有用計算機處理這種任務的想法,并為此進行了大量的研究,也開發了很多代碼。

原來機器學習從很久以前就可以做很多事情,真是出乎意料……

現在機器學習能做的事情更多了。雖然不可否認這受益于計算機理論的發展,不過我認為主要還是歸功于以下兩點。

● 具備了能夠收集大量數據的環境

● 具備了能夠處理大量數據的環境

也就是說,讓計算機收集大量數據、學習大量知識,就可以做許許多多的事情了嗎?

嗯,差不多是這樣的。當我們打算用機器學習做什么事情的時候,首先需要的就是數據。因為機器學習就是從數據中找出特征和模式的技術。

原來并不是說有一個很厲害的程序,只要把事情交給它,它就什么都會幫我們搞定呀。

嗯,所以收集數據很重要。

不過“具備了能夠收集大量數據的環境”是什么意思呢?

由于互聯網的發展,個人行為和生活的一部分已經被數字化,規模大到無法想象的數據也隨之而生。

而且,不僅是數據量變多了,數據的種類也增加了。其中包括Web網站的訪問記錄、博客上發布的博文和照片、郵件的發送記錄、電商網站的購買記錄等,數不勝數。多虧有了互聯網,我們才可以輕松獲取大量這樣的數據。

對呀,我也經常在網上買東西。現在再普通不過的事情,在過去看來卻并不簡單……

我們就拿剛才你舉的機器學習的例子來說吧。人臉識別可以使用SNS網站上與人物標簽一起被上傳的圖像數據,而推薦系統則可以使用電商網站上的購買記錄數據。不管是人臉識別還是推薦系統,都是從數據中學到的成果。

原來如此。看來我之前對機器學習完全不了解啊。

而且現在計算機的性能也越來越高,處理同樣多的數據所需的時間變得越來越短,硬盤和SSD這樣的存儲設備也越來越便宜。

現在好厲害呀。計算機能夠處理大量數據,也就能學到相應的大量知識,真讓人激動。而且值得處理的數據也非常多。

是啊。不過,比起可以學習到大量知識,計算機能夠更快地處理數據這一點更令人激動。現在可以使用GPU進行數值計算,Hadoop、Spark之類的分布式處理技術也逐漸成熟,所以才說現在“具備了能夠處理大量數據的環境”。

適合機器學習的時代終于來臨了!

對,所以人們對機器學習的興趣越來越高。機器學習不僅可以應用在那些方便我們日常生活的應用程序上,還可以幫助商務人士做決策,或者應用在醫療、金融、安全等其他各種領域。

這樣說來,機器學習真是太厲害了。眼下也正是使用機器學習大展拳腳的時候,我現在真心想學習它了。

主站蜘蛛池模板: 扎鲁特旗| 乐清市| 通化市| 陕西省| 任丘市| 蚌埠市| 塔城市| 扶余县| 大田县| 临武县| 合川市| 义马市| 新建县| 随州市| 和平县| 修水县| 天气| 昌宁县| 枝江市| 永康市| 晋城| 开远市| 永春县| 马尔康县| 马鞍山市| 仁布县| 阿克陶县| 双峰县| 扎兰屯市| 云浮市| 张家口市| 海原县| 西丰县| 临洮县| 大厂| 郑州市| 合阳县| 盘锦市| 东阳市| 肥西县| 秭归县|