- 從零開始學TensorFlow2.0
- 趙銘 歐鐵軍編著
- 1008字
- 2020-09-25 12:47:39
1.1 機器學習
傳統的計算機程序需要先通過人工的方式給出限定條件,并做出相應的限制,程序按照限定條件對輸入的數據集進行分析,并得到最終結果。而機器學習則是使用特定的訓練集進行大規模數據計算以實現人工建立限制的過程,機器學習將數據(不限于文本數據、圖形數據、音頻數據和視頻數據)提交給模型,模型根據算法對數據進行處理。
機器學習系統是通過訓練得到的,不是顯式的編制。機器學習過程是給機器學習一些與任務相關的例子,然后讓機器通過例子推導并得出結果。深度學習是在機器學習基礎上發展而來的一個重要方向,它通過特征建立相應的算法,從而達到讓機器識別文字、數字和聲音等數據的目的。傳統程序、傳統機器學習與深度學習之間的區別如圖1-1所示。

圖1-1 傳統程序、傳統機器學習與深度學習之間的區別
機器學習的本質是通過不斷分析特征集建立函數算法的過程。可以將該過程大致分為以下3個步驟。
(1)選擇一個合適的模型。針對不同的問題和任務的實際情況選取不同的模型,模型就是一組函數的集合。
(2)通過測試判斷一個函數的好壞。
(3)找出合適的函數,常用的方法有梯度下降算法、最小二乘法等。
在選擇了合適的函數后,要不斷地在新樣本上進行測試,函數只有在新樣本上表現得好才算合適。
機器學習的核心是使用算法解析數據,使用數學方法建立函數,最終需要根據函數做出決定或進行預測。機器學習包括監督學習、無監督學習和強化學習。
這3種機器學習都有其特定的優點和缺點。
(1)監督學習需要有一組標記數據,使用特定模式來識別這種數據中每種標記的樣本。監督學習主要包括分類、回歸和排序。
① 在分類學習中,根據特定的模式將標記的數據劃分為特定的類。
② 在回歸學習中,根據特定的模式對已有數據進行處理以預測數據趨勢。
③ 排序學習主要用于信息檢索領域,需要按照一定的特征對特定數據集進行排序。
(2)無監督學習利用類別未知的訓練樣本解決數據識別的各種問題。需要注意的是,在無監督學習中,數據是無標簽的。無監督學習包括聚類學習和降維學習。
① 聚類學習的實質是將數據集按照一定的特征進行分組。與分類學習不同,在聚類學習中不需要人為指定組的信息。
② 降維學習是通過在數據集中找到數據的共同點實現的。多數大數據可視化使用降維學習來探尋趨勢和規則。
(3)強化學習使用機器的歷史和經驗來做決定。其不斷地輸入模糊數據,對機器學習函數進行強化,直至達到目的。強化學習是一個持續的過程。
常用場景分類如圖1-2所示。

圖1-2 常用場景分類