- 從零開始:機器學習的數學原理和算法實踐
- 大威編著
- 807字
- 2021-07-09 10:33:05
1.2 理解多元函數偏導
為了方便讀者理解,前文主要從一元函數角度來講解導數相關知識。但現實中更為常見的是多元函數的求導問題,也就是多元函數的偏導數和梯度求解。
1.2.1 多元函數偏導數是什么
最簡單的函數是一元函數,如,但現實中更多的是多元函數,如
等。其實,多元函數在生活中隨處可見,例如矩形的面積
(其中,x、y分別是矩形的長和寬)就是二元函數,梯形的面積
(其中,x、y分別是梯形上、下底長,z為梯形的高)就是三元函數。從映射的觀點來看,一元函數是實數集到實數集的映射,多元函數則是有序數組集合到實數集合的映射。我們對一元函數求導是非常熟悉的,那么對多元函數的求導該如何處理呢?
典型的一元函數,對這個典型一元函數求導有
。實際上,式子中的a、b、c也是可以變化的,所以求導過程也是求解
關于x的偏導數。由此可知,多元函數偏導數的求解方法就是“各個擊破”,對一個變量求導時,將其他變量暫時看成固定的參數。
對于形如這樣的一元函數,它的導數就是自變量x的微小變化Δx與其所引起函數值微小變化Δf的比值,一般表示為
。那么對于一個含有x、y兩個變量的函數
,保持其他變量固定而關注一個變量的微小變化帶來的函數值變化情況,這種變化的比值就是偏導數,如
或
。
1.2.2 搞清楚梯度是什么
梯度和導數是密切相關的一對概念,實際上梯度是導數對多元函數的推廣,它是多元函數對各個自變量求偏導形成的向量。
中學時,我們接觸“微分”這個概念是從“函數圖像某點切線斜率”或“函數的變化率”這個認知開始的。典型的函數微分如、
、
等。
梯度實際上就是多變量微分的一般化,例如。對該函數求解微分,也就得到了梯度
。梯度的本意是一個向量,表示某一函數在該點處的方向導數沿著該方向取得最大值,即函數在該點處沿著該方向(此梯度的方向)變化最快,變化率最大(為該梯度的模)。一般來說,梯度可以定義為一個函數的全部偏導數構成的向量。梯度在機器學習中有著重要的應用,例如梯度下降算法,這將在后文詳細論述。