- 移動深度學習
- 李永會
- 1321字
- 2019-12-05 14:22:39
2.5 矩陣和變換
英國數學家凱利在19世紀首先提出了矩陣(Matrix)的概念,它是一個按照長方形陣列排列的復數或實數集合,最初是由方程組的系數及常數所構成的方陣。
可以用坐標系變換來描述矩陣作用的本質。例如,一個平面直角坐標系向左旋轉了90°,怎樣才能用數字描述這種運動呢?有一種辦法:盯緊(1, 0)和(0, 1)這兩個基向量對應的坐標點在新坐標系中的位置,并描述相對于原坐標系中的位置的變化。
變換和函數的作用類似,稱之為“變換”是為了體現出圖形上的變化。線性變換是其中一種變換,它有兩個特征:
· 如果變換前是直線,那么線性變換以后仍然是直線。
· 如果將坐標系的原點固定,那么經過線性變換后,新坐標系的原點仍然保持原位,不會移動。
在二維空間中,如果知道兩個不共線的向量,也知道它們經過線性變換后的結果向量,就可以求出該二維空間中的任意向量經過同樣線性變換后的結果向量。因為通過這兩個向量就可以知道變換后的空間的基向量是什么,而得到了基向量,就得到了整個坐標系。這個道理對多維空間同樣適用。
在圖2-9中,已知i和j是基向量和
通過已知矩陣變換后得到的向量。如果
為變換前的向量,那么通過同樣的矩陣做變換的過程如圖2-9所示。

圖2-9 i和j矩陣乘法變換過程,將x和y分別與向量做數乘
我們可以將上式中的實數用a b c d、、、來替代。下式展示了矩陣對向量作用的過程,其實也可以理解為向量對矩陣的各列進行線性組合,這個式子和圖2-9中的式子代表的含義是一樣的,只不過換了一種寫法,將坐標寫到一起,就構成了矩陣。在該例中,矩陣含有兩個向量,x和y是這兩個向量線性組合的系數。

還可以從另一個角度理解:通過矩陣對向量
進行線性變換,得到新的向量
。
上面的矩陣變換可以看成將(1, 0)變換成(a, c)、將(0, 1)變換成(b, d),然后通過變換后的矩陣,可以求得向量(x, y)經過同樣的變換后,會得到什么向量。這也說明單位矩陣(各個元素都是1的矩陣)的乘法具有不變性,因為經過單位矩陣作用之后得到的還是原來的向量。
下式中的x和y就是在以和
為基向量的新坐標系中的橫縱坐標。

矩陣乘法的本質(更詳細的介紹見2.6節)就是線性變換,可以這樣理解:矩陣乘法就是逐行對其中一個矩陣的基向量做線性變換。我們可以認為上式中的(a, c)和(b, d)兩個坐標,和原坐標系中的(1, 0)、(0, 1)具有一樣的作用,只不過以(a, c)、(b, d)為基向量的坐標系是由以(1, 0)、(0, 1)為基向量的坐標系通過拉伸旋轉等操作變化而來的。
如果把任意兩個基向量的坐標豎起來寫到一起,就變成矩陣了。現在我們思考下式代表什么含義。

· 矩陣A對應的基向量是和
,而標準平面直角坐標系的基向量是
和
,因而矩陣A對應的坐標系相當于把標準平面直角坐標系逆時針旋轉90°得到的。如果把這一過程看成動態變化的,則矩陣A就可以用來表示這一過程。
· 由于坐標軸旋轉了,整個坐標系也會隨之旋轉,標準平面直角坐標系內的所有向量也會一同旋轉。
· 當標準平面直角坐標系里的任意向量被矩陣A施加變換以后,就得到了新坐標系內對應的向量,在該例中,就是得到了逆時針旋轉90°后的向量。
在標準平面直角坐標系中,向量和
構成了最基本的二維單位矩陣。其他所有的矩陣都可以看成是對單位矩陣的變換。每一個2×2矩陣可以看作一套坐標系。