MIT线性代数笔记十七讲 正交矩阵和施密特正交化
??本節是“正交”部分的最后內容。Gram-Schmidt 過程可以將原空間的一組基轉變為標準正交基。
文章目錄
- 1. 標準正交向量 Orthonormal vectors
- 2. 標準正交矩陣 Orthonormal matrix
- 3. 標準正交列向量的優勢 Orthonormal columns are good
- 4. 施密特正交化 Gram-Schmidt(A->Q)
1. 標準正交向量 Orthonormal vectors
??滿足如下條件的向量q1,q2…,qnq_1,q_2\dots, q_nq1?,q2?…,qn?為標準正交向量:
qiTqj={0,i≠j1,i=jq _ { i } ^ { T } q _ { j } = \left\{ \begin{array} { l } { 0 , i \neq j } \\ { 1 , i = j } \end{array} \right.qiT?qj?={0,i?=j1,i=j?
??換而言之,它們都具有單位長度 1,并且彼此正交。標準正交向量是線性無關的。很多線性代數的計算都建立在標準正交基礎上,它讓一切變得簡單可控(從來不上溢或者下溢)。
2. 標準正交矩陣 Orthonormal matrix
??如果矩陣QQQ的列向量為標準正交向量,則QTQ=IQ^TQ=IQTQ=I為單位陣。
QTQ=IQ ^ { T } Q = IQTQ=I
??注意這里的矩陣QQQ可以不是方陣。我們已經學過了一系列矩陣,包括三角陣、對角陣、置換矩陣、對稱矩陣、行最簡梯形矩陣、投影矩陣等等,現在有了“標準正交”矩陣。
??一個標準正交的方陣我們稱之為“正交矩陣”(orthogonal matrix)。如果QQQ為方陣,因為 QTQ=IQ^TQ=IQTQ=I,所以 QT=Q?1Q^T=Q^{-1}QT=Q?1。 注意必須是方陣,必須是標準正交,而不只是正交。
??N:當矩陣為標準正交矩陣,而且為方陣時,才稱為是正交矩陣。
??例如,置換矩陣Q=[001100010]Q = \left[ \begin{array} { l l l } { 0 } & { 0 } & { 1 } \\ { 1 } & { 0 } & { 0 } \\ { 0 } & { 1 } & { 0 } \end{array} \right]Q=???010?001?100????,則有QT=[010001100]Q^T=\left[ \begin{array} { l l l } { 0 } & { 1 } & { 0 } \\ { 0 } & { 0 } & { 1 } \\ { 1 } & { 0 } & { 0 } \end{array} \right]QT=???001?100?010????,兩者皆為正交矩陣,并且兩者乘積為單位陣。
??再例如,Q=[cos?θ?sin?θsin?θcos?θ]Q=\left[ \begin{array} { c c } { \operatorname { cos } \theta } & { - \operatorname { sin } \theta } \\ { \operatorname { sin } \theta } & { \operatorname { cos } \theta } \end{array} \right]Q=[cosθsinθ??sinθcosθ?]為正交矩陣。而矩陣[111?1]\left[ \begin{array} { c c } { 1 } & { 1 } \\ { 1 } & { - 1 } \end{array} \right][11?1?1?]并不是正交矩陣,而通過調整得到的矩陣 Q=12[111?1]Q=\frac { 1 } { \sqrt { 2 } } \left[ \begin{array} { c c } { 1 } & { 1 } \\ { 1 } & { - 1 } \end{array} \right]Q=2?1?[11?1?1?]為正交矩陣,在矩陣外面要除以向量的長度。
??再例如,Q=12[11111?11?111?1?11?1?11]Q=\frac{1}{2}\left[ \begin{array} { c c c c } { 1 } & { 1 } & { 1 } & { 1 } \\ { 1 } & { - 1 } & { 1 } & { - 1 } \\ { 1 } & { 1 } & { - 1 } & { - 1 } \\ { 1 } & { - 1 } & { - 1 } & { 1 } \end{array} \right]Q=21??????1111?1?11?1?11?1?1?1?1?11??????,也是由-1 和+1 組成的正交矩陣,這種類型的矩陣稱之為阿達瑪 Hadamard 矩陣,不同階數矩陣性質不同并且沒有規律,無從判斷幾階的阿達瑪矩陣為正交陣。
??再給一個長方形矩陣的例子,其列向量為標準正交:
??Q=13[1?22?122]Q=\frac{1}{3}\left[ \begin{array} { l l } { 1 } & { - 2 } \\ { 2 } & { - 1 } \\ { 2 } & { 2 } \end{array} \right]Q=31????122??2?12????,我們可以拓展其成為正交矩陣[1?222?1?2221]\left[ \begin{array} { c c c } { 1 } & { - 2 } & { 2 } \\ { 2 } & { - 1 } & { - 2 } \\ { 2 } & { 2 } & { 1 } \end{array} \right]???122??2?12?2?21????
3. 標準正交列向量的優勢 Orthonormal columns are good
??若QQQ的列向量為標準正交向量,則投影到QQQ的列空間的投影矩陣為:
P=Q(QTQ)?1QTP=Q( Q ^ { T } Q ) ^ { - 1 } Q ^ { T } P=Q(QTQ)?1QT
??證明如下:
ATAx^=ATbAx^=pp=Pb\left. \begin{array} { c } { A ^ { T } A \hat { x } = A ^ { T } b } \\ { A \hat { x } = p } \\ { p = P b } \end{array} \right.ATAx^=ATbAx^=pp=Pb?
x^=(ATA)?1ATb\hat { x } = ( A ^ { T } A ) ^ { - 1 } A ^ { T } bx^=(ATA)?1ATb
Ax^=A(ATA)?1ATbA\hat { x } = A( A ^ { T } A ) ^ { - 1 } A ^ { T } bAx^=A(ATA)?1ATb
P=A(ATA)?1ATP=A( A ^ { T } A ) ^ { - 1 } A ^ { T } P=A(ATA)?1AT
P=Q(QTQ)?1QTP=Q( Q ^ { T } Q ) ^ { - 1 } Q ^ { T } P=Q(QTQ)?1QT
??因為QTQ=IQ^TQ=IQTQ=I,所以P=QQTP=QQ^TP=QQT。 這種情況會降低很多運算量。
??如果QQQ為方陣,則P=IP=IP=I,因為QQQ的列向量線性無關,QQQ的列向量張成了整個空間,投影過程不會對向量有任何改變。當Q為方陣時,Q?1=QTQ^{-1}=Q^TQ?1=QT。
??投影矩陣的性質為:投影矩陣為對稱矩陣(PT=PP^T=PPT=P);如果投影兩次,還會在原有的位置(P2=PP^2=PP2=P),代入即為(QQT)(QQT)=(QQT)(QQ^T)(QQ^T)=(QQ^T)(QQT)(QQT)=(QQT)。這是由于QTQ=IQ^TQ=IQTQ=I。
??在很多復雜問題中使用標準正交向量之后都變得簡單。如果基為標準正交,則方程ATAx^=ATbA ^TA \hat{x} =A^TbATAx^=ATb ->QTQx^=QTbQ ^TQ \hat{x} =Q^TbQTQx^=QTb的解變為 x^=QTb\hat{x} =Q^Tbx^=QTb, x^\hat{x}x^的分量 xi^\hat{x_i}xi?^?就等于 qiTbq_i^TbqiT?b。
4. 施密特正交化 Gram-Schmidt(A->Q)
??
??從兩個線性無關的向量 a 和 b 開始,它們張成了一個空間,我們的目標是希望找到兩個標準正交的向量q1q_1q1?,q2q_2q2?能張成同樣的空間。Schmidt 給出的結論是如果我們有一組正交基 A 和 B,那么我們令它們除以自己的長度就得到標準正交基:
q1=A∥A∥,q2=B∥B∥q _ { 1 } = \frac { A } { \| A \| },q _ { 2 } = \frac { B } { \| B \| }q1?=∥A∥A?,q2?=∥B∥B?
??Gram 做了重要的工作,令 A=a,我們在 a 和 b 張成的空間中,取與 A 正交向量做成標準正交基,方法就是將 b 投影到 a 的方向,然后取B=b?pB=b-pB=b?p(B 就是之前談論過的誤差e 的方向)
B=b?ATbATAAB = b - \frac { A ^ { T } b } { A ^ { T } A } AB=b?ATAATb?A,注意這個小節中 A,B,C 均為向量。
??如果從等式兩端左乘ATA^TAT,可以得到 ATB=0A^TB=0ATB=0。
??如果從三個線性無關的向量 a、 b 和 c 出發,則可以通過從 c 中減去其在 A 和B兩個方向的投影來得到C。
C=c?ATcATAA?BTcBTBBC = c - \frac { A ^ { T } c } { A ^ { T } A } A-\frac { B ^ { T } c } { B ^ { T } B } BC=c?ATAATc?A?BTBBTc?B
??例如a=[111],b=[102]a = \left[ \begin{array} { l } { 1 } \\ { 1 } \\ { 1 } \end{array} \right] , b = \left[ \begin{array} { l } { 1 } \\ { 0 } \\ { 2 } \end{array} \right]a=???111????,b=???102????,則有A=a,B=[102]?33[111]=[01?1]A=a,B=\left[ \begin{array} { l } { 1 } \\ { 0 } \\ { 2 } \end{array} \right] - \frac { 3 } { 3 } \left[ \begin{array} { l } { 1 } \\ { 1 } \\ { 1 } \end{array} \right] = \left[ \begin{array} { l } { 0 } \\ { 1 } \\ { -1 } \end{array} \right]A=a,B=???102?????33????111????=???01?1????,驗證計算得到ATB=0A^TB=0ATB=0。
??寫出q1,q2q_1,q_2q1?,q2?所組成的矩陣為:
Q=[q1q2]=[13013?121312]Q = \left[ \begin{array} { l l } { q _ { 1 } } & { q _ { 2 } } \end{array} \right] = \left[ \begin{array} { c c } { \frac { 1 } { \sqrt { 3 } } } & { 0 } \\ { \frac { 1 } { \sqrt { 3 } } } & { \frac { - 1 } { \sqrt { 2 } } } \\ { \frac { 1 } { \sqrt { 3 } } } & { \frac { 1 } { \sqrt { 2 } } } \end{array} \right]Q=[q1??q2??]=????3?1?3?1?3?1??02??1?2?1??????
??QQQ列向量的空間就是 a 和 b 張成的空間。 因此矩陣 Q 和矩陣 A=[111012]A=\left[ \begin{array} { l l } { 1 } & { 1 } \\ { 1 } & { 0 } \\ { 1 } & { 2 } \end{array} \right]A=???111?102????有相同的列空間。
??Q的列空間與A的列空間是什么關系呢?它們是同一個列空間。
??在消元過程中,我們可以對矩陣進行分解得到A=LUA=LUA=LU,而在對AAA做施密特正交化的過程也可以用矩陣運算的方式表示為A=QRA=QRA=QR。此處RRR為上三角陣。
??RRR為上三角陣,則a1Tq2=0a_1^Tq_2=0a1T?q2?=0。這是因為a1a_1a1?就是q1q_1q1?的方向,而q1q_1q1?和q2q_2q2?為標準正交向量,因此 q2q_2q2? 的方向與 a1a_1a1?垂直,因此內積為 0。RRR 在QQQ右側相當于對 Q 做列操作,即AAA的列向量是QQQ列向量的線性組合,而QQQ為AAA 列空間的一組標準正交基,則 RRR的元素實際上是AAA的列向量基于QQQ 這組標準正交基的權。
??左下角為0,但需要注意的是右上角并不一定為0。
??采用矩陣的 QR 分解來幫助求解Ax=bAx=bAx=b的問題,最大的優勢是提高了數值的穩定性。
總結
以上是生活随笔為你收集整理的MIT线性代数笔记十七讲 正交矩阵和施密特正交化的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Direct3d 设备丢失 (devic
- 下一篇: 机器学习软件准备