线性代数拾遗(六):特征值与特征向量
??
線性代數拾遺(一):線性方程組、向量方程和矩陣方程
線性代數拾遺(二):線性方程組的解集及其幾何意義
線性代數拾遺(三):線性變換以及矩陣的意義
線性代數拾遺(四):線性方程組的應用
線性代數拾遺(五):矩陣變換的應用
上一章最后,我們引入了馬爾可夫鏈。馬爾可夫鏈簡單來說就是一個個狀態組成的鏈,其中每個狀態只于前一個狀態有關。然而,除了這個簡單定義之外,馬爾可夫鏈還有一個有趣的性質:平穩分布。要解釋平穩分布是什么,我們先從一個例子講起。
一、馬爾可夫鏈的平穩分布
比如一個地區有三個政黨:「民主黨」、「共和黨」、「自由黨」,我們用一個向量?x∈R3?來表示每年選舉的投票結果:
假設每年的選舉結果只和上一年的結果有關,即選舉向量構成的序列滿足馬爾可夫性質,是一個馬爾可夫鏈。那么,像?上一章?那個人口遷移的例子一樣,我們可以用一個狀態遷移矩陣來描述每年選舉結果的變化情況。
比如我們要研究某一年開始,該地區選舉變化情況,而且已經得到了該地區選舉變化的遷移矩陣P:
假設在起始年,三個黨的得票情況為:
。
那么我們順著遷移矩陣看一下接下來幾年,這個地區的選舉情況會發生怎么樣的變化。通過遞推公式
我們可以計算出
……
……
我們可以發現,這個選舉結果向量x越來越逼近于向量
事實上,當我們把遷移矩陣乘上這個向量:
就會發現,不但選舉結果越來越趨向某一個固定向量q,而且當結果達到和q一致時,這個系統便不再改變!這也就是我們所說的達到平穩分布。這個固定向量q就是?穩態向量。
可以證明,這個穩態向量由遷移矩陣所控制。一個馬爾可夫鏈中,遷移矩陣一旦確定,那么不管它的起始狀態(x0)是什么樣,它的穩態將唯一確定(有種宿命論的感覺)。這是馬爾可夫鏈的一個重要性質,對于一個系統的長期發展很有幫助。此外,這個性質也反應了矩陣的兩個重要屬性:特征值與特征向量。
二、特征值與特征向量
當我們把一個矩陣看作是一個線性變換:x?Ax時,我們將矩陣理解成為一種運動,一種能使向量x向著向量Ax移動的“力”。一般來說,向量x經A進行變換有可能是朝著各個方向移動。然而,總有某些特殊向量,線性變換在這些向量上的作用是十分簡單的。
比如:已知向量
矩陣
表示的線性變換分別應用于(即矩陣左乘)向量u和v后的結果如下圖所示:
事實上,Av=2v,從圖像上看就是拉伸了向量v。
更一般的,>?A為n×n矩陣,x為非零向量,若存在數λ使得?Ax=λx,則稱λ為矩陣A的特征值,x為A對應于特征值λ的特征向量。
這就是我們其實已經很熟悉的特征值與特征向量定義了。特征值與特征向量的一個作用就是來研究線性變換中那些“特殊情況”,這些特殊情況可以看作是這個線性變換的“特征”。當我們把矩陣看作線性變換時,特征值與特征向量可以相配合作為描述這個線性變換的一個“特征”(有的文獻也把特征值與特征向量稱為本征值與本征向量)。
至于特征值和特征向量的求解,相信大家比較熟練了(建立特征方程?(A?λI)x=0進行求解),這里不再贅述。注意,一個特征方程所有解的集合構成了一個空間,即對于某一個特征值,它所對應的特征向量將構成一個空間,被稱為A對應于λ的特征空間,特征空間由零向量和所有對應于λ的特征向量組成。
不同特征值對應的特征向量線性無關,而同一個特征值對應的不同特征向量能張成整個特征空間。如果一個特征值只對應一個特征向量,那么這個特征值對應的特征空間就是一條一維直線;而如果一個特征值對應兩個特征向量,那么這個特征值對應的特征空間將是一個二維平面。
??
由于?Ax=λx,因而線性變換A對于特征空間只起到“擴張”的作用(擴張后還是同樣的特征空間)。??
三、特征向量與馬爾可夫鏈
??我們已經知道?xi+1=Axk,而如果我們找一個A的特征值λ及其對應的特征向量?x0,則有??
????因此,如果我們已經知道一個馬爾可夫鏈的轉移矩陣?A,我們不需要看它的初始狀態是什么,只要找A的特征值???λ及其對??應的特征向量?x0,那么我??們就能通過計算得到這個馬爾可夫鏈達到穩態時的狀態。????????
??x??0除了用一個特征向量外,也可以用多個特征向量的線性組合。比如?的特征值??為?λ1,λ2,對??應的兩個特征向量為v1,v2,那么我們可以用c1v1+c2v2
來表示x0。這樣得到的xi+1為:
??
3.1 人口遷移例子
回顧?上一章?那個關于城市人口遷移的研究,那個例子我們引入了馬爾可夫鏈這個概念,而從這章我們知道馬爾可夫鏈有個平穩分布的性質,那么上一章那個人口遷移的例子最終也一定會達到某種穩定狀態,即城鄉人口比例保持不變。
上一章
中,我們已經得出:
即遷移矩陣
這次的套路是求解特征方程(A?λI)x=0(事實上,這里的2階方陣通過計算行列式解detA=0會更方便些。當然,手邊有電腦的話直接交給 matlab、python 之類的就行 :D),得到特征值為 1 和 0.92,對應的特征向量分別為
和
的倍數。
由于有兩個互不相等的特征值,我們可以知道它們對應的兩個特征向量也線性無關,我們將初始向量?x0?用兩個特征向量的線性組合表示:
假設我們已知
(單位:百萬人),
??那么就可以解得?c1=0.125,c2=0.225。
所以,每年的人口分布為:
隨著,所以。
這就顯示了這個馬爾可夫鏈最終總會達到平穩分布,達到平穩分布時的穩態向量就是?0.125v1。這也印證了我們之前的觀察:馬爾可夫鏈達到平穩分布時,穩態向量與初始狀態無關,只與遷移矩陣(特別是遷移矩陣的特征向量)有關。
總結
這一章,我們通過馬爾可夫鏈了解到了矩陣特征值與特征向量的概念。在本章中,我們把一個矩陣看作是一個線性變換,這個矩陣不斷應用于某一個向量,使這個向量在空間中發生“運動”。而直觀的講,特征值與特征向量就是來描述這個“運動”的一個“本征”的,即在某些方向上的線性變換不會改變向量的方向。
# 參考文獻
線性代數及其應用:第3版/(美)萊(Lay, D.C.)著;沈復興等譯. ——北京:人民郵電出版社,2007.7
————
編輯?∑Gemini
?來源:http://mengqi92.github.io/
?一盤紅燒肉告訴你:本科、碩士、博士,區別在哪兒?
?現代數學確實在改變世界
?數學家們的故事
?經典 | 奇異值分解(SVD) 的 幾何意義
?算法你都懂_如何一年賺它幾百萬
?他的科學生涯堪稱加速器,30歲當博導,38歲當選中科院院士,40歲當選德國科學院院士。。。
算法數學之美微信公眾號歡迎賜稿
稿件涉及數學、物理、算法、計算機、編程等相關領域,經采用我們將奉上稿酬。
投稿郵箱:math_alg@163.com
??
創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎總結
以上是生活随笔為你收集整理的线性代数拾遗(六):特征值与特征向量的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 帽子人才的艰辛生活
- 下一篇: 从中师到博士,我用了22年...