数学 矩阵
數學上,一個m×n的矩陣是一個由m行n列元素排列成的矩形陣列。矩陣里的元素可以是數字、符號或數學式。以下是一個由6個數字符素構成的2行3列的矩陣:
大小相同(行數列數都相同)的矩陣之間可以相互加減,具體是對每個位置上的元素做加減法。矩陣的乘法則較為復雜。兩個矩陣可以相乘,當且僅當第一個矩陣的行數等于第二個矩陣的列數。矩陣的乘法滿足結合律和分配律,但不滿足交換律。
矩陣的一個重要用途是解線性方程組。線性方程組中未知量的系數可以排成一個矩陣,加上常數項,則稱為增廣矩陣。另一個重要用途是表示線性變換,即是諸如之類的線性函數的推廣。設定基底后,某個向量v可以表示為m×1的矩陣,而線性變換f可以表示為行數為m的矩陣R,使得經過變換后得到的向量f(v)可以表示成Rv的形式。矩陣的特征值和特征向量可以揭示線性變換的深層特性。
矩陣是高等代數學中的常見工具,也常見于統計分析等應用數學學科中。在物理學中,矩陣于電路學、力學、光學和量子物理中都有應用;計算機科學中,三維動畫制作也需要用到矩陣。 矩陣的運算是數值分析領域的重要問題。將矩陣分解為簡單矩陣的組合可以在理論和實際應用上簡化矩陣的運算。對一些應用廣泛而形式特殊的矩陣,例如稀疏矩陣和準對角矩陣,有特定的快速運算算法。關于矩陣相關理論的發展和應用,請參考矩陣理論。在天體物理、量子力學等領域,也會出現無窮維的矩陣,是矩陣的一種推廣。
目錄??[隱藏]?
|
[編輯]定義
將一些元素排列成若干行,每行放上相同數量的元素,就是一個矩陣。這里說的元素可以是數字,例如以下的矩陣:
排列成的形狀是矩形,所以稱為矩陣。在中國大陸,橫向的元素組稱為“行”,縱向稱為“列”,而在臺灣則相反,橫向稱為“列”,縱向稱為“行”。矩陣一般用大寫拉丁字母表示,需要具體寫出其中元素時,一般用方括號或圓括號括起。以上的矩陣A是一個4行3列的矩陣。
行數和列數是1的矩陣分別稱為行向量和列向量。這是因為一個向量可以表示成行數或列數是1的矩陣形式。矩陣的任一行(列)都是都是一個行(列)向量,例如矩陣A的第一行??就是一個行向量。行(列)向量可以看成一個向量,因此可以稱矩陣的兩行(列)相等,或者某一行等于某一列,表示其對應的向量相等。
[編輯]標記
一個矩陣A從左上角數起的第i?行第j?列上的元素稱為第i,j項,通常記為、、或。在上述例子中?。如果不知道矩陣A的具體元素,通常也會將它記成或。反之,如果A的元素可以寫成只與其行數i和列數j有關的統一函數f,那么也可以用作為A的簡寫。例如是矩陣
的簡寫。要注意的是,一些計算機編程語言中,會將第1行(列)稱為第0行(列),從而對矩陣的寫法產生影響,比如矩陣B就要改寫成。
矩陣的元素可以是數字、符號或數學表達式。一般為了支持矩陣的運算,矩陣的元素之間應當能做加減法和乘法,所以是某個環里的元素。最常見的是元素屬于實數域或復數域的矩陣,簡稱為實矩陣和復矩陣。更一般的情況下,矩陣的元素可以是由一個環中的元素排成。 給定一個環R,所有由R中元素排成的m×n矩陣的集合寫作或。若m?=?n,則通常記以?或,稱其為n維矩陣或方陣。
[編輯]矩陣的基本運算
矩陣的最基本運算包括矩陣加(減)法,數乘和轉置運算。被稱為“矩陣加法”、“數乘”和“轉置”的運算不止一種[1],其中最基本最常用的定義如下:
| 加(減)法 | m×n?矩陣A和B的和(差):A±B為一個m×n矩陣,其中每個元素是A和B相應元素的和(差), | |
| 數乘 | 標量c與矩陣A的數乘:cA的每個元素是A的相應元素與c的乘積, | |
| 轉置 | m×n?矩陣A的轉置是一個n×m的矩陣,記為AT(有些書中也記為Atr?或tA、A'),其中的第i個行向量是原矩陣A的第i個列向量;或者說,轉置矩陣AT第i行第j列的元素是原矩陣A第j行第i列的元素, |
矩陣的加法運算滿足交換律:A?+?B?=?B?+?A[2]。矩陣的轉置和數乘運算關于加法滿足分配律:
矩陣加法和數乘兩種運算使得成為一個mn維的實數線性空間。而轉置和數乘運算滿足類似于結合律的規律:
矩陣也有類似行列式的初等變換,即對矩陣的某些行和某些列進行三類操作:交換兩行(列),將一行(列)的每個元素都乘以一個固定的量,以及將一行(列)的每個元素乘以一個固定的量之后加到另一行(列)的相應元素上。這些操作在求矩陣的逆之時有用。
[編輯]矩陣乘法
兩個矩陣的乘法僅當第一個矩陣A的行和另一個矩陣B的列數相等時才能定義。如A是m×n矩陣和B是n×p矩陣,它們的乘積AB是一個m×p矩陣,它的一個元素
其中 1 ≤?i?≤?m, 1 ≤?j?≤?p[3]。
例如
矩陣的乘法滿足結合律和關于矩陣加法的分配律(左分配律和右分配律):
- 結合律:(AB)C?=?A(BC),
- 左分配律: (A + B)C?=?AC?+?BC,
- 右分配律:?C(A + B) =?CA?+?CB.
矩陣的乘法與數乘運算之間也滿足類似結合律的規律;與轉置之間則滿足倒置的分配律。
矩陣乘法不滿足交換律。一般來說,矩陣A及B的乘積AB存在,但BA不一定存在,即使存在,大多數時候?AB?≠?BA。比如下面的例子:
這一特性使得矩陣代數與常見的一些數域(有理數、實數、復數)以及環(多項式環、整數環)都不同。給定一個n維的方塊矩陣A,與A交換的所有方塊矩陣構成一個環,稱為A的交換子環。這些矩陣也構成的一個子空間,稱為A的可交換空間[4]。與中所有矩陣交換的矩陣只有形如?的矩陣(稱為數乘矩陣)。其中的是單位矩陣,也就是對角元素為1,其它元素為0的矩陣。任意矩陣M乘以單位矩陣都得到自身:?。
除了最常見的矩陣乘法定義以外,也有一些較不常見的矩陣乘法,比如阿達馬乘積和克羅內克乘積[5]。
[編輯]線性方程組
矩陣乘法的一個基本應用是在線性方程組上。線性方程組是方程組的一種,它符合以下的形式:
其中的以及等等是已知的常數,而等等則是要求的未知數。運用矩陣的方式,可以將線性方程組寫成一個向量方程:
其中,A是由方程組里未知量的系數排成的m×n?矩陣,x?是含有n?個元素的行向量,b?是含有m?個元素的行向量[6]。
這個寫法下,將原來的多個方程轉化成一個向量方程,在已知矩陣??和向量??的情況下,求未知向量。
[編輯]線性變換
矩陣是線性變換的便利表達法。矩陣乘法的本質在聯系到線性變換的時候最能體現,因為矩陣乘法和線性變換的合成有以下的連系: 以表示所有長度為n的行向量的集合。每個m×n的矩陣A都代表了一個從射到的線性變換。反過來,對每個線性變換,都存在唯一m×n矩陣??使得對所有中的元素x,??。這個矩陣第i?行第j?列上的元素是正則基向量(第j個元素是1,其余元素是0的向量)在f映射后的向量的第i個元素。
也就是說,從射到的線性變換構成的向量空間??上存在一個到的一一映射:
以下是一些典型的2維實平面上的線性變換對平面向量(圖形)造成的效果,以及它們對應的2維矩陣。其中每個線性變換將藍色圖形映射成綠色圖形;平面的原點(0, 0)用黑點表示。
| 水平錯切變換, 幅度m=1.25. | 水平反射變換 | “擠壓”變換, 壓縮程度r=3/2 | 放縮變換,3/2倍 | 旋轉變換,左轉30° |
設有k×m的矩陣B代表線性變換g?:?Rm?->?Rk,則矩陣積BA代表了線性變換的復合g?o?f[7],因為
矩陣的秩是指矩陣中線性無關的行(列)向量的最大個數[8],同時也是矩陣對應的線性變換的像空間的維度[9]。秩-零化度定理說明矩陣的列數量等于矩陣的秩與零空間維度之和[10]。
[編輯]方塊矩陣
行數與列數相同的矩陣稱為方塊矩陣,簡稱方陣。所有n維的方塊矩陣構成一個線性空間,這個空間對矩陣乘法也是封閉的,因此也是一個代數。方陣A稱為可逆或非奇異的,如果存在另一個方陣B,使得
成立。這時候可以證明也有BA?=?In成立[11],可將矩陣B稱為A的逆矩陣[12]。一個矩陣A的逆矩陣如果存在的話,就是唯一的,通常記作A?1。
矩陣A的元素Ai,i稱為其主對角線上的元素。方塊矩陣A的所有主對角線元素之和稱為它的跡,寫作tr(A)。盡管矩陣的乘法不滿足交換律,方陣相乘時交換順序會導致乘積變化,但它們的跡不會變,即tr(AB) = tr(BA)[13]。除此以外,矩陣轉置的跡等于其自身的跡,tr(A) = tr(AT)。
如果一個方陣只有主對角線上的元素不是0,其它都是0,那么稱其為對角矩陣。如果主對角線上方的元素都是0,那么稱為下三角矩陣;反之如果主對角線下方的元素都是0,那么稱為上三角矩陣。例如n?= 3的時候,這些矩陣分別寫作:
[編輯]行列式
方塊矩陣A的行列式是一個將其映射到標量的函數,記作 det(A) 或 |A|,反應了矩陣自身的一定特性。一個方陣的行列式等于0當且僅當該方陣不可逆。系數是實數的時候,二維(三維)方陣A的行列式的絕對值表示單位面積(體積)的圖形經過A對應的線性變換后得到的圖形的面積(體積),而它的正負則代表了對應的線性變換是否改變空間的定向:行列式為正說明它保持空間定向,行列式為負則說明它逆轉空間定向。
2×2矩陣的行列式是
3×3矩陣的行列式由6項組成。更高維矩陣的行列式則可以使用萊布尼茲公式寫出?[14]?,或使用拉普拉斯展開由低一維的矩陣行列式遞推得出[15]?。
兩個矩陣相乘,乘積的行列式等于它們的行列式的乘積:det(AB) = det(A)·det(B)[16]。將矩陣的一行(列)乘以某個系數加到另一行(列)上不改變矩陣的行列式,將矩陣的兩行(列)互換則使得其行列式變號[17]。用這兩種操作可以將矩陣變成一個上三角矩陣或下三角矩陣,而后兩種矩陣的行列式就是主對角線上元素的乘積,因此能方便地計算。運用行列式可以計算線性方程組的解(見克萊姆法則)[18]。
[編輯]特征值與特征向量
n×n的方塊矩陣A的一個特征值和對應特征向量是滿足
的標量以及非零向量。特征值和特征向量的概念對研究線性變換很有幫助。一個線性變換可以通過它對應的矩陣在向量上的作用來可視化。一般來說,一個向量在經過映射之后可以變為任何可能的向量,而特征向量具有更好的性質[20]。假設在給定的基底下,一個線性變換對應著某個矩陣A,如果一個向量可以寫成矩陣的幾個特征向量的線性組合:
其中的表示此向量對應的特征值是,那么向量經過線性變換后會變成:
可以清楚地知道變換后向量的結構。
另一個等價的特征值定義是:標量為特征值,如果矩陣是不可逆矩陣。根據不可逆矩陣的性質,這個定義也可以用行列式方程描述:為特征值,如果
這個定義中的行列式可以展開成一個關于的n階多項式,叫做矩陣A的特征多項式,記為。特征多項式是一個首一多項式(最高次項系數是1的多項式)。它的根就是矩陣A特征值[22]。哈密爾頓-凱萊定理說明,如果用矩陣A本身代替多項式中的不定元,那么多項式的值是零矩陣[23]:
[編輯]對稱
轉置等于自己的矩陣,即滿足A?=?AT的方塊矩陣A叫做對稱矩陣。滿足A?= -?AT的矩陣稱為反對稱矩陣。在復系數矩陣中,則有埃爾米特矩陣的概念:滿足A?=?A*的方塊矩陣稱為埃爾米特矩陣,其中的A*表示A的共軛轉置矩陣。
根據譜定理,實對稱矩陣和復埃爾米特矩陣擁有特征基,即由矩陣的特征向量組成的基底。因此任何向量都能表示成矩陣特征向量的線性組合。此外,這兩類矩陣的特征值都是實數[24]。
[編輯]正定性
| 矩陣表達式 | ||
| 正定性 | 不定矩陣 | 正定矩陣 |
| 對應二次型 | ||
| 取值圖像 | ||
| 說明 | 正定矩陣對應的二次型的取值范圍永遠是正的, 不定矩陣對應的二次型取值則可正可負 | |
n×n的實對稱矩陣A如果滿足對所有非零向量x?∈?Rn,對應的二次型
函數值都是正數,就稱A為正定矩陣。類似地還有半正定矩陣、負定矩陣、不定矩陣等概念[25]。對稱矩陣的正定性與其特征值密切相關。矩陣是正定的當且僅當其特征值都是正數[26]。
[編輯]矩陣的計算
矩陣在許多學科領域中都有應用,在很多時候,除了需要知道矩陣的理論性質以外,還需要計算矩陣的數值。為了矩陣的計算能夠足夠精確與快捷,數值線性代數中專門有研究矩陣的數值計算方法[27]。與其它的數值計算一樣,矩陣的數值計算注重的主要也是算法的復雜度和數值穩定性。矩陣的數值計算可以使用直接計算,也可以用迭代算法,例如在計算方塊矩陣的特征值時,可以從一個非零向量開始,通過特定迭代方法得到一個逼近某個特征向量的向量序列[28]。
測量一個算法的復雜度是指估計此算法需要的基本運算如數字的加法和乘法的次數,或者找出它的一個上界。例如按照定義計算的話,兩個n階方陣的乘法需要次數字乘法計算,因為其乘積是一個n階方陣,有個元素,計算每個元素需要次數字乘法。如果使用施特拉森算法的話,可以將數字乘法的次數減低到大約次[29]。此外,編程語言或環境本身對算法的復雜度也會有影響。
某些特殊類型的矩陣攜帶的數據量比一般矩陣要少,同時帶來的信息量比一般矩陣多。一個重要的例子是稀疏矩陣,這類矩陣中絕大部分的元素是零。有關稀疏矩陣的計算,如計算稀疏矩陣A的線性方程組Ax=?b時,可以使用一些專用于稀疏矩陣的特殊算法(比如共軛梯度法[30]),減低計算復雜度。
算法的數值穩定性是指輸入值的小變化不會讓計算結果產生很大偏差。例如計算矩陣的逆時,可以用以下的算法(其中adj(A)表示A的伴隨矩陣)
這個算法在A的行列式接近0的時候會引起很大的舍入誤差[31]。
[編輯]矩陣分解
矩陣研究的一大方向是將一般的矩陣用一些比較“簡單”的矩陣來表示。這種表示方式稱為矩陣的變換與分解。矩陣變換與分解的方法有很多,它們的目的都是希望化簡后的矩陣保持原矩陣的某些性質,比如行列式、秩或逆矩陣,而形式相對簡單,因而能用容易地進行討論和計算,或者能使得某些算法更易執行。
LU分解將矩陣分解為一個下三角矩陣L和一個上三角矩陣U的乘積[32]。分解后的矩陣可以方便某些問題的解決。例如解線性方程組時,如果將系數矩陣A分解成A?=?LU的形式,那么方程的求解可以分解為求解Ly?=?b和Ux?=?y兩步,而后兩個方程可以十分簡潔地求解(詳見三角矩陣中“向前與向后替換”一節)。又例如在求矩陣的行列式時,如果直接計算一個矩陣A的行列式,需要計算大約 (n?+ 1)! 次加法和乘法;而如果先對矩陣做LU分解,再求行列式,就只需要大約次加法和乘法,大大降低了計算次數。這是因為做LU分解的復雜度大約是次,而后注意到L和U是三角矩陣,所以求它們的行列式只需要將主對角線上元素相乘即可。
若爾當矩陣,其中灰色框內的是若爾當塊高斯消去法也是一種矩陣分解方法。通過初等變換操作,可以將任何矩陣變為階梯形矩陣,而每個操作可以看做是將矩陣乘上一個特定的初等矩陣[33]。奇異值分解則是另一種分解方法,將一個矩陣表示成3個矩陣的乘積:A?=?UDV。其中U和V是酉矩陣,D是對角矩陣。
特征分解是將一個矩陣A寫成PDP?1的形式,其中P是一個可逆矩陣,D是對角矩陣[34]。如果A的特征分解存在,就稱它是可對角化的矩陣。不能對角化的矩陣,也有類似的分解方式。任意的矩陣A都可以寫成PJP?1的形式,其中的矩陣J是若爾當標準型。若爾當標準型是矩陣的一種,它與對角矩陣類似,只不過主對角線上的元素不是數值,而是若爾當塊:主對角線上為同一元素,主對角線右上一行的次對角線上都是1,其它元素都是0的矩陣(見右圖)[35]。特征分解可以方便計算矩陣的冪次和多項式,如要計算An:
而其中對角矩陣的冪次Dn要比An容易計算得多。同理還可計算矩陣指數:eA(在線性微分方程中有應用)、矩陣對數和矩陣的平方根[36]。為了提高算法的數值穩定性,還有舒爾分解等矩陣分解方法[37]。
[編輯]矩陣的推廣
矩陣的元素除了可以是實數和復數以外,也可以任意環或域中元素。在線性代數中,矩陣的性質可以經由有限維的線性空間中的線性變換定義。更廣泛的,無限維空間中的線性算子,則可以定義更廣泛的無窮維矩陣。矩陣的另一種推廣是張量。標量可以看成零維方式排列的數據(只有一個“點”),向量可以看成是一維方式排列的數據(若干個“點”排成的“線段”),矩陣可以看成是二維方式排列的數據(若干個“線段”排成的“矩形”),而張量的概念則包括了這幾種排列方式。在張量的概念中,標量是零維張量,向量是一維張量,矩陣是二維向量,而更高維方式排列的數據方式就是高維張量[38]。
[編輯]一般域和環上的矩陣
矩陣的元素除了可以是實數和復數以外,還可以是任何能夠使得矩陣的運算律成立的元素。首先,矩陣的元素可以是任意一個域(即能夠進行“加減乘除”運算的集合)中元素。例如編碼理論中會出現系數為有限域中元素的矩陣,以及有理數系數的矩陣。如果矩陣的系數所在域K不是代數閉域,那么在求矩陣的特征值時,由于特征值是相應的特征多項式的根,可能不在系數域K中,而是在系數域的某個擴域L中。反過來,如果考慮擴域L/K,以及L中的一個元素,以及L中線性變換,那么由于也是一個K-線性變換,它可以表示成一個n×n的K系數矩陣?,其中的n是擴域L/K的階數。是這個矩陣的特征值,這個矩陣的特征多項式?是在K中的最小多項式的冪次:
其中的是擴域L/K?的階數[39]。
更一般的情況是矩陣的元素屬于某個環R[40]。環是比域更廣泛的概念,只要求其中元素能夠進行加減法和乘法運算(不一定能定義除法)。給定一個環?R,中的矩陣之間可以相互加減以及相乘,所以關于矩陣的加法和乘法也構成一個環,稱為矩陣環。n維方陣的環與左R-模Rn的自同態環同構[41]。
若R是交換環,則是一個帶單位元的R-代數,滿足結合律,但不滿足交換律。其中的矩陣仍然可以用萊布尼茲公式定義行列式。一個矩陣可逆當且僅當其行列式為環R中的可逆元(域上的矩陣可逆只需行列式不等于0)[42]。
[編輯]矩陣與線性變換
前面已經提到,所有Rn?→?Rm的線性變換都對應著一個中的矩陣。更一般地,給定了基底后,任意兩個有限維線性空間之間的線性映射f:?V?→?W也對應著一個矩陣Af= (aij)。設空間V和W的基底分別是v1, ...,?vn?和?w1, ...,?wm,那么
矩陣Af實際上“記錄”了V中每個基底向量經過變換后得到的W中的像在基底(w1, ...,?wm)下的形式。要注意矩陣的內容取決于基底的選擇。可以說,矩陣是線性變換f?在特定“角度”(基底)下的“素描”。不同的“角度”下,描述f?的矩陣是不同的,但這些矩陣都是相似矩陣[43]。與矩陣有關的基本概念都可以用線性變換的層面來解釋,比如一個矩陣的轉置可以用f?的對偶變換f*?:?W*?→?V*來表示[44]。
當矩陣的元素是帶單位元的環R中的元素時,m×n的R-矩陣對應的則是R-自由模Rm和Rn之間的R-線性變換。n?=?m?的時候,這些R-線性變換可以相互復合,因此n維的R-矩陣環能夠與R-自同態環Rn同構。
[編輯]矩陣群
群是比環更寬泛的代數結構,只需要集合配備一個滿足結合律的二元運算,即將兩個群內元素映射到群內一元素的運算。矩陣群是指矩陣關于矩陣乘法組成的群[45]。顯然,只有方塊矩陣才能構成乘法群。所有n維的可逆方陣構成一個群,稱為n階一般線性群。由于群內每個元素都必須是可逆的,任意的矩陣群都必然是一般線性群的子群。
能夠在矩陣乘法和求逆矩陣運算下保持的性質都可以用來刻畫一定的矩陣群。例如所有行列式為1的矩陣可以構成一個群,稱為n階特殊線性群[46]。所有n維的正交矩陣,即滿足:
的矩陣M也構成一個群,稱為n階正交群[47]。正交矩陣得名于它在Rn中對應的線性變換具有保角性,也就是說對基本的點積,滿足
每個有限群都同構于一個矩陣群。實際上,每個有限群都同構于某個置換群的子群,而每個置換群都同構于一個矩陣群(見置換群的正則群表示[49])鑒于矩陣群的性質可以通過與矩陣相關的更多手段更好地理解,常常通過研究矩陣群來研究一個有限群。相關的理論稱為群表示論。
[編輯]無限維矩陣
無窮維矩陣可以指行數或列數無窮大,或兩者都是無窮大的矩陣[50]。盡管這樣的矩陣無法完整寫出,但只要知道每行每列的元素的值,仍然可以對它進行矩陣操作和運算。這里矩陣的行數和列數甚至不一定需要是可數集。需要注意的是,無窮維矩陣的乘法涉及到無窮級數求和,因此只有在相關的無窮級數收斂的時候,才能定義矩陣的乘積[51]。無限維矩陣也可以是方塊矩陣,定義為行標記集合與列標記集合相同的矩陣(如)[52]。
無限矩陣無法定義通常意義上的行列式,因此可逆矩陣不一定是方塊矩陣,同理,酉矩陣也不一定要是方塊矩陣[53]。
[編輯]空矩陣
空矩陣是指行數或列數為零的矩陣。空矩陣的定義可以完善一些關于零維空間的約定。包括約定一個矩陣與空矩陣相乘得到的也是空矩陣,兩個n×0和0×p的空矩陣相乘是一個n×p的零矩陣(所有元素都是零的矩陣)。0×0的空矩陣的行列式約定為1,所以它也可以有逆矩陣,約定為它自己[54]。
[編輯]分塊矩陣
分塊矩陣是指一個大矩陣分割成“矩陣的矩陣”。舉例,以下的矩陣
可分割成4個2×2的矩陣
[編輯]應用
矩陣在許多領域都應用廣泛。有些時候用到矩陣是因為其表達方式緊湊,例如在博弈論和經濟學中,會用收益矩陣來表示兩個博弈對象在各種決策方式下的收益[55]。文本挖掘和索引典匯編的時候,比如在TF-IDF方法中,也會用到文件項矩陣來追蹤特定詞匯在多個文件中的出現頻率[56]。
復數可以用實系數的2×2矩陣表示:
這種表示法與復數的加減法、乘法都相兼容。比如,2×2的旋轉矩陣可以用來表示模長為1的復數,一個向量乘以此旋轉矩陣可以視作一個復數乘以該模長為1的復數。對四元數也有類似的矩陣表達[57]。
早期的密碼技術如希爾密碼也用到矩陣。然而,矩陣的線性性質使這類密碼相對容易破解[58]。計算機圖像處理也會用到矩陣來表示處理對象,并且用放射旋轉矩陣來計算對象的變換,實現三維對象在特定二維屏幕上的投影[59]。多項式環上的矩陣在控制論中有重要作用。
化學中也有矩陣的應用,特別在使用量子理論討論分子鍵和光譜的時候。具體例子有解羅特漢方程時用重疊矩陣和福柯矩陣來得到哈特里-福克方法中的分子軌道。
[編輯]圖論
一個無向圖的鄰接矩陣圖論中可以用矩陣描述一個有限圖[60]。這個矩陣叫做相關矩陣的鄰接矩陣,記錄了圖的每兩個頂點之間是否有邊連接。對簡單圖來說,鄰接矩陣的元素只取兩個值:0和1,第i?行第j?列上取值為0,表示沒有從第i?個頂點連到第j?個頂點的邊,取值為1則說明有。如果是一般情況的話,第i?行第j?列上的取值是從第i?個頂點連到第j?個頂點的邊的數目。距離矩陣則是表示圖中各頂點之間距離的矩陣[61]。在研究互聯網等復雜網絡的時候,鄰接矩陣常常會是稀疏矩陣。因此網絡理論中有專門研究稀疏矩陣的方面。
[編輯]數學分析
在多元函數微積分學中,對二階偏導數存在的函數f:?Rn?→?R,可以定義其海森矩陣[62]:
n=2時,海森矩陣的特征值一正一負,說明函數f(x,y) =?x2???y2在 (x?=?0,?y?=?0) 處有一個鞍點(紅色點)嚴格來說,僅當函數在某一點上的二階偏導數存在,才能定義這一點上的海森矩陣。海森矩陣給出了函數在這一點的變化率方面的信息。當給定的點x?=?(x1,?...,?xn)是函數平穩點(即函數f?在這一點上的一階偏導數都是0)時,就需要利用海森矩陣來查看函數在這一點周圍的增長特性。多元函數在點x的泰勒展開是:
如果函數在點x的一階偏導數都是0,那么,所以函數在x附近的變化率取決于海森矩陣的性質。如果是正定矩陣,那么函數在點x取得局部最小值,如果是負定矩陣,則函數在x取得局部最大值。在這類情況下,關于函數f?的條件最優化問題可以轉變為關于海森矩陣的二次規劃問題[63]。
矩陣在多元函數微積分中的另一個應用是雅可比矩陣。函數f:?Rn?→?Rm在某一點x上的一階偏導數存在時,可以定義它在這點上的雅可比矩陣[64]:
如果n>m,而又是滿秩矩陣(秩等于m)的話,根據反函數定理,可以找到函數f?在x附近的一個局部的反函數[65]。
偏微分方程理論中,二階擬線性偏微分方程可以根據最高次偏導項系數構成的矩陣的正定性分類。假設有一個二階擬線性偏微分方程:
記矩陣。如果矩陣A是正定或負定矩陣,那么就稱方程(E)為橢圓形偏微分方程;如果A不可逆,就稱(E)為拋物形偏微分方程,如果A可逆而且恰有n?- 1個特征值同號,就稱(E)為雙曲型偏微分方程。其它情況下也稱(E)為超雙曲形偏微分方程。不同類型的方程解的形式也不一樣[66]。
用數值方法解偏微分方程時更需要用到矩陣。一個重要的方法是有限元方法,在求解各種物理中遇到的偏微分方程時廣泛使用。有限元方法的基本思想是用一系列“簡單”函數的線性組合來“逼近”偏微分方程的精確解。這些“簡單”函數通常是指將求解區域分割成一定數量的“小塊”后,僅在某一“小塊”上非零的分段線性函數。選定了網格和“簡單”函數后,可以求解關于剛度矩陣的方程得到近似解。有限元理論中證明了在滿足一定的條件下,近似解將隨著網格趨于精細而弱收斂到精確解[67][68]。
[編輯]概率論與統計
概率論中常用到隨機矩陣,即行向量是概率向量(即所有的元素都在0和1之間,并且加起來等于1的向量)的矩陣。隨機矩陣可用來定義有限概率空間中的馬爾可夫鏈。設隨機變量是某個馬爾可夫鏈在時刻的狀態,所有可能的狀態稱為狀態空間,那么隨機矩陣則記錄了假設已知的可能情況下做各種取值的可能性[69]。的第i?行第j?列上的元素表示當的時候,的可能性。的第j?行記錄了從轉移到各種狀態的可能性。所以叫做時刻的轉移矩陣。如果馬爾可夫鏈的轉移矩陣不隨時刻變化,則稱為齊次馬爾可夫鏈。這時馬爾可夫鏈的吸引態可以通過計算轉移矩陣的特征向量得到[70]。 統計學中也會用到各種不同的矩陣。描述統計學中常常需要用矩陣的形式來描述數據樣本,顯得更為緊湊。幾個隨機變量的協方差矩陣表示它們之間的協方差關系。
[編輯]歷史
作為解決線性方程的工具,矩陣也有不短的歷史。1693年,微積分的發現者之一戈特弗里德·威廉·萊布尼茨建立了行列式論(theory of determinants)。1750年,加布里爾·克拉默其后又定下了克萊姆法則。1800年代,高斯和威廉·約當建立了高斯-約當消去法。
1848年詹姆斯·約瑟夫·西爾維斯特首先創出matrix一詞。研究過矩陣論的著名數學家有阿瑟·凱萊、威廉·盧云·哈密頓、格拉斯曼、弗羅貝尼烏斯和馮·諾伊曼。
[編輯]參見
- 矩陣論專有名詞表:有關矩陣論所用到的名詞的定義
- 方塊矩陣
- 矩陣范數
- 雅可比矩陣
轉載于:https://www.cnblogs.com/olvo/archive/2012/04/23/2466325.html
總結
- 上一篇: 最小二乘擬合matlab,存在已知协方差
- 下一篇: 随机生成稀疏矩阵_面向异构众核超级计算机