人工智能数学基础之线性代数(二)
前言
本文只會記錄人工智能中所用到的線性代數知識,并不會記錄大學線性代數教材中的所有知識。
現在CSDN不能發超長的文章了,只能分成多篇發布。
人工智能數學基礎之線性代數(一)
人工智能數學基礎之線性代數(二)
人工智能數學基礎之線性代數(三)
行列式的性質
記
D=∣a11a12?a1na21a22?a2n???an1an2?ann∣,DT=∣a11a21?an1a12a22?an2???a1na2n?ann∣D = \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n}\\ a_{21} & a_{22} & \cdots & a_{2n}\\ \vdots &\vdots & & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn}\\ \end{vmatrix}, \quad D^T = \begin{vmatrix} a_{11} & a_{21} & \cdots & a_{n1}\\ a_{12} & a_{22} & \cdots & a_{n2}\\ \vdots &\vdots & & \vdots \\ a_{1n} & a_{2n} & \cdots & a_{nn}\\ \end{vmatrix} D=∣∣?a11?a21??an1??a12?a22??an2??????a1n?a2n??ann??∣∣?,DT=∣∣?a11?a12??a1n??a21?a22??a2n??????an1?an2??ann??∣∣?
行列式DTD^TDT稱為行列式DDD的轉置行列式。
性質1 行列式與它的轉置行列式相等
性質2 互換行列式的兩行(列),行列式變號
推論 如果行列式有兩行(列)完全相同,則此行列式等于零
性質3 行列式的某一行(列)中所有的元素都乘以同一數kkk,等于用數kkk乘此行列式
推論 行列式中某一行(列)的所有元素的公因子可以提到行列式記號的外面
性質4 行列式中如果有兩行(列)元素成比例,則此行列式等于零
性質5 若行列式的某一列(行)的元素都是兩數之和,例如第iii列的元素都是兩數之和:
D=∣a11a12?(a1i+a1i′)?a1na21a22?(a2i+a2i′)?a2n????an1an2?(ani+ani′)?ann∣,D= \begin{vmatrix} a_{11} & a_{12} & \cdots & (a_{1i} + a_{1i}^\prime)& \cdots &a_{1n}\\ a_{21} & a_{22} & \cdots & (a_{2i} + a_{2i}^\prime)& \cdots &a_{2n}\\ \vdots & \vdots && \vdots& &\vdots\\ a_{n1} & a_{n2} & \cdots & (a_{ni} + a_{ni}^\prime)& \cdots &a_{nn}\\ \end{vmatrix}, D=∣∣?a11?a21??an1??a12?a22??an2??????(a1i?+a1i′?)(a2i?+a2i′?)?(ani?+ani′?)?????a1n?a2n??ann??∣∣?,
則DDD等于下列兩個行列式之和:
D=∣a11a12?a1i?a1na21a22?a2i?a2n????an1an2?ani?ann∣+∣a11a12?a1i′?a1na21a22?a2i′?a2n????an1an2?ani′?ann∣.D= \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1i}& \cdots &a_{1n}\\ a_{21} & a_{22} & \cdots & a_{2i} & \cdots &a_{2n}\\ \vdots & \vdots && \vdots& &\vdots\\ a_{n1} & a_{n2} & \cdots & a_{ni}& \cdots &a_{nn}\\ \end{vmatrix} + \\ \qquad \qquad \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1i}^\prime& \cdots &a_{1n}\\ a_{21} & a_{22} & \cdots & a_{2i}^\prime& \cdots &a_{2n}\\ \vdots & \vdots && \vdots& &\vdots\\ a_{n1} & a_{n2} & \cdots & a_{ni}^\prime& \cdots &a_{nn}\\ \end{vmatrix}. D=∣∣?a11?a21??an1??a12?a22??an2??????a1i?a2i??ani??????a1n?a2n??ann??∣∣?+∣∣?a11?a21??an1??a12?a22??an2??????a1i′?a2i′??ani′??????a1n?a2n??ann??∣∣?.
性質6 把行列式的某一列(行)的各元素乘以同一數然后加到另一列(行)對應的元素上去,行列式不變。
例如以數kkk乘第jjj列加到第iii列上(記作ci+kcjc_i + kc_jci?+kcj?),有
∣a11?a1i?a1j?a1na21?a2i?a2j?a2n????an1?ani?anj?ann∣=ci+kcj∣a11?(a1i+ka1j)?a1j?a1na21?(a2i+ka2j)?a2j?a2n????an1?(ani+kanj)?anj?ann∣(i≠j)\begin{vmatrix} a_{11} & \cdots& a_{1i} & \cdots & a_{1j}& \cdots &a_{1n}\\ a_{21} & \cdots& a_{2i} & \cdots & a_{2j}& \cdots &a_{2n}\\ \vdots & & \vdots & & \vdots & & \vdots\\ a_{n1} & \cdots& a_{ni} & \cdots & a_{nj}& \cdots &a_{nn}\\ \end{vmatrix} \\ \overset{c_i + kc_j}{=} \begin{vmatrix} a_{11} & \cdots& (a_{1i} + ka_{1j}) & \cdots & a_{1j}& \cdots &a_{1n}\\ a_{21} & \cdots& (a_{2i} + ka_{2j})& \cdots & a_{2j}& \cdots &a_{2n}\\ \vdots & & \vdots & & \vdots & & \vdots\\ a_{n1} & \cdots& (a_{ni} + ka_{nj})& \cdots & a_{nj}& \cdots &a_{nn}\\ \end{vmatrix} (i \neq j) ∣∣?a11?a21??an1??????a1i?a2i??ani??????a1j?a2j??anj??????a1n?a2n??ann??∣∣?=ci?+kcj?∣∣?a11?a21??an1??????(a1i?+ka1j?)(a2i?+ka2j?)?(ani?+kanj?)?????a1j?a2j??anj??????a1n?a2n??ann??∣∣?(i=j)
(以數kkk乘第jjj行加到第iii行上,記作ri+krjr_i + kr_jri?+krj?)
行列式按行(列)展開
一般來說,低階行列式的計算比高階行列式的計算要簡便,于是,我們自然地考慮用低階行列式來表示高階行列式的問題。為此,先引入余子式和代數余子式的概念。
在nnn階行列式中,把(i,j)(i,j)(i,j)元aija_{ij}aij?所在的第iii行和第jjj列劃去后,留下來的n?1n-1n?1階行列式叫作(i,j)(i,j)(i,j)元aija_{ij}aij?的余子式,記作MijM_{ij}Mij?;記
Aij=(?1)i+jMij,A_{ij} = (-1)^{i+j}M_{ij}, Aij?=(?1)i+jMij?,
AijA_{ij}Aij?叫做(i,j)(i,j)(i,j)元aija_{ij}aij?的代數余子式。
例如四階行列式
D=∣a11a12a13a14a21a22a23a24a31a32a33a34a41a42a43a44∣D = \begin{vmatrix} a_{11} & a_{12} & a_{13} & a_{14}\\ a_{21} & a_{22} & a_{23} & a_{24}\\ a_{31} & a_{32} & a_{33} & a_{34}\\ a_{41} & a_{42} & a_{43} & a_{44}\\ \end{vmatrix} D=∣∣?a11?a21?a31?a41??a12?a22?a32?a42??a13?a23?a33?a43??a14?a24?a34?a44??∣∣?
中(3,2)(3,2)(3,2)元a32a_{32}a32?的余子式和代數余子式分別為
M32=∣a11a13a14a21a23a24a41a43a44∣,A32=(?1)3+2M32=?M32.M_{32} = \begin{vmatrix} a_{11} & a_{13} & a_{14}\\ a_{21} & a_{23} & a_{24}\\ a_{41} & a_{43} & a_{44}\\ \end{vmatrix}, \\ A_{32} = (-1)^{3+2} M_{32} = -M_{32}. M32?=∣∣?a11?a21?a41??a13?a23?a43??a14?a24?a44??∣∣?,A32?=(?1)3+2M32?=?M32?.
引理 一個nnn階行列式,如果其中第iii行所有元素除(i,j)(i,j)(i,j)元aija_{ij}aij?外都為零,那么這行列式等于aija_{ij}aij?與它的代數余子式的乘積,即
D=aijAij.D = a_{ij}A_{ij}. D=aij?Aij?.
定理3 行列式等于它的任一行(列)的各元素與其對應的代數余子式乘積之和,即
D=ai1Ai1+ai2Ai2+?+ainAin(i=1,2,?,n),D=a1jA1j+a2jA2j+?+anjAnj(j=1,2,?,n)D = a_{i1}A_{i1} + a_{i2}A_{i2} + \cdots +a_{in}A_{in} \quad (i=1,2,\cdots,n),\\ D = a_{1j}A_{1j} + a_{2j}A_{2j} + \cdots +a_{nj}A_{nj} \quad (j=1,2,\cdots,n) D=ai1?Ai1?+ai2?Ai2?+?+ain?Ain?(i=1,2,?,n),D=a1j?A1j?+a2j?A2j?+?+anj?Anj?(j=1,2,?,n)
證
D=∣a11a12?a1n???ai1+0+?+00+ai2+?+0?0+?+0+ain???an1an2?ann∣=∣a11a12?a1n???ai10?0???an1an2?ann∣+∣a11a12?a1n???0ai2?0???an1an2?ann∣+?+∣a11a12?a1n???00?ain???an1an2?ann∣,D = \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n}\\ \vdots & \vdots & & \vdots\\ a_{i1} + 0 + \cdots + 0& 0 + a_{i2} + \cdots + 0 &\cdots & 0 + \cdots +0 + a_{in}\\ \vdots & \vdots & & \vdots\\ a_{n1} & a_{n2} & \cdots & a_{nn}\\ \end{vmatrix} \\ = \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n}\\ \vdots & \vdots & & \vdots \\ a_{i1} & 0 &\cdots & 0\\ \vdots & \vdots & & \vdots\\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{vmatrix} + \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n}\\ \vdots & \vdots & & \vdots \\ 0 & a_{i2} &\cdots & 0\\ \vdots & \vdots & & \vdots\\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{vmatrix} + \cdots + \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n}\\ \vdots & \vdots & & \vdots \\ 0 & 0 &\cdots & a_{in} \\ \vdots & \vdots & & \vdots\\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{vmatrix}, D=∣∣?a11??ai1?+0+?+0?an1??a12??0+ai2?+?+0?an2??????a1n??0+?+0+ain??ann??∣∣?=∣∣?a11??ai1??an1??a12??0?an2??????a1n??0?ann??∣∣?+∣∣?a11??0?an1??a12??ai2??an2??????a1n??0?ann??∣∣?+?+∣∣?a11??0?an1??a12??0?an2??????a1n??ain??ann??∣∣?,
根據引理,即得
D=ai1Ai1+ai2Ai2+?+ainAin(i=1,2,?,n)D = a_{i1}A_{i1} + a_{i2}A_{i2} + \cdots +a_{in}A_{in} \quad (i=1,2,\cdots,n) D=ai1?Ai1?+ai2?Ai2?+?+ain?Ain?(i=1,2,?,n)
類似地,若按列證明,可得
D=a1jA1j+a2jA2j+?+anjAnj(j=1,2,?,n).D = a_{1j}A_{1j} + a_{2j}A_{2j} + \cdots +a_{nj}A_{nj} \quad (j=1,2,\cdots,n). D=a1j?A1j?+a2j?A2j?+?+anj?Anj?(j=1,2,?,n).
這個定理叫做行列式按行(列)展開法則。利用這一法則并結合行列式的性質,可以簡化行列式的計算。
推論 行列式的某一行(列)的元素與另一行(列)的對應元素的代數余子式乘積之和等于零。即
ai1Aj1+ai2Aj2+?+ainAjn=0,i≠j,a1iA1j+a2iA2j+?+aniAnj=0,i≠j.a_{i1}A_{j1} + a_{i2}A_{j2} + \cdots+ a_{in}A_{jn} = 0,\quad i\neq j,\\ a_{1i}A_{1j} + a_{2i}A_{2j} + \cdots+ a_{ni}A_{nj} = 0,\quad i\neq j. ai1?Aj1?+ai2?Aj2?+?+ain?Ajn?=0,i=j,a1i?A1j?+a2i?A2j?+?+ani?Anj?=0,i=j.
證 把行列式D=det(aij)D=det(a_{ij})D=det(aij?)按第jjj行展開,有
aj1Aj1+aj2Aj2+?+ajnAjn=∣a11?a1n??ai1?ain??aj1?ajn??an1?ann∣,a_{j1}A_{j1} + a_{j2}A_{j2} + \cdots+ a_{jn}A_{jn} =\begin{vmatrix} a_{11} & \cdots & a_{1n}\\ \vdots & & \vdots \\ a_{i1} & \cdots & a_{in}\\ \vdots & & \vdots \\ a_{j1} & \cdots & a_{jn}\\ \vdots & & \vdots \\ a_{n1} & \cdots & a_{nn}\\ \end{vmatrix}, aj1?Aj1?+aj2?Aj2?+?+ajn?Ajn?=∣∣?a11??ai1??aj1??an1???????a1n??ain??ajn??ann??∣∣?,
在上式中把ajka_{jk}ajk?換成aik(k=1,?,n)a_{ik}(k=1,\cdots,n)aik?(k=1,?,n),可得
ai1Aj1+ai2Aj2+?+ainAjn=∣a11?a1n??ai1?ain(i行)??ai1?ain(j行)??an1?ann∣a_{i1}A_{j1} + a_{i2}A_{j2} + \cdots+ a_{in}A_{jn} =\begin{vmatrix} a_{11} & \cdots & a_{1n}\\ \vdots & & \vdots \\ a_{i1} & \cdots & a_{in} (i\text{行})\\ \vdots & & \vdots \\ a_{i1} & \cdots & a_{in}(j\text{行})\\ \vdots & & \vdots \\ a_{n1} & \cdots & a_{nn}\\ \end{vmatrix} ai1?Aj1?+ai2?Aj2?+?+ain?Ajn?=∣∣?a11??ai1??ai1??an1???????a1n??ain?(i行)?ain?(j行)?ann??∣∣?
當i≠ji\neq ji=j時,上式右端行列式中有兩行對應元素相同,故行列式為零,即得
ai1Aj1+ai2Aj2+?+ainAjn=0,i≠j.a_{i1}A_{j1} + a_{i2}A_{j2} + \cdots+ a_{in}A_{jn} = 0,\quad i\neq j. ai1?Aj1?+ai2?Aj2?+?+ain?Ajn?=0,i=j.
上述證法如按列進行,可得
a1iA1j+a2iA2j+?+aniAnj=0,i≠j.a_{1i}A_{1j} + a_{2i}A_{2j} + \cdots+ a_{ni}A_{nj} = 0,\quad i\neq j. a1i?A1j?+a2i?A2j?+?+ani?Anj?=0,i=j.
克拉默法則
又譯為克萊姆法則。
含有nnn個未知數x1,x2,?,xnx_1,x_2,\cdots,x_nx1?,x2?,?,xn?的nnn個線性方程的方程組
{a11x1+a12x2+?+a1nxn=b1,a21x1+a22x2+?+a2nxn=b2,?an1x1+an2x2+?+annxn=bn,(8)\begin{cases} a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n= b_1, \\ a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n= b_2, \\ \cdots \\ a_{n1}x_1 + a_{n2}x_2 + \cdots + a_{nn}x_n= b_n, \\ \end{cases} \tag{8} ????a11?x1?+a12?x2?+?+a1n?xn?=b1?,a21?x1?+a22?x2?+?+a2n?xn?=b2?,?an1?x1?+an2?x2?+?+ann?xn?=bn?,?(8)
與二、三元線性方程組類似,它的解可以用nnn階行列式表示,即有
克拉默法則 如果線性方程組(8)(8)(8)的系數行列式不等于零,即
D=∣a11?a1n??an1?ann∣≠0,D =\begin{vmatrix} a_{11} & \cdots & a_{1n}\\ \vdots & & \vdots \\ a_{n1} & \cdots & a_{nn}\\ \end{vmatrix} \neq 0, D=∣∣?a11??an1?????a1n??ann??∣∣?=0,
那么,方程組(11)(11)(11)有唯一解
x1=D1D,x2=D2D,xn=DnD,(9)x_1 = \frac{D_1}{D}, \quad x_2 = \frac{D_2}{D}, \quad x_n = \frac{D_n}{D}, \tag{9} x1?=DD1??,x2?=DD2??,xn?=DDn??,(9)
其中Dj(j=1,2,?,n)D_j(j=1,2,\cdots,n)Dj?(j=1,2,?,n)是把系數行列式DDD中第jjj列的元素用方程組右端的常數項代替后得到的nnn階行列式,即
Dj=∣a11?a1,j?1b1a1,j+1?a1n?????an1?an,j?1bnan,j+1?ann∣.D_j =\begin{vmatrix} a_{11} &\cdots &a_{1,j-1}& b_1 & a_{1,j+1}&\cdots & a_{1n}\\ \vdots & &\vdots& \vdots & \vdots& & \vdots\\ a_{n1} &\cdots &a_{n,j-1}& b_n & a_{n,j+1}&\cdots & a_{nn} \end{vmatrix}. Dj?=∣∣?a11??an1?????a1,j?1??an,j?1??b1??bn??a1,j+1??an,j+1?????a1n??ann??∣∣?.
定理4 如果線性方程組(8)(8)(8)的系數行列式D≠0D \neq 0D=0,則(8)(8)(8)一定有解,且解是唯一的。
該定理的逆否定理為
定理4’ 如果線性方程組(8)(8)(8)無解或有兩個不同的解,則它的系數行列式比為零。
線性方程組(8)(8)(8)右端的常數項b1,b2,?,bnb_1,b_2,\cdots,b_nb1?,b2?,?,bn?全為零時,線性方程組(8)(8)(8)叫做 齊次線性方程組。
對于齊次線性方程組
{a11x1+a12x2+?+a1nxn=0,a21x1+a22x2+?+a2nxn=0,?an1x1+an2x2+?+annxn=0,(10)\begin{cases} a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n= 0, \\ a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n= 0, \\ \cdots \\ a_{n1}x_1 + a_{n2}x_2 + \cdots + a_{nn}x_n= 0, \\ \end{cases} \tag{10} ????a11?x1?+a12?x2?+?+a1n?xn?=0,a21?x1?+a22?x2?+?+a2n?xn?=0,?an1?x1?+an2?x2?+?+ann?xn?=0,?(10)
x1=x2=?=xn=0x_1=x_2=\cdots = x_n =0x1?=x2?=?=xn?=0一定是它的解,這個解叫做齊次線性方程組的零解。
如果一組不全為零的數是(10)(10)(10)的解,則它叫做齊次線性方程組(10)(10)(10)的非零解。
矩陣
矩陣是一個按照長方陣列排列的復數或實數集合。
由m×nm × nm×n個數組成的一個mmm行nnn列的矩形表格。如圖所示:
A=[a11a12?a1na21a22?a2n????am1am2?amn]A = \left[ \begin{matrix} a_{11} & a_{12} & \cdots & a_{1n}\\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{matrix} \right]A=???a11?a21??am1??a12?a22??am2???????a1n?a2n??amn?????
稱為mmm行nnn列矩陣,簡稱m×nm \times nm×n矩陣。
這個m×nm \times nm×n個數稱為矩陣AAA的元素,簡稱為元,數aija_{ij}aij?位于矩陣AAA的第iii行第jjj列,稱為矩陣AAA的(i,j)(i,j)(i,j)元。
以數aija_{ij}aij?為(i,j)(i,j)(i,j)元的矩陣可簡記作(aij)(a_{ij})(aij?)或(aij)m×n(a_{ij})_{m \times n}(aij?)m×n?,m×nm \times nm×n矩陣AAA也記作Am×nA_{m \times n}Am×n?。
行數與列數都等于nnn的矩陣稱為nnn階矩陣或nnn階方陣。
元素都是零的矩陣稱為零矩陣,記作OOO。
nnn個變量x1,x2,?,xnx_1,x_2,\cdots,x_nx1?,x2?,?,xn?與mmm個變量y1,y2,?,ymy_1,y_2,\cdots,y_my1?,y2?,?,ym?之間的關系式
{y1=a11x1+a12x2+?+a1nxn,y2=a21x1+a22x2+?+a2nxn,?ym=am1x1+am2x2+?+amnxn(2)\begin{cases} y_1= a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n, \\ y_2= a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n, \\ \cdots \\ y_m= a_{m1}x_1 + a_{m2}x_2 + \cdots + a_{mn}x_n \\ \end{cases} \tag{2} ????y1?=a11?x1?+a12?x2?+?+a1n?xn?,y2?=a21?x1?+a22?x2?+?+a2n?xn?,?ym?=am1?x1?+am2?x2?+?+amn?xn??(2)
表示從一個變量x1,x2,?,xnx_1,x_2,\cdots,x_nx1?,x2?,?,xn?與到變量y1,y2,?,ymy_1,y_2,\cdots,y_my1?,y2?,?,ym?的線性變換,其中aija_{ij}aij?為常數。線性變換(2)(2)(2)的系數aija_{ij}aij?構成矩陣A=(aij)m×nA = (a_{ij})_{m \times n}A=(aij?)m×n?,稱為系數矩陣。
矩陣的基本運算
兩個矩陣的行數和列數分別相等,稱它們為同型矩陣。
加法
矩陣的加法只能在兩個同型矩陣之間進行,兩個矩陣相加時,對應元素進行相加。
如:
[123457]+[002213]=[1256610]\left[ \begin{matrix} 1 & 2 & 3\\ 4 & 5 & 7 \end{matrix} \right] + \left[ \begin{matrix} 0 & 0 & 2\\ 2 & 1 & 3 \end{matrix} \right] = \left[ \begin{matrix} 1 & 2 & 5\\ 6 & 6 & 10 \end{matrix} \right] [14?25?37?]+[02?01?23?]=[16?26?510?]
數乘
數λ\lambdaλ與矩陣AAA的乘積記作λA\lambda AλA或AλA\lambdaAλ,規定為
λA=Aλ=[λa11λa12?λa1nλa21λa22?λa2n????λam1λam2?λamn]\lambda A = A\lambda = \left[ \begin{matrix} \lambda a_{11} & \lambda a_{12} & \cdots & \lambda a_{1n}\\ \lambda a_{21} & \lambda a_{22} & \cdots & \lambda a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ \lambda a_{m1} & \lambda a_{m2} & \cdots & \lambda a_{mn} \end{matrix} \right]λA=Aλ=???λa11?λa21??λam1??λa12?λa22??λam2???????λa1n?λa2n??λamn?????
乘法
必須滿足矩陣AAA的列數與矩陣BBB的行數相等,或者矩陣AAA的行數與矩陣BBB的列數相等。
記C=ABC=ABC=AB,矩陣CCC的第iii行第jjj列的元素等于矩陣AAA的第iii行的所有元素與矩陣BBB的第jjj列的對應元素的乘積之和,即:
Cij=∑k=1naikbkjC_{ij} = \sum_{k=1}^na_{ik}b_{kj} Cij?=k=1∑n?aik?bkj?
如:
[123]1×3[456]3×1=1×4+2×5+3×6=32\left[ \begin{matrix} 1 & 2 & 3 \end{matrix} \right] _{1×3} \left[ \begin{matrix} 4 \\ 5 \\6 \end{matrix} \right]_{3×1} = 1×4 + 2×5 + 3×6 =32[1?2?3?]1×3????456????3×1?=1×4+2×5+3×6=32
[123]3×1[456]1×3=[45681012121518]3×3\left[ \begin{matrix} 1 \\ 2 \\3 \end{matrix} \right]_{3×1} \left[ \begin{matrix} 4 & 5 & 6 \end{matrix} \right] _{1×3} = \left[ \begin{matrix} 4 & 5 & 6\\ 8 & 10 & 12\\12 & 15 & 18 \end{matrix} \right]_{3×3}???123????3×1?[4?5?6?]1×3?=???4812?51015?61218????3×3?
矩陣的乘法不滿足交換律,但仍然滿足結合律和分配律:
-
(AB)C=A(BC)(AB)C = A(BC)(AB)C=A(BC)
-
λ(AB)=(λA)B=A(λB)(其中λ為實數)\lambda (AB) = (\lambda A)B = A(\lambda B) \quad (其中\lambda為實數)λ(AB)=(λA)B=A(λB)(其中λ為實數)
-
A(B+C)=AB+AC,(B+C)A=BA+CAA(B+C) = AB + AC,\quad (B+C)A = BA +CAA(B+C)=AB+AC,(B+C)A=BA+CA
轉置
矩陣AAA的轉置矩陣,記作ATA^TAT,是將AAA的行列互換后所得矩陣,如果AAA是一個m×nm ×nm×n階矩陣,ATA^TAT是一個n×mn×mn×m階矩陣。
A=[142536]AT=[123456]A = \left[ \begin{matrix} 1 & 4 \\ 2 & 5 \\ 3 & 6 \end{matrix} \right] A^T = \left[ \begin{matrix} 1 & 2 & 3\\ 4 & 5 & 6 \end{matrix} \right]A=???123?456????AT=[14?25?36?]
矩陣的轉置的性質:
- (AT)T=A(A^T)^T = A(AT)T=A
- (A+B)T=AT+BT(A+B)^T = A^T +B^T(A+B)T=AT+BT
- (λA)T=λAT(\lambda A)^T=\lambda A^T(λA)T=λAT
- (AB)T=BTAT(AB)^T = B^TA^T(AB)T=BTAT
對稱矩陣
定義 一個n×nn \times nn×n的矩陣AAA,若滿足AT=AA^T =AAT=A,則稱AAA為對稱矩陣(symmetric matrix),簡稱對稱陣。其特點為:它的元素以對角線為對稱軸對應相等。
例 設列矩陣X=(x1,x2,?,xn)TX=(x_1,x_2,\cdots,x_n)^TX=(x1?,x2?,?,xn?)T滿足XTX=1X^TX=1XTX=1,EEE為nnn階單位陣,H=E?2XXTH = E - 2XX^TH=E?2XXT,證明HHH是對稱陣,且HHT=EHH^T=EHHT=E。
注意:XTXX^TXXTX = x12+x22+?+xn2x_1^2 + x_2^2 + \cdots + x_n^2x12?+x22?+?+xn2?是一階方陣,也就是一個數,而XXTXX^TXXT是nnn階方陣。
證
HT=(E?2XXT)T=ET?2(XXT)T=E?2XXT=H\begin{aligned} H^T &= (E - 2XX^T)^T \\ &=E^T -2(XX^T)^T \\ &= E - 2XX^T = H \end{aligned} HT?=(E?2XXT)T=ET?2(XXT)T=E?2XXT=H?
所以HHH是對稱陣。
HHT=H2=(E?2XXT)2=E?4XXT+4(XXT)(XXT)=E?4XXT+4X(XTX)XT=E?4XXT+4XXT=E\begin{aligned} HH^T &= H^2 = (E -2XX^T)^2 \\ &= E - 4XX^T + 4(XX^T)(XX^T) \\ &= E - 4XX^T + 4X(X^TX)X^T \\ &= E - 4XX^T + 4XX^T = E \end{aligned} HHT?=H2=(E?2XXT)2=E?4XXT+4(XXT)(XXT)=E?4XXT+4X(XTX)XT=E?4XXT+4XXT=E?
實對稱矩陣
如果有nnn階矩陣AAA,其矩陣的元素都為實數,且矩陣AAA的轉置等于其本身,則稱AAA為實對稱矩陣。
主要性質:
- 實對稱矩陣AAA的不同特征值對應的特征向量是正交的。
- 實對稱矩陣AAA的特征值都是實數。
- nnn階實對稱矩陣AAA必可相似對角化,且相似對角陣上的元素即為矩陣本身特征值。
- 若AAA具有kkk重特征值λ0\lambda_0λ0?,必有kkk個線性無關的特征向量,或者說秩r(λ0E?A)r(\lambda_0 E-A)r(λ0?E?A)必為n?kn-kn?k,其中EEE為單位矩陣。
- 實對稱矩陣AAA一定可正交相似對角化。
單位矩陣
如同數1位實數乘法中的單位元一樣,也存在一個特殊矩陣EEE是矩陣乘法中的單位元,即
EA=AE=AEA = AE = A EA=AE=A
對任意n×nn \times nn×n的矩陣AAA都成立。
定義 n×nn \times nn×n的單位矩陣為矩陣E=(δij)E = (\delta_{ij})E=(δij?),其中
δij={1當i=j0當i≠j\delta_{ij} = \left\{ \begin{array}{lr} 1 & 當 \,\, i =j\\ 0 & 當 \,\, i \neq j \end{array} \right. δij?={10?當i=j當i=j?
即主對角元素均為111,其他元素均為000的n×nn \times nn×n矩陣。
一般地,若BBB為任一m×nm \times nm×n矩陣,且CCC為任一n×rn \times rn×r矩陣,則
BE=B且EC=CBE = B \,\,\,\, \text{且} \,\,\,\, EC = C BE=B且EC=C
n×nn \times nn×n單位矩陣EEE的列向量為用于定義nnn維歐幾里得坐標空間的標準向量。EEE的第jjj列向量的標準記號為eje_jej?。因此,n×nn \times nn×n單位矩陣可寫為
E=(e1,e2,?,en)E = (e_1,e_2,\cdots,e_n) E=(e1?,e2?,?,en?)
矩陣的跡
nnn階方陣AAA的跡(trace)記作tr(A)tr(A)tr(A),是對角元素之和:
tr(A)=a11+a22+?+ann=∑i=1naiitr(A) = a_{11} + a_{22} + \cdots + a_{nn} = \sum_{i=1}^n a_{ii} tr(A)=a11?+a22?+?+ann?=i=1∑n?aii?
性質::
- 跡是所有特征值的和
- tr(AB)=tr(BA)tr(AB)=tr(BA)tr(AB)=tr(BA)
- 若矩陣AAA與矩陣BBB相似,則tr(A)=tr(B)tr(A)=tr(B)tr(A)=tr(B)
共軛矩陣
首先回顧下復數的概念,復數是實數的延伸,它使任意多項式方程都有跟。復數當中有個虛數單位iii,它是?1-1?1的一個平方根,即i2=?1i^2=-1i2=?1。
任一復數都可以表達為a+bia+bia+bi,其中aaa及bbb皆為實數,分別稱為復數的實部和虛部。
復數z=a+biz = a+biz=a+bi的模為∣z∣=a2+b2|z| = \sqrt{a^2 +b^2}∣z∣=a2+b2?。
z=a+biz = a+biz=a+bi的共軛復數定義為z=a?biz = a-biz=a?bi,即兩個實部相等,虛部互為相反數。記作z ̄\overline{z}z。有
- z+w ̄=z ̄+w ̄\overline{z+w} = \overline{z} + \overline{w}z+w?=z+w
- zw ̄=z ̄?w ̄\overline{zw}=\overline{z}\cdot \overline{w}zw=z?w
- (zw) ̄=z ̄w ̄\overline{\left( \frac{z}{w} \right)}=\frac{\overline{z}}{\overline{w}}(wz?)?=wz?
- z ̄ ̄=z\overline{\overline{z}}=zz=z
- z ̄=z當且僅當z是實數\overline{z} =z \quad 當且僅當z是實數z=z當且僅當z是實數
- ∣z∣2=zz ̄|z|^2 = z \overline{z}∣z∣2=zz
當虛部不為零時,共軛復數就是實部相等,虛部相反;
如果虛部為零,其共軛復數就是自身。即實數的共軛復數就是自身。
當A=(aij)A=(a_{ij})A=(aij?)為復矩陣時,用a ̄ij\overline{a}_{ij}aij?表示aija_{ij}aij?的共軛復數,記
A ̄=(a ̄ij),\overline{A} = (\overline{a}_{ij}), A=(aij?),
A ̄\overline{A}A稱為AAA的共軛矩陣。
共軛矩陣滿足下述運算規律(A,BA,BA,B為復矩陣,λ\lambdaλ為復數):
- A+B ̄=A ̄+B ̄\overline{A+B}=\overline{A} + \overline{B}A+B?=A+B
- λA ̄=λ ̄A ̄\overline{\lambda A} = \overline{\lambda} \overline{A}λA=λA
- AB ̄=A ̄B ̄\overline{AB}=\overline{A}\overline{B}AB=AB
埃爾米特矩陣
AAA的共軛矩陣A ̄\overline{A}A的轉置記為AHA^HAH。
定義 若一個矩陣AAA滿足A=AHA =A^HA=AH,則稱它為埃爾米特矩陣(Hermitian)。
總結
以上是生活随笔為你收集整理的人工智能数学基础之线性代数(二)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: E. Beautiful Subarra
- 下一篇: P4151 [WC2011]最大XOR和