PCA方法及其应用
來源
https://www.icourse163.org/course/BIT-1001872001
主成分分析(PCA)
- 主成分分析(Principal Component Analysis,PCA)是最常用的 一種降維方法,通常用于高維數(shù)據(jù)集的探索與可視化,還可以用作數(shù) 據(jù)壓縮和預(yù)處理等。
- PCA可以把具有相關(guān)性的高維變量合成為線性無關(guān)的低維變量,稱為 主成分。主成分能夠盡可能保留原始數(shù)據(jù)的信息。
在介紹PCA的原理之前涉及到的相關(guān)術(shù)語:
- 方差
- 協(xié)方差
- 協(xié)方差矩陣
- 特征向量和特征值
方差:是各個(gè)樣本和樣本均值的差的平方和的均值,用來度量一組 數(shù)據(jù)的分散程度
協(xié)方差:用于度量?jī)蓚€(gè)變量之間的線性相關(guān)性程度,若兩個(gè)變量的 協(xié)方差為0,則可認(rèn)為二者線性無關(guān)。協(xié)方差矩陣則是由變量的協(xié)方差值 構(gòu)成的矩陣(對(duì)稱陣)。
特征向量:矩陣的特征向量是描述數(shù)據(jù)集結(jié)構(gòu)的非零向量,并滿足 如下公式:
A是方陣, ?是特征向量,?
總結(jié)
- 上一篇: DBSCAN密度聚类
- 下一篇: 基于聚类的“图像分割”