【数学与算法】PCA主成分分析(降维)的通俗理解
生活随笔
收集整理的這篇文章主要介紹了
【数学与算法】PCA主成分分析(降维)的通俗理解
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
1.PCA降維
PCA主成分分析簡單的理解,就是把某物的很多個能直接獲取到的特征,經過變換得到很多個新特征,這些新特征對該物體來說,有的影響很大,有的影響很小,只需要使用這些影響大的新特征,舍棄很多影響小的新特征,就達到了降維。
2.舉例
例如,假如我們想要用新方法衡量一個學生綜合素質,目前可以(直接采集)得到一個學生的特征有20個,例如身高體重年齡分數等,那么這個學生可以用20維向量來描述,但是這20維特征描述起來就太麻煩了。但是又不知道這些特征哪個重要,哪個不重要,不能隨意舍棄。怎么辦呢?
我們想要用新方法衡量一個學生綜合素質,可以這樣做:
- 先采集很多學生樣本來,例如1000個學生,每個學生采集20個特征;
- 然后把這1000個學生的這20個特征進行處理,每個特征都求平均值,然后減去對應特征均值,后續處理直接參考下面求解步驟。
- 然后我們可以用新的20維特征組成的特征向量向量來描述該學生。但是我們可以只取 k=5\color{red}k=5k=5,即,只取這新的20維特征前5個主要特征;這樣也就把用20維向量描述一個學生,轉化為只需要5維向量來描述一個學生。這就是降維。
注意,PCA并不是直接舍棄原始20個特征的某些特征,而是變換處理后,舍棄變換后的新的20個特征的一些不重要的新特征,只保留比較重要的前 k\color{red}kk 個比較重要的特征。
PCA主成分分析的講解博客:
如何通俗易懂地講解什么是 PCA(主成分分析)?
【機器學習】降維——PCA(非常詳細)。
總結
以上是生活随笔為你收集整理的【数学与算法】PCA主成分分析(降维)的通俗理解的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【数学与算法】奇异矩阵、奇异值、奇异值分
- 下一篇: 【数学与算法】步长一维搜索、梯度下降法、