数据挖掘算法学习(四)PCA算法
生活随笔
收集整理的這篇文章主要介紹了
数据挖掘算法学习(四)PCA算法
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
轉(zhuǎn)載請附上鏈接http://blog.csdn.net/iemyxie/article/details/38236647
算法簡單介紹
主成分分析(PrincipalComponentAnalysis,簡稱PCA)是一種經(jīng)常使用的基于變量協(xié)方差矩陣對信息進(jìn)行處理、壓縮和抽提的有效方法。
主要用于對特征進(jìn)行降維。
算法如果
數(shù)據(jù)的概率分布滿足高斯分布或是指數(shù)型的概率分布。
方差高的向量視為主元。
算法輸入
包括n條記錄的數(shù)據(jù)集
算法輸出
降維或壓縮后的數(shù)據(jù)集
算法思想
?1.計(jì)算全部樣本的均值m和協(xié)方差矩陣S; ?2.計(jì)算S的特征值。并由大到小排序; ?3.選擇前n'個特征值相應(yīng)的特征矢量作成一個變換矩陣E=[e1,e2, …, en’]; ?4.最后。對于之前每個n維的特征矢量x能夠轉(zhuǎn)換為n’維的新特征矢量??? y=transpose(E)(x-m)
weka執(zhí)行結(jié)果
以weather.nominal.arff為例執(zhí)行結(jié)果部分截圖例如以下:
算法應(yīng)用
人臉識別
圖像壓縮
信號去噪
轉(zhuǎn)載請附上鏈接http://blog.csdn.net/iemyxie/article/details/38236647
總結(jié)
以上是生活随笔為你收集整理的数据挖掘算法学习(四)PCA算法的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Hinton神经网络公开课编程练习3 O
- 下一篇: 用yum源配合源码包安装openrest