输入参数的数目不足_sklearn.decomposition.PCA 参数速查手册
sklearn常用的API參數解析:sklearn.linear_model.LinearRegression
調用
sklearn.decomposition.PCA(n_components=None, copy=True, whiten=False, svd_solver='auto', tol=0.0, iterated_power='auto', random_state=None)參數
n_components
釋義
PCA 算法中所要保留的主成分個數 n,也即保留下來的特征個數 n
設置
int 或者 string,缺省時默認為 None,所有成分被保留。賦值為 int,比如=1,將把原始數據降到一個維度 賦值為 string,比如'mle',將自動選取特征個數 n,使得滿足所要求的方差百分比
whiten
釋義
白化,使得每個特征具有相同的方差。
設置
bool,缺省時默認為 False 如果 PCA 降維后有后續的數據處理動作,可以考慮白化
svd_solver
釋義
定奇異值分解 SVD 的方法
設置
auto PCA 類自動選擇下述三種算法權衡
randomized
適用于數據量大,數據維度多同時主成分數目比例又較低的 PCA 降維
full
傳統意義上的 SVD,使用了 scipy 庫對應的實現
arpack
直接使用 scipy 庫的 sparse SVD 實現,和 randomized 的適用場景類似
copy
釋義
表示是否在運行算法時,將原始訓練數據復制一份。
設置
若為 True,則運行 PCA 算法后,原始訓練數據的值不會有任何改變,因為是在原始數據的副本上進行運算;若為 False,則運行 PCA 算法后,原始訓練數據的值會改,因為是在原始數據上進行降維計算。
tol
停止求解的標準,float 類型,默認值為 0 當 svd_solver 選擇‘arpack’時,其運行 SVD 算法的容錯率
iterated_power
int 類型或者 str 類型,默認值為‘auto’ 當 svd_solver 選擇‘randomized’時,其運行 SVD 算法的的迭代次數
random_state
int 類型,默認為 None 偽隨機數發生器的種子,在混洗數據時用于概率估計
屬性
components_
返回具有最大方差的成分
explained_variance_
降維后的各主成分的方差值。方差值越大,則說明越是重要的主成分
explained_variance_ratio_
降維后的各主成分的方差值占總方差值的比例,這個比例越大,則越是重要的主成分
singular_values_
對應的每個成分的奇異值
mean_
根據訓練集估算的特征經驗均值=X.mean(axis = 0)
n_components_
返回所保留的成分個數n
n_features_
訓練數據的特征個數
n_samples_
訓練數據的樣本數
noise_variance_
返回噪聲的協方差
方法
fit(self,?X[,?y])
用數據X來訓練PCA模型
fit_transform(self,?X[,?y])
用X來訓練PCA模型,同時返回降維后的數據
get_covariance(self)
計算數據協方差( 用生成模型)
get_params(self[,?deep])
獲取PCA的參數
get_precision(self)
計算數據精度矩陣( 用生成模型)
inverse_transform(self,?X)
將降維后的數據轉換成原始數據,但可能不會完全一樣
score(self,?X[,?y])
計算所有樣本的log似然平均值
score_samples(self,?X)
返回每個樣本的對數似然值
set_params(self,?**params)
設置PCA的參數
transform(self,?X)
將數據X轉換成降維后的數據,當模型訓練好后,對于新輸入的數據,也可以用transform方法來降維
(完)
總結
以上是生活随笔為你收集整理的输入参数的数目不足_sklearn.decomposition.PCA 参数速查手册的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python天气预报的功能介绍_pyth
- 下一篇: 北京环球影城孕妇能玩吗