Matlab中特征选择reliefF算法使用方法(分类与回归)
生活随笔
收集整理的這篇文章主要介紹了
Matlab中特征选择reliefF算法使用方法(分类与回归)
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
1. ReliefF簡介
ReliefF是特征選擇的一種算法,在高維特征樣本中,選取部分具有代表性的特征,從而降低樣本特征維度。它也是relief算法的進(jìn)階。Relief算法只能用來做二分類,但其算法簡單,效率高,結(jié)果不錯,因此才有了其進(jìn)階算法ReliefF。ReliefF不僅可以完成多分類任務(wù),也可以勝任回歸任務(wù)。
2. relieff()函數(shù)
示例:
[ranks,weights] = relieff(X,y,k) [ranks,weights] = relieff(X,y,k,Name,Value)(1)輸入?yún)?shù)
- X:樣本數(shù)據(jù)集
- y:與X對應(yīng)的樣本標(biāo)簽
- k:一個超參數(shù),relieff中用到了KNN最近鄰算法,k為同類樣本最近鄰的數(shù)量。需要根據(jù)不同數(shù)據(jù)處理情況調(diào)整參數(shù)
- Name:一些拓展設(shè)置,一般不常用,詳細(xì)可看matlab文檔,其中‘method’比較常用,用來選擇是做回歸還是分類任務(wù)
- Value:為Name的值,‘method’對應(yīng)的Value為’regression’或’classification’,對應(yīng)的“回歸”或分類
(2)輸出參數(shù)
- ranks:對各個維度特征按照重要程度排序,例如ranks = [3,1,2],表示第3個維度最重要,第1個維度其次,第2個維度最不重要
- weights:原樣本每個維度的重要權(quán)重,例如:weights = [0.5,0.1,0.4],表示第一個維度權(quán)重為0.5,最重要,第二個維度權(quán)重0.1,最不重要,第三個為0.4,第二重要
3. relieff()函數(shù)做分類任務(wù)特征選擇
示例代碼:
load fisheriris%matlab中自帶的數(shù)據(jù)集 [ranks,weights] = relieff(meas,species,10,'method','classification')結(jié)果如下:表示第4維度特征和第3維度特征權(quán)重較大,因此我們就可以取原數(shù)據(jù)中第4維度數(shù)據(jù)和第3維度數(shù)據(jù)用于分類,其余丟棄,將4維數(shù)據(jù)降到了2維
@注意@:標(biāo)簽是數(shù)字,函數(shù)會默認(rèn)用于回歸。如果想要標(biāo)簽是數(shù)字,但想用于分類,就需要加上‘method’,‘classification’;否則,函數(shù)會默認(rèn)用于回歸。上述例子中使用的species是字符串,因此默認(rèn)用于分類,可以不需要加’method’,‘classification’。
4. relieff()函數(shù)做回歸任務(wù)特征選擇
%針對回歸任務(wù)數(shù)據(jù)集,只需要將分類任務(wù)中的classification換成regression即可 [ranks,weights] = relieff(meas,species,10,'method','regression')總結(jié)
以上是生活随笔為你收集整理的Matlab中特征选择reliefF算法使用方法(分类与回归)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 临时文件_Go语言学习基础-文件路径、目
- 下一篇: 不恢复余数除法原理_青岛版二年级下册数学