如何来玩MNIST数据集?
MNIST數(shù)據(jù)集是一個基本的手寫字體識別數(shù)據(jù)集,包含50000個訓(xùn)練樣本和10000個測試樣本,都是28*28的分辨率,可以用來做很多機(jī)器學(xué)習(xí)算法的研究。下面來看看這個數(shù)據(jù)集有哪些方法來玩。
之前已經(jīng)玩過了,使用libsvm來對手寫數(shù)字進(jìn)行分類,最終效果不錯,手寫字體達(dá)到了98+%的正確率,在李春光老師的課上提到最高可以提到99.8%左右。不過一般情況下,98%已經(jīng)夠用了。
SVM的評價(jià):
有監(jiān)督學(xué)習(xí)方法,準(zhǔn)確率高,訓(xùn)練較慢(小時級別),訓(xùn)練后預(yù)測較快(只依賴支持向量)。
其他還可以玩的方法有:
1. KNN
這是最簡單基本的機(jī)器學(xué)習(xí)方法。
2. PCA
降維并保持特征feature。李春光老師的課上,將數(shù)據(jù)集降維到二維平面上,可以基本明顯的將他們分開來。
3. 聚類
除了KNN,其他聚類方法。
4. ANN
神經(jīng)網(wǎng)絡(luò)來一發(fā)。也是有監(jiān)督訓(xùn)練,試驗(yàn)下10個hidden unit下的輸出?三層網(wǎng)絡(luò)到底能有什么效果?
5. 線性回歸、邏輯回歸
使用回歸能有多高的正確率?猜測不高,但是可以實(shí)踐看一下。
總結(jié)
以上是生活随笔為你收集整理的如何来玩MNIST数据集?的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 回归、线性回归和逻辑回归【逻辑回归部分待
- 下一篇: 机器学习中的lazy method与ea