机器学习中的训练集,验证集及测试集的关系
???????????????????????? 作者同類文章X
最近在看機器學習的東西發現驗證集的(Validation set) 有時候被提起到,以時間沒明白驗證集的真正用途。
首先,這三個名詞在機器學習領域的文章中是很常見的,以下是這三個詞的定義。?
Training set: A set of examples used for learning, which is to fit the parameters [i.e., weights] of the classifier.?
Validation set: A set of examples used to tune the parameters [i.e., architecture, not weights] of a classifier, for example to choose the number of hidden units in a neural network.?Test set: A set of examples used only to assess the performance [generalization] of a fully specified classifier.?
訓練集:學習樣本數據集,通過匹配一些參數來建立一個分類器。建立一種分類的方式,主要是用來訓練模型的。
驗證集:對學習出來的模型,調整分類器的參數,如在神經網絡中選擇隱藏單元數。驗證集還用來確定網絡結構或者控制模型復雜程度的參數。
測試集:主要是測試訓練好的模型的分辨能力(識別率等)
顯然,training set是用來訓練模型或確定模型參數的,如ANN中權值等; validation set是用來做模型選擇(model selection),即做模型的最終優化及確定的,如ANN的結構;而 test set則純粹是為了測試已經訓練好的模型的推廣能力。當然,test set這并不能保證模型的正確性,他只是說相似的數據用此模型會得出相似的結果。但實際應用中,一般只將數據集分成兩類,即training set 和test set,大多數文章并不涉及validation set。?
總結
以上是生活随笔為你收集整理的机器学习中的训练集,验证集及测试集的关系的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 恭喜郎平
- 下一篇: 关于编码ansi、GB2312、unic