机器学习套路三步走
機器學習的套路
- 1.model如何對現實的場景進行抽象
- 2.model如何對參數進行求解
- 3.model的效果如何評價
1.抽象
例如線性回歸,就是認為預測變量y和特征X之間存在線性關心,老掉牙的例子就是房價和地區收入,人口密度等等的線性關系
線性回歸的數學假設有兩個部分:
1. y的預測值是數據特征的線性變換。這里的參數是一組系數。而y的系數和數據特征的線性組合。
2.y的預測值和實際值之間存在一個誤差,這個誤差是符合正太分布的
2.參數求解
參數求解每個模型都不一樣,一般通用的就是SGD和各種變種
還以上面的線性回歸為例,求解的參數就是y=Wx中的W
3.評價
評價模型的效果好不好,均方誤差,logloss等等
上面的線型模型因為假設預測值和實際值的誤差是符合正太分布,所以一般用均方誤差
總結
第一步抽象很重要,第二步作為普通人主要是使用現成的算法進行參數求解,第三步往往已經在實際的生產環境中確定了模型的評價標準
一般的經驗是在用一個模型對數據進行訓練的時候,如果訓練集上欠擬合,可能是模型的表征能力不行對應;如果在測試集上過擬合,那可能就是模型的表征能力太強,噪聲都被學習了。至于模型的迭代和改進這又是另一個問題了。
轉載于:https://www.cnblogs.com/peinwu/p/10070191.html
總結
- 上一篇: django HttpResponse的
- 下一篇: Win10系统下怎么打开pkg文件?