l2高斯分布_L1和L2正则的区别,如何选择L1和L2正则?L1在0处不可导,怎么处理...
生活随笔
收集整理的這篇文章主要介紹了
l2高斯分布_L1和L2正则的区别,如何选择L1和L2正则?L1在0处不可导,怎么处理...
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
首先毫無疑問的,他們都是可以防止過擬合,降低模型復雜度
L1是在loss function后面加上模型參數的1范數(也就是|xi|)L0范數的最小化問題在實際應用中是NP難問題,無法實際應用。L2是在loss function后面加上模型參數的2范數(也就是sigma(xi^2)),注意L2范數的定義是sqrt(sigma(xi^2)),在正則項上沒有添加sqrt根號是為了更加容易優化。
L1 會產生稀疏的特征,L2 會產生更多地特征但是都會接近于0。L1在特征選擇時候非常有用,而L2就只是一種規則化而已。具體的L1為什么會產生稀疏的特征,請看這里,說的很詳細。
L1對應拉普拉斯分布,L2對應高斯分布。
L1不可導可以使用Proximal Algorithms或者ADMM來解決。
有關L0正則化的這里沒說,可以看這里L0正則化
機器學習中的范數規則化之(一)L0、L1與L2范數 - zouxy09的專欄 - CSDN博客機器學習中正則化項L1和L2的直觀理解 - CSDN博客
機器學習中的范數規則化之(一)L0、L1與L2范數 - zouxy09的專欄 - CSDN博客
歡迎關注我的公眾號,第一時間追蹤相關面試題和總結:百面機器學習。回復干貨獲取相關資料和面試題總結(定期更新)。
總結
以上是生活随笔為你收集整理的l2高斯分布_L1和L2正则的区别,如何选择L1和L2正则?L1在0处不可导,怎么处理...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 惠普星15怎么进bios 惠普笔记本如何
- 下一篇: array_uniquee php_【性