3. 机器学习中为什么需要梯度下降_机器学习中一些模型为什么要对数据归一化?...
一般做機器學習應用的時候大部分時間是花費在特征處理上,其中很關鍵的一步就是對特征數據進行歸一化,為什么要歸一化呢?很多同學并未搞清楚,維基百科給出的解釋:
1)歸一化后加快了梯度下降求最優解的速度
藍色的圈圈圖代表的是兩個特征的等高線。其中左圖兩個特征X1和X2的區間相差非常大,X1區間是[0,2000],X2區間是[1,5],其所形成的等高線非常尖。當使用梯度下降法尋求最優解時,很有可能走“之字型”路線(垂直等高線走),從而導致需要迭代很多次才能收斂;
而右圖對兩個原始特征進行了歸一化,其對應的等高線顯得很圓,在梯度下降進行求解時能較快的收斂。
因此如果機器學習模型使用梯度下降法求最優解時,歸一化往往非常有必要,否則很難收斂甚至不能收斂。
2)歸一化有可能提高精度
一些分類器需要計算樣本之間的距離(如歐氏距離),例如KNN。如果一個特征值域范圍非常大,那么距離計算就主要取決于這個特征,從而與實際情況相悖(比如這時實際情況是值域范圍小的特征更重要)。
歡迎關注我的公眾號,第一時間追蹤相關面試題和總結:百面機器學習。回復干貨獲取相關資料和面試題總結(定期更新)。
處理數據時不進行歸一化會有什么影響?歸一化的作用是什么?什么時候需要歸一化?有哪些歸一化的方法? 機器學習中為什么需要對數據進行歸一化? - CSDN博客 為什么要特征標準化 (機器學習) (簡單理解一下標準化的意思)概率模型不需要歸一化,因為它們不關心變量的值,而是關心變量的分布和變量之間的條件概率,如決策樹、rf。而像adaboost、gbdt、xgboost、svm、lr、KNN、KMeans之類的最優化問題就需要歸一化。(小伙伴要記清楚哦,或者用sklearn里面的庫跑一下模型看看呢)
筆者只是一些問題的搬運工,具體需要對問題進行深入的小伙伴還望自己閱讀相關文獻,這里只是提出一些問題,以便于面試時問到,如果內容有一些錯誤,還望批評指正!
米娜 Thanks?(・ω・)ノ
總結
以上是生活随笔為你收集整理的3. 机器学习中为什么需要梯度下降_机器学习中一些模型为什么要对数据归一化?...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 一文讲清,MySQL数据库一行数据在磁盘
- 下一篇: mysql 关闭in自动排序_为什么My