當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

斯坦福2014机器学习笔记五----正则化

發布時間：2025/4/14 编程问答 21 豆豆

生活随笔收集整理的這篇文章主要介紹了斯坦福2014机器学习笔记五----正则化小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

一、綱要

　　欠擬合和過擬合

　　代價函數正則化

　　正則化線性回歸

　　正則化邏輯回歸

二、內容詳述

　　1、欠擬合和過擬合

　　欠擬合，也叫高偏差，就是沒有很好的擬合數據集的情況。如下圖中的左圖所示

　　過擬合，也叫高方差，就是雖然高階多項式可以完美的擬合所有的數據，但會導致函數過于龐大，變量太多而我們又沒有足夠的數據來約束這個模型，這就是過度擬合。過度擬合的原因，簡單來說就是過多的特征變量和過少的數據集。如下圖右。

　　過擬合帶來的效果就是，雖然可以完美的擬合現有的數據集，但是在預測新數據方面卻表現的不盡如人意。所以最適合的還是中間的方式。

　　當然上面是線性回歸的過擬合問題，邏輯回歸中也存在這樣的問題，就以多項式理解，階數越高，擬合程度越好，但是預測方面就表現的很差。那么如何解決這些問題呢？這里就要引入“正則化”的概念！

　　2、代價函數正則化

　　以第一個問題中的線性回歸過擬合為例，我們應該怎樣用正則化解決這個問題呢？我們知道如果讓高次項系數為0的話，我們就可以比較好的進行擬合。所以我們假設代價函數是，然后在求解代價函數J最小化的

過程中我們就會使Θ_3、Θ₄盡可能的小，這樣的話高次項就趨于0，就能很好的解決這個問題。這就給了我們正則化算法的啟示。

　　我們在代價函數J后面加入一個正則項，代價函數就變為，其中λ為正則化參數。需要注意的是，這里的正則項Θ的Θ_j是從j=1開始到j=n為止，而不包括Θ₀，雖然加與不加Θ₀的結果相差不大，但是按照慣例一般Θ₀單獨考慮。所以我們在使用梯度算法的時候Θ₀的參數更新要與其他Θ_j分開考慮。

　　這里需要強調的一點是，正則化參數的選擇非常重要，如果λ過大，那么就會使得Θ_j(j=1,2,3...n)都基本趨于0，也就是只剩下h_θ(x)=θ₀，就如下圖的情況，這樣就變成了欠擬合的問題(Too big lamda)，而當λ選擇合適的話，過擬合的曲線(Unregulated)就會變成良好的Regulated

　　3、正則化線性回歸

　　正則化線性回歸的代價函數J為，在使用梯度下降法之前需要對J進行偏導，，然后帶入梯度下降法得到：，之前說過這里Θ₀的參數更新要與其他Θ_j分開考慮的原因。對θ_j進行調整得到，這個式子是不是很熟悉？跟之前的梯度下降法參數更新公式很像，區別只是θ_j變成了θ_j(1-α*(λ/m))，這里1-α*(λ/m)就是一個小于1的常數，可能是0.99或0.98.這里可以看出正則化線性回歸的梯度下降算法的變化在于，每次都在原有的更新規則的基礎上令θ額外減去一個值。

　　之前我們說的線性回歸還有一種正規方程解法，我們同樣可以對線性回歸正規方程進行正則化，方法為

X = [(x⁽⁰⁾)^T ? ?(x⁽¹⁾)^T ? ?(x⁽²⁾)^T ? ?... ? ?(x⁽ⁿ⁾)^T]^T，y=[y⁽¹⁾ ? ?y⁽²⁾ ? ?y⁽³⁾ ? ?... ? ?y^(m)]^T，X是m*(n+1)維矩陣，y為m*1維矩陣

圖中矩陣的尺寸為(n+1)*(n+1)

　　4、正則化邏輯回歸

　　代價函數為，用梯度下降法進行參數更新得到的方程為：

這里雖然形式跟線性回歸的梯度下降法一樣，但是由于h_θ(x)的不同，所以兩者還是有很大差別

轉載于:https://www.cnblogs.com/kl2blog/p/7712210.html

《新程序員》：云原生和全面數字化實踐50位技術專家共同創作，文字、視頻、音頻交互閱讀

總結

以上是生活随笔為你收集整理的斯坦福2014机器学习笔记五----正则化的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： 201421440008网络攻防实验三
下一篇：百度定位sdk使用说明

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

编程问答

斯坦福2014机器学习笔记五----正则化

總結