當前位置：首頁 > 人工智能 > pytorch >内容正文

pytorch

深度学习（2）回归问题

發布時間：2023/12/15 pytorch 25 豆豆

生活随笔收集整理的這篇文章主要介紹了深度学习（2）回归问题小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

深度學習（2）回歸問題

一. 問題提出與解析
- 1. Machine Learning
- 2. Continuous Prediction
- 3. Linear Equation
- 4. With Noise?
- 5. Find $w^{'}$ ， $b^{'}$
- 6. Gradient Descent
二. 回歸問題實戰
- 1. 步驟
- 2. Step1: Compute Loss
- 3. Step2: Compute Gradient and update
- 4. Step3: Set $w = w^{'}$ and loop
- 5. 代碼

一. 問題提出與解析

1. Machine Learning

make decisions
going left/right $→\to$ discrete
increase/decrease $→\to$ continuous

2. Continuous Prediction

$f_θ:x→y$
$x : i n p u t d a t a$
$f (x) : p r e d i c t i o n$
$y : r e a l d a t a, g r o u n d ? t r u t h$

3. Linear Equation

y=w*x+b
1.567=w*1+b
3.043=w*2+b

$→\to$ Closed Form Solution

w=1.477
b=0.089

4. With Noise?

y=w*x+b+?
? ~ N(0,1)
1.567=w*1+b+eps
3.043=w*2+b+eps
4.519=w*2+b+eps
…
$→\to$
Y=(WX+b)

For Example

5. Find $w^{'}$ ， $b^{'}$

$WX+b-Y)]^2$
$loss=∑i(w?xi+b?yi)2loss=\sum_i{(w*x_i+b-y_i)^2}$
$MinimizelossMinimize\ loss$
$w^{'} ? x + b^{'} \to y$

6. Gradient Descent

(1) 1-D
$w′=w′?lr?dydww'=w'-lr*\frac{dy}{dw}$

$x′=x?0.005?dydwx'=x-0.005*\frac{dy}{dw}$
可以看到，函數的導數始終指向函數值變大的方向，因此，如果要求 $l o s s$ 函數的極小值的話，就需要沿導數的反方向前進，即 $?lr?dydw-lr*\frac{dy}{dw}$ ，衰減因子 $l r$ 的引入是為了防止步長變大，跨度太大。
(2) 2-D

Find $w^{'}, b^{'}$

$loss=∑i(w?xi+b?yi)2loss=\sum_i{(w*x_i+b-y_i)^2}$
分別對w和b求偏導數，然后沿著偏導數的反向前進，即:
- $w′=w?lr??loss?ww'=w-lr*\frac{?loss}{?w}$
- $b′=b?lr??loss?bb'=b-lr*\frac{?loss}{?b}$
$w^{'} ? x + b^{'} \to y$

Learning Process

Loss surface

二. 回歸問題實戰

1. 步驟

(1) 根據隨機初始化的 $w, x, b, y$ 的數值來計算 $LossFunctionLoss\ Function$ ;
(2) 根據當前的 $w, x, b, y$ 的值來計算梯度;
(3) 更新梯度，將 $w^{'}$ 賦值給 $w$ ，如此往復循環;
(4) 最后面的 $w^{'}$ 和 $b^{'}$ 就會作為模型的參數。

2. Step1: Compute Loss

共有100個點，每個點有兩個維度，所以數據集維度為 $[100, 2]$ ，按照 $x_0,y_0 ),(x_1,y_1 ),…,(x_{99},y_{99} )]$ 排列，則損失函數為:
$loss=[(w_0 x_0+b_0-y_0)]^2+[(w_0 x_1+b_0-y_1)]^2+?+[(w_0 x_{99}+b_0-y_{99})]^2$
即:
$loss=∑i(w?xi+b?yi)2loss=\sum_i(w*x_i+b-y_i)^2$
初始值設 $w_0=b_0=0$ 。

(1) b和w的初始值都為0，points是傳入的100個點，是data.csv里的數據;
(2) len(points)就是傳入數據點的個數，即100; range(0, len(points))就代表從0循環到100;
(3) x=points[i, 0]表示取第i個點中的第0個值，即第一個元素，相當于p[i][0]; 同理，y=points[i, 1]表示取第i個點中的第1個值，即第二個元素，相當于p[i][1];
(4) totalError為總損失值，除以是len(points)是平均損失值。

3. Step2: Compute Gradient and update

$loss_0=(wx_0+b-y_0)^2$
$?loss0?w=2(wx0+b?y0)x0\frac{?loss_0}{?w}=2(wx_0+b-y_0)x_0$
$?loss?w=2∑(wxi+b?yi)xi\frac{?loss}{?w}=2\sum(wx_i+b-y_i)x_i$
$?loss?b=2∑(wxi+b?yi)\frac{?loss}{?b}=2\sum(wx_i+b-y_i)$
$w′=w?lr??loss?ww'=w-lr*\frac{?loss}{?w}$
$b′=b?lr??loss?bb'=b-lr*\frac{?loss}{?b}$

4. Step3: Set $w = w^{'}$ and loop

$w \leftarrow w^{'}$
$b \leftarrow b^{'}$

計算出最終的w和b的值就可以帶入模型進行預測了:
$w^{'} x + b^{'} \to p r e d i c t$

5. 代碼

import numpy as np# y = wx + b def compute_error_for_line_given_points(b, w, points):totalError = 0for i in range(0, len(points)):x = points[i, 0]y = points[i, 1]# computer mean-squared-errortotalError += (y - (w * x + b)) ** 2# average loss for each pointreturn totalError / float(len(points))def step_gradient(b_current, w_current, points, learningRate):b_gradient = 0w_gradient = 0N = float(len(points))for i in range(0, len(points)):x = points[i, 0]y = points[i, 1]# grad_b = 2(wx+b-y)b_gradient += (2 / N) * ((w_current * x + b_current) - y)# grad_w = 2(wx+b-y)*xw_gradient += (2 / N) * x * ((w_current * x + b_current) - y)# update w'new_b = b_current - (learningRate * b_gradient)new_w = w_current - (learningRate * w_gradient)return [new_b, new_w]def gradient_descent_runner(points, starting_b, starting_w, learning_rate, num_iterations):b = starting_bw = starting_w# update for several timesfor i in range(num_iterations):b, w = step_gradient(b, w, np.array(points), learning_rate)return [b, w]def run():points = np.genfromtxt("data.csv", delimiter=",")learning_rate = 0.0001initial_b = 0 # initial y-intercept guessinitial_w = 0 # initial slope guessnum_iterations = 1000print("Starting gradient descent at b = {0}, w = {1}, error = {2}".format(initial_b, initial_w,compute_error_for_line_given_points(initial_b, initial_w, points)))print("Running...")[b, w] = gradient_descent_runner(points, initial_b, initial_w, learning_rate, num_iterations)print("After {0} iterations b = {1}, w = {2}, error = {3}".format(num_iterations, b, w,compute_error_for_line_given_points(b, w, points)))if __name__ == '__main__':run()

運行結果如下:

可以看到，在 $w = 0, b = 0$ 的時候，損失值 $e r r o r \approx 5565.11$ ;
在1000輪迭代后， $w \approx 1.48, b \approx 0.09$ ，損失值 $e r r o r \approx 112.61$ ，要大大小于原來的損失值。

參考文獻:
[1] 龍良曲:《深度學習與TensorFlow2入門實戰》

總結

以上是生活随笔為你收集整理的深度学习（2）回归问题的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

深度

上一篇：我，一名记者，面对ChatGPT慌的一比
下一篇：猜一猜以下哪种动物属于秦岭四宝？蚂蚁庄园