UA SIE545 优化理论基础 例题 对偶函数的凸性与次梯度计算
UA SIE545 優化理論基礎 例題 對偶函數的凸性與次梯度計算
例 考慮對偶函數
θ(u1,u2)=min?x12+x22≤4x1(2?u1)+x2(3?u2)\theta(u_1,u_2) = \min_{x_1^2+x_2^2 \le 4} x_1(2-u_1)+x_2(3-u_2)θ(u1?,u2?)=x12?+x22?≤4min?x1?(2?u1?)+x2?(3?u2?)它是凸函數還是凹函數?計算它在(2,3)(2,3)(2,3)處的次梯度。
分析 這個對偶函數對應的原優化問題是
min?(x1,x2)∈X2x1+3x2s.t.x1≥0,x2≥0X={(x1,x2):x12+x22≤4}\min_{(x_1,x_2) \in X}2x_1+3x_2 \\ s.t.\ \ x_1 \ge0,x_2 \ge 0 \\ X = \{(x_1,x_2):x_1^2+x_2^2 \le 4\}(x1?,x2?)∈Xmin?2x1?+3x2?s.t.??x1?≥0,x2?≥0X={(x1?,x2?):x12?+x22?≤4}
不難驗證這個對偶問題滿足強對偶條件,因此原優化與對偶優化的最優值是相等的。
解
第一問:判斷對偶函數的凸性,有兩種方法:
(i) 直接法:考慮u=(u1,u2),v=(v1,v2),λ∈(0,1)u = (u_1,u_2),v=(v_1,v_2), \lambda \in (0,1)u=(u1?,u2?),v=(v1?,v2?),λ∈(0,1),θ\thetaθ的定義中,目標函數可以寫成
λθ(u)+(1?λ)θ(v)=min?x∈Xλ[x1(2?u1)+x2(3?u2)]+min?x∈X(1?λ)[x1(2?v1)+x2(3?v2)]≤min?x∈Xλ[x1(2?u1)+x2(3?u2)]+(1?λ)[x1(2?v1)+x2(3?v2)]=θ(λu+(1?λ)v)\lambda \theta(u)+(1-\lambda)\theta(v) \\ =\min_{x \in X}\lambda[x_1(2-u_1)+x_2(3-u_2)]+\min_{x \in X}(1-\lambda)[x_1(2-v_1)+x_2(3-v_2)] \\ \le \min_{x \in X} \lambda[x_1(2-u_1)+x_2(3-u_2)]+(1-\lambda)[x_1(2-v_1)+x_2(3-v_2)] \\ = \theta(\lambda u + (1-\lambda)v)λθ(u)+(1?λ)θ(v)=x∈Xmin?λ[x1?(2?u1?)+x2?(3?u2?)]+x∈Xmin?(1?λ)[x1?(2?v1?)+x2?(3?v2?)]≤x∈Xmin?λ[x1?(2?u1?)+x2?(3?u2?)]+(1?λ)[x1?(2?v1?)+x2?(3?v2?)]=θ(λu+(1?λ)v)
于是θ\thetaθ是凹函數;
(ii) 解析法:考慮求解θ(u1,u2)\theta(u_1,u_2)θ(u1?,u2?)的表達式,把x1,x2x_1,x_2x1?,x2?消掉,
θ(u1,u2)=min?x12+x22≤4x1(2?u1)+x2(3?u2)\theta(u_1,u_2) = \min_{x_1^2+x_2^2 \le 4} x_1(2-u_1)+x_2(3-u_2)θ(u1?,u2?)=x12?+x22?≤4min?x1?(2?u1?)+x2?(3?u2?)這個優化目標函數是線性函數、可行域是圓,可以用幾何法求解,當然也可以用代數法,我們先考慮代數法:
記v=[2?u1,3?u2]Tv = [2-u_1,3-u_2]^Tv=[2?u1?,3?u2?]T,則
θ(u1,u2)=min?{xTv:∥x∥≤2}\theta(u_1,u_2) = \min\{x^Tv: \left\| x \right\| \le 2\}θ(u1?,u2?)=min{xTv:∥x∥≤2}
根據Cauchy-Schwarz不等式,?∥x∥∥v∥≤xTv≤∥x∥∥v∥-\left\| x \right\| \left\| v \right\| \le x^Tv \le \left\| x \right\| \left\| v \right\|?∥x∥∥v∥≤xTv≤∥x∥∥v∥,因此
θ(u1,u2)≥min?{?∥x∥∥v∥:∥x∥≤2}=?2∥v∥,?u1,u2\theta(u_1,u_2) \ge \min\{-\left\| x \right\| \left\| v \right\|: \left\| x \right\| \le 2\}=-2\left\| v \right\|,\forall u_1,u_2θ(u1?,u2?)≥min{?∥x∥∥v∥:∥x∥≤2}=?2∥v∥,?u1?,u2?當且僅當x=?2v∥v∥x = -\frac{2v}{ \left\| v \right\|}x=?∥v∥2v?時取等。因此
θ(u1,u2)=?2∥v∥=?2(2?u1)2+(3?u2)2\theta(u_1,u_2)=-2\left\| v \right\| = -2\sqrt{(2-u_1)^2+(3-u_2)^2}θ(u1?,u2?)=?2∥v∥=?2(2?u1?)2+(3?u2?)2?
不難驗證這個是凹函數;
接下來演示一下幾何法求θ(u1,u2)\theta(u_1,u_2)θ(u1?,u2?)的表達式。
θ(u1,u2)=min?x12+x22≤4x1(2?u1)+x2(3?u2)\theta(u_1,u_2) = \min_{x_1^2+x_2^2 \le 4} x_1(2-u_1)+x_2(3-u_2)θ(u1?,u2?)=x12?+x22?≤4min?x1?(2?u1?)+x2?(3?u2?)
可行域是圓心在原點,半徑為2的圓,目標函數是斜率為2?u1u2?3\frac{2-u_1}{u_2-3}u2??32?u1??的直線族的斜率,如果2?u1u2?3=0\frac{2-u_1}{u_2-3}=0u2??32?u1??=0,則x1=0,x2=2x_1=0,x_2=2x1?=0,x2?=2時函數值最小,此時θ(u1,u2)=6?2u2\theta(u_1,u_2)=6-2u_2θ(u1?,u2?)=6?2u2?;如果2?u1u2?3<0\frac{2-u_1}{u_2-3}<0u2??32?u1??<0,則直線與圓在第三象限相切時函數值最小,對于圓而言,
2x1dx1+2x2dx2=0?dx2dx1=?x1x2=2?u1u2?32x_1dx_1+2x_2dx_2 = 0 \Rightarrow \frac{dx_2}{dx_1}=-\frac{x_1}{x_2}=\frac{2-u_1}{u_2-3}2x1?dx1?+2x2?dx2?=0?dx1?dx2??=?x2?x1??=u2??32?u1??
再根據x12+x22=4x_1^2+x_2^2 = 4x12?+x22?=4,不難解出
{x12=4(2?u1)2(2?u1)2+(3?u2)2x22=4(3?u2)2(2?u1)2+(3?u2)2\begin{cases} x_1^2 = \frac{4(2-u_1)^2}{(2-u_1)^2+(3-u_2)^2} \\ x_2^2 = \frac{4(3-u_2)^2}{(2-u_1)^2+(3-u_2)^2} \end{cases}{x12?=(2?u1?)2+(3?u2?)24(2?u1?)2?x22?=(2?u1?)2+(3?u2?)24(3?u2?)2??
如果2?u1u2?3>0\frac{2-u_1}{u_2-3}>0u2??32?u1??>0,則直線與圓在第四象限相切時函數值最小,計算過程與上面這個相同。可以算出
θ(u1,u2)=?2(2?u1)2+(3?u2)2\theta(u_1,u_2)=-2\sqrt{(2-u_1)^2+(3-u_2)^2}θ(u1?,u2?)=?2(2?u1?)2+(3?u2?)2?
顯然這個比θ(u1,u2)=6?2u2\theta(u_1,u_2)=6-2u_2θ(u1?,u2?)=6?2u2?更小,綜上,
θ(u1,u2)=?2(2?u1)2+(3?u2)2\theta(u_1,u_2)=-2\sqrt{(2-u_1)^2+(3-u_2)^2}θ(u1?,u2?)=?2(2?u1?)2+(3?u2?)2?
第二問:計算在(2,3)(2,3)(2,3)處的次梯度。次梯度的定義是
f:S→Rf:S \to \mathbb{R}f:S→R is concave where SSS is a nonempty convex set. Then ξ\xiξ is called subgradient of fff at xˉ\bar xxˉ if
f(x)≤f(xˉ)+ξT(x?xˉ),?x∈Sf(x) \le f(\bar x)+\xi^T(x-\bar x),\forall x \in Sf(x)≤f(xˉ)+ξT(x?xˉ),?x∈S
根據這個定義,假設ξ\xiξ是次梯度,則
θ(u1,u2)≤θ(2,3)+ξT[u1?2,u2?3]T≤ξT[u1?2,u2?3]T\theta(u_1,u_2) \le \theta(2,3)+\xi^T[u_1-2,u_2-3]^T \\ \le \xi^T[u_1-2,u_2-3]^Tθ(u1?,u2?)≤θ(2,3)+ξT[u1??2,u2??3]T≤ξT[u1??2,u2??3]T
根據第一問的不同證法,第二問也有兩種不同的計算方法:
方法一:如果第一問用的直接法,那么我們觀察一下
θ(u1,u2)=min?x12+x22≤4x1(2?u1)+x2(3?u2)??x12+x22≤4,θ(u1,u2)≤xT[u1?2,u2?3]T\theta(u_1,u_2) = \min_{x_1^2+x_2^2 \le 4} x_1(2-u_1)+x_2(3-u_2) \\ \Rightarrow \forall x_1^2+x_2^2 \le 4,\theta(u_1,u_2) \le x^T[u_1-2,u_2-3]^Tθ(u1?,u2?)=x12?+x22?≤4min?x1?(2?u1?)+x2?(3?u2?)??x12?+x22?≤4,θ(u1?,u2?)≤xT[u1??2,u2??3]T
把xxx換成ξ\xiξ就是我們需要的結果,于是∥ξ∥≤2\left\| \xi \right\| \le 2∥ξ∥≤2,次梯度為
{ξ:∥ξ∥≤2}\{\xi:\left\| \xi \right\| \le 2\}{ξ:∥ξ∥≤2}
方法二:如果第一問用的解析法,那么我們已經知道了θ(u1,u2)=?2(2?u1)2+(3?u2)2\theta(u_1,u_2)=-2\sqrt{(2-u_1)^2+(3-u_2)^2}θ(u1?,u2?)=?2(2?u1?)2+(3?u2?)2?
于是我們要做的是求解:
?2(2?u1)2+(3?u2)2≤ξT[u1?2,u2?3]T-2\sqrt{(2-u_1)^2+(3-u_2)^2} \le \xi^T[u_1-2,u_2-3]^T?2(2?u1?)2+(3?u2?)2?≤ξT[u1??2,u2??3]T
也就是2∥v∥≥ξTv2 \left\| v \right\| \ge \xi^Tv2∥v∥≥ξTv,根據Cauchy-Schwarz定理,∥ξ∥≤2\left\| \xi \right\| \le 2∥ξ∥≤2時對所有v∈R2v \in \mathbb{R}^2v∈R2成立,所以次梯度為
{ξ:∥ξ∥≤2}\{\xi:\left\| \xi \right\| \le 2\}{ξ:∥ξ∥≤2}
總結
以上是生活随笔為你收集整理的UA SIE545 优化理论基础 例题 对偶函数的凸性与次梯度计算的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: UA MATH523A 实分析3 积分理
- 下一篇: UA SIE545 优化理论基础 函数凸