UA SIE545 优化理论基础4 对偶理论简介1 松弛问题与Lagrange对偶
UA SIE545 優化理論基礎4 對偶理論簡介1 松弛問題與Lagrange對偶
優化理論基礎第四部分介紹對偶問題(Dual problem)及其簡單性質,是對偶理論的入門,后續章節會更深入地討論對偶問題的數學基礎及其求解方法。這一講我們介紹松弛(relaxation)這個概念以及為什么我們需要討論對偶問題。
定義1 Relaxation
考慮兩個優化問題:
zP=min?{f(x):x∈X}zR=min?{g(x):x∈Y}z_P = \min\{f(x):x \in X\} \\ z_R = \min \{g(x): x \in Y\}zP?=min{f(x):x∈X}zR?=min{g(x):x∈Y}
稱優化問題R是優化問題P的一個松弛問題,如果
評注1 根據第一個條件,我們知道最優值一定滿足zP≥zRz_P \ge z_RzP?≥zR?,因為
min?x∈Xf(x)≥min?x∈Xg(x)≥min?x∈Yg(x)\min_{x \in X}f(x) \ge \min_{x \in X} g(x) \ge \min_{x \in Y} g(x)x∈Xmin?f(x)≥x∈Xmin?g(x)≥x∈Ymin?g(x)
根據第二個條件,優化R的可行域比優化P的可行域更大,所以如果優化R是infeasible,那么優化P也是infeasible。
性質1 假設xRx_RxR?是優化R的一個最優解,如果它滿足xR∈Xx_R \in XxR?∈X, f(xR)=g(xR)f(x_R)=g(x_R)f(xR?)=g(xR?),則xRx_RxR?也是優化P的一個最優解。
證明
xRx_RxR?是優化R的一個最優解說明?x∈Y\forall x \in Y?x∈Y, g(x)≥g(xR)g(x) \ge g(x_R)g(x)≥g(xR?),根據relaxation的條件,?x∈X,f(x)≥g(x)≥g(xR)=f(xR)\forall x \in X,f(x) \ge g(x) \ge g(x_R) = f(x_R)?x∈X,f(x)≥g(x)≥g(xR?)=f(xR?),因此xRx_RxR?也是優化P的一個最優解。
證畢
例1 不求解線性規劃,考慮z?z^*z?的下界,其中z?z^*z?為
z?=min?x1,x22x1+4x2s.t.{x1+x2≥205x1+3x2≥90x2≤10,x1,x2≥0z^* = \min_{x_1,x_2} 2x_1+4x_2 \\ s.t. \begin{cases} x_1+x_2 \ge 20 \\ 5x_1+3x_2 \ge 90 \\ x_2 \le 10 ,x_1,x_2 \ge 0 \end{cases}z?=x1?,x2?min?2x1?+4x2?s.t.??????x1?+x2?≥205x1?+3x2?≥90x2?≤10,x1?,x2?≥0?
我們記這個線性規劃為P,為了找z?z^*z?的下界,根據評注1的討論,我們可以找線性規劃P的一個relaxation。但我們知道,隨便修改一個數字,讓可行域變大或者目標函數變小,比如第一個約束的20改成19或者目標函數系數從2,4改成1,2等,都可以是relaxation,那么怎么樣的relaxation才是值得我們去討論的呢?
我們在KKT理論的框架下來討論這個問題。定義Lagrange函數
?(x1,x2,u1,u2,u3)=2x1+4x2+u1(?x1?x2+20)+u2(?5x1?3x2+90)+u3(x2?10)\phi(x_1,x_2,u_1,u_2,u_3)=2x_1+4x_2+u_1(-x_1-x_2+20) \\ +u_2(-5x_1-3x_2+90)+u_3(x_2-10)?(x1?,x2?,u1?,u2?,u3?)=2x1?+4x2?+u1?(?x1??x2?+20)+u2?(?5x1??3x2?+90)+u3?(x2??10)
則KKT定理說明線性規劃P等價于加入KKT條件的優化R,其中優化R為
min??(x1,x2,u1,u2,u3),x1,x2,u1,u2,u3≥0\min \phi(x_1,x_2,u_1,u_2,u_3),x_1,x_2,u_1,u_2,u_3 \ge 0min?(x1?,x2?,u1?,u2?,u3?),x1?,x2?,u1?,u2?,u3?≥0
不難發現優化R就是線性規劃P的一個relaxation,記θ(u1,u2,u3)\theta(u_1,u_2,u_3)θ(u1?,u2?,u3?)是優化R目標函數的最優值,則
z?≥θ(u1,u2,u3),u1,u2,u3≥0z^* \ge \theta(u_1,u_2,u_3),u_1,u_2,u_3 \ge 0z?≥θ(u1?,u2?,u3?),u1?,u2?,u3?≥0
接下來我們分析優化R的目標函數,
?(x1,x2,u1,u2,u3)=(2?u1?5u2)x1+(4?u1?3u2+u3)x2+20u1+90u2?10u3\phi(x_1,x_2,u_1,u_2,u_3)=(2-u_1-5u_2)x_1\\+(4-u_1-3u_2+u_3)x_2 + 20u_1+90u_2-10u_3?(x1?,x2?,u1?,u2?,u3?)=(2?u1??5u2?)x1?+(4?u1??3u2?+u3?)x2?+20u1?+90u2??10u3?
我們需要牢記,我們的目標是最小化這個目標函數從而得到z?z^*z?的有價值的下界。如果2?u1?5u2<02-u_1-5u_2<02?u1??5u2?<0,目標函數關于x1x_1x1?單調遞減,那么對于x1≥0x_1 \ge 0x1?≥0,最小值就是x1→+∞x_1 \to +\inftyx1?→+∞的時候取得,為?∞-\infty?∞,這個下界說明z?>?∞z^*>-\inftyz?>?∞,這就是沒有價值的下界,因為我們不做這些分析也知道這個結果。因此我們需要2?u1?5u2≥02-u_1-5u_2\ge 02?u1??5u2?≥0,同理,4?u1?3u2+u3≥04-u_1-3u_2+u_3 \ge 04?u1??3u2?+u3?≥0,此時目標函數的最小值將在x1=x2=0x_1=x_2=0x1?=x2?=0時取得,因此
θ(u1,u2,u3)=20u1+90u2?10u32?u1?5u2≥04?u1?3u2+u3≥0u1,u2,u3≥0\theta(u_1,u_2,u_3) = 20u_1+90u_2-10u_3 \\ 2-u_1-5u_2\ge 0 \\ 4-u_1-3u_2+u_3 \ge 0 \\ u_1,u_2,u_3 \ge 0θ(u1?,u2?,u3?)=20u1?+90u2??10u3?2?u1??5u2?≥04?u1??3u2?+u3?≥0u1?,u2?,u3?≥0
現在我們進一步討論,雖然得到了一個比較合理的下界了,但它是關于u1,u2,u3u_1,u_2,u_3u1?,u2?,u3?的函數,為了得到一個最大的下界,我們考慮線性規劃D
max?θ(u1,u2,u3)=20u1+90u2?10u3s.t.2?u1?5u2≥04?u1?3u2+u3≥0u1,u2,u3≥0\max \theta(u_1,u_2,u_3) = 20u_1+90u_2-10u_3 \\ s.t. \ \ 2-u_1-5u_2\ge 0 \\ 4-u_1-3u_2+u_3 \ge 0 \\ u_1,u_2,u_3 \ge 0maxθ(u1?,u2?,u3?)=20u1?+90u2??10u3?s.t.??2?u1??5u2?≥04?u1??3u2?+u3?≥0u1?,u2?,u3?≥0
顯然在線性規劃的對偶理論中,線性規劃D是線性規劃P的對偶問題。
接下來我們討論怎么將線性規劃的對偶理論推廣到非線性規劃中。從例1中我們可以總結,對偶問題的決策變量是Lagrange乘子,將原來的決策變量作為對偶問題的“乘子”,這種思路是建立在KKT理論與Lagrange函數上的,我們稱這種對偶為Lagrange對偶(Lagrangian Duality)。
定義2 Lagrange對偶問題。考慮優化問題P:
min?f(x)s.t.g(x)≤0,h(x)=0,x∈X\min f(x) \\ s.t. \ g(x) \le 0, h(x) = 0, x \in Xminf(x)s.t.?g(x)≤0,h(x)=0,x∈X
定義其對偶問題為優化D:
sup?u,vθ(u,v)s.t.u≥0\sup_{u,v} \theta(u,v) \\ s.t. u \ge 0u,vsup?θ(u,v)s.t.u≥0
評注2
我們按例1的邏輯順序來梳理一下定義2,首先寫出優化P的Lagrange函數,
?(x,u,v)=f(x)+uTg(x)+vTh(x)\phi(x,u,v) = f(x)+u^Tg(x)+v^Th(x)?(x,u,v)=f(x)+uTg(x)+vTh(x)
然后關于xxx做最小化,
θ(u,v)=inf?x∈X?(x,u,v)\theta(u,v)=\inf_{x \in X}\phi(x,u,v) θ(u,v)=x∈Xinf??(x,u,v)
最后就是定義中的最大化了。
例2 線性規劃的對偶,考慮最小化
min?cTxs.t.b?Ax≤0\min c^Tx \\ s.t. b - Ax \le 0mincTxs.t.b?Ax≤0
它的對偶問題的目標函數為
θ(u)=inf?{cTx+uT(b?Ax)}=inf?{(cT?uTA)x+uTb}={uTb,ifATu=c?∞,otherwise\theta(u) = \inf\{c^Tx+u^T(b-Ax)\} \\ = \inf\{(c^T-u^TA)x+u^Tb\} = \begin{cases} u^Tb, \ if A^Tu=c \\ -\infty, \ otherwise \end{cases}θ(u)=inf{cTx+uT(b?Ax)}=inf{(cT?uTA)x+uTb}={uTb,?ifATu=c?∞,?otherwise?
因此對偶問題為
sup?uuTbs.t.ATu=c,u≥0\sup_u u^Tb \\ s.t. A^Tu = c,u \ge 0usup?uTbs.t.ATu=c,u≥0
總結
以上是生活随笔為你收集整理的UA SIE545 优化理论基础4 对偶理论简介1 松弛问题与Lagrange对偶的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 精算模型10 非参数模型0 精算数据、非
- 下一篇: R语言 非中心化F分布