【控制】《最优控制理论与系统》-胡寿松老师-第2章-最优控制中的变分法
《最優控制理論與系統》-胡壽松老師-第2章-最優控制中的變分法
- 第2章 最優控制中的變分法
- 2.1 泛函與變分
- 2.1.1 線性賦范空間
- 2.1.2 泛函及其定義域
- 2.1.3 泛函的變分
- 定義2-13
- 2.1.4 泛函極值與變分引理
- 2.2 歐拉方程
- 2.2.1 無約束泛函極值的必要條件
- 定理2-6
- 2.2.2 有等式約束的泛函極值的必要條件
- 2.2.3 泛函極小值的充分條件
- 2.3 橫截條件
- 2.3.1 末端時刻固定時
- 2.3.2 末端時刻自由時
- 2.3.3 初始時刻自由時
- 2.4 用變分法解最優控制問題
- 2.4.1 可用變分法求解的最優控制問題
- 2.4.2 末端時刻固定時的最優解
- 2.4.3 末端時刻自由時的最優解
- 2.5 角點條件與內點約束
- 2.5.1 維爾斯特拉斯-歐特曼條件(角點條件)
- 2.5.2 內點約束條件
第2章 最優控制中的變分法
2.1 泛函與變分
2.1.1 線性賦范空間
2.1.2 泛函及其定義域
2.1.3 泛函的變分
泛函的變分與函數的微分,其定義幾乎完全相當。
定義2-13
設 J(x)J(x)J(x) 是線性賦范空間 RnR^nRn 上的連續泛函,若其增量可表示為
ΔJ(x)=J(x+δx)?J(x)=L(x,δx)+r(x,δx)\begin{aligned} \Delta J(x) &= J(x + \delta x) - J(x) \\ &= L(x, \delta x) + r(x, \delta x) \end{aligned}ΔJ(x)?=J(x+δx)?J(x)=L(x,δx)+r(x,δx)?
式中 L(x,δx)L(x, \delta x)L(x,δx) 是關于 δx\delta xδx 的線性連續泛函, r(x,δx)r(x, \delta x)r(x,δx) 是關于 δx\delta xδx 的高階無窮小,則
δJ=L(x,δx)\delta J = L (x, \delta x)δJ=L(x,δx)
稱為泛函 J(x)J(x)J(x) 的變分。
泛函的變分就是泛函增量的線性主部。當一個泛函具有變分時,也稱該泛函可微。像函數的微分一樣,泛函的變分可以利用求導方法來確定。
2.1.4 泛函極值與變分引理
2.2 歐拉方程
2.2.1 無約束泛函極值的必要條件
定理2-6
對于無約束泛函極值,使二次型性能泛函取極致的必要條件,是軌線 x(t)x(t)x(t) 滿足下列歐拉方程:
?L?x?ddt?L?x˙=0\frac{\partial L}{\partial x} - \fracze8trgl8bvbq{dt} \frac{\partial L}{\partial \dot{x}} = 0?x?L??dtd??x˙?L?=0
求解上式歐拉方程所需的兩點邊界值就是問題描述中已知的端點條件:
x(t0)=x0,x(tf)=xfx(t_0) = x_0,\quad x(t_f) = x_fx(t0?)=x0?,x(tf?)=xf?
2.2.2 有等式約束的泛函極值的必要條件
對于有約束條件 f(x,x˙,t)=0f(x, \dot{x}, t) = 0f(x,x˙,t)=0,使泛函取極值的必要條件,是軌線 x(t)x(t)x(t) 滿足下列歐拉方程:
?L?x?ddt?L?x˙=0\frac{\partial L}{\partial x} - \fracze8trgl8bvbq{dt} \frac{\partial L}{\partial \dot{x}} = 0?x?L??dtd??x˙?L?=0
其中,L(x,x˙,λ,t)=g(x,x˙,t)+λT(t)f(x,x˙,t)L(x, \dot{x}, \lambda, t) = g(x, \dot{x}, t) + \lambda^T(t) f(x, \dot{x}, t)L(x,x˙,λ,t)=g(x,x˙,t)+λT(t)f(x,x˙,t)
2.2.3 泛函極小值的充分條件
由于歐拉方程只是泛函能取極值的必要條件。下面給出泛函取極值的充分條件。
(1)無約束情況,除歐拉方程成立外,還需以下三個勒讓德條件之一成立,
[?2L?x2?2L?x?x˙(?2L?x?x˙)T?2L?x˙2]>0\left[\begin{matrix} \frac{\partial^2 L}{\partial x^2} & \frac{\partial^2 L}{\partial x \partial \dot{x}} \\ (\frac{\partial^2 L}{\partial x \partial \dot{x}})^T & \frac{\partial^2 L}{\partial \dot{x}^2} \\ \end{matrix}\right] > 0[?x2?2L?(?x?x˙?2L?)T??x?x˙?2L??x˙2?2L??]>0
或
?2L?x2?ddt?2L?x?x˙≥0,?2L?x˙2>0\frac{\partial^2 L}{\partial x^2} - \fracze8trgl8bvbq{dt}\frac{\partial^2 L}{\partial x \partial \dot{x}} \ge 0, \quad \frac{\partial^2 L}{\partial \dot{x}^2} > 0?x2?2L??dtd??x?x˙?2L?≥0,?x˙2?2L?>0
或
?2L?x2?ddt?2L?x?x˙>0,?2L?x˙2≥0\frac{\partial^2 L}{\partial x^2} - \fracze8trgl8bvbq{dt}\frac{\partial^2 L}{\partial x \partial \dot{x}} > 0, \quad \frac{\partial^2 L}{\partial \dot{x}^2} \ge 0?x2?2L??dtd??x?x˙?2L?>0,?x˙2?2L?≥0
(2)有約束情況,相同的勒讓德條件,只是 LLL 不同,LLL 是構造出來的含有拉格朗日乘子向量 λ\lambdaλ 的泛函。
2.3 橫截條件
2.3.1 末端時刻固定時
橫截條件的一般表達式為
(?L?x˙)T∣tfδx(tf)?(?L?x˙)T∣t0δx(t0)=0(\frac{\partial L}{\partial \dot{x}})^T |_{t_f} \delta x(t_f) - (\frac{\partial L}{\partial \dot{x}})^T |_{t_0} \delta x(t_0) = 0(?x˙?L?)T∣tf??δx(tf?)?(?x˙?L?)T∣t0??δx(t0?)=0
2.3.2 末端時刻自由時
(1)起點固定,末端自由
L?x˙T(t)?L?x˙∣tf=0(?L?x˙)∣tf=0x(t0)=x0}\left.\begin{aligned} L - \dot{x}^T(t) \frac{\partial L}{\partial \dot{x}} |_{t_f} = 0 \\ (\frac{\partial L}{\partial \dot{x}}) |_{t_f} = 0 \\ x(t_0) = x_0 \\ \end{aligned}\right\}L?x˙T(t)?x˙?L?∣tf??=0(?x˙?L?)∣tf??=0x(t0?)=x0??????????????
(2)起點固定,末端受約束
[L+(c˙?x˙)T?L?x˙∣tf=0x(tf)=c(tf)x(t0)=x0}\left.\begin{aligned} [L + (\dot{c} - \dot{x})^T \frac{\partial L}{\partial \dot{x}} |_{t_f} = 0 \\ x(t_f) = c(t_f) \\ x(t_0) = x_0 \\ \end{aligned}\right\}[L+(c˙?x˙)T?x˙?L?∣tf??=0x(tf?)=c(tf?)x(t0?)=x0????????????
2.3.3 初始時刻自由時
(1)末端固定,起點受約束
[L+(Ψ˙0?x˙)T?L?x˙]∣t0=0x(t0)=Ψ0(t0)x(tf)=xf}\left.\begin{aligned} [L + (\dot{\Psi}_0 - \dot{x})^T \frac{\partial L}{\partial \dot{x}}] |_{t_0} = 0 \\ x(t_0) = \Psi_0(t_0) \\ x(t_f) = x_f \\ \end{aligned}\right\}[L+(Ψ˙0??x˙)T?x˙?L?]∣t0??=0x(t0?)=Ψ0?(t0?)x(tf?)=xf????????????
(2)末端固定,起點自由
(L?x˙T?L?x˙)∣t0=0(?L?x˙)∣t0=0x(tf)=xf}\left.\begin{aligned} (L - \dot{x}^T \frac{\partial L}{\partial \dot{x}}) |_{t_0} = 0 \\ (\frac{\partial L}{\partial \dot{x}}) |_{t_0} = 0 \\ x(t_f) = x_f \\ \end{aligned}\right\}(L?x˙T?x˙?L?)∣t0??=0(?x˙?L?)∣t0??=0x(tf?)=xf??????????????
2.4 用變分法解最優控制問題
變分法是處理泛函的數學領域,和處理函數的普通微積分相對。 … 在尋找函數的極大和極小值時,在一個解附近的微小變化的分析給出一階的一個近似。 它不能分辨是找到了最大值或者最小值(或者都不是)。 變分法在理論物理中非常重要:在拉格朗日力學中,以及在最小作用量原理在量子力學的應用中。
宗量是來自泛函和復變函數的概念,在討論泛函的連續以及其他性質的時候就要引出這個概念,它的 Taylor 展開式就要這個概念,實際上通俗的理解這個概念,就是自變量。為了防止與函數的自變量引起誤會,那就出現這個概念了。
2.4.1 可用變分法求解的最優控制問題
最優控制問題是:尋找最優解 x?(t)x^*(t)x?(t) 和 u?(t)u^*(t)u?(t),使系統(微分方程)從已知初態,轉移到要求的目標集,并使給定的性能泛函達到極值。
至于變分法,可以結合微分法來理解,就是目標函數相較于自變量(也叫宗量)的微分(也叫變分)為零時,目標函數達到極值。
2.4.2 末端時刻固定時的最優解
(1)末端時刻固定時最優解的必要條件
1)末端受約束
2)末端自由
3)末端固定
(2)末端時刻固定時的最優解的充分條件
等價勒讓德條件之一成立
2.4.3 末端時刻自由時的最優解
(1)末端受約束時最優解的必要條件
(2)末端自由時最優解的必要條件
(3)末端固定時最優解的必要條件
2.5 角點條件與內點約束
用變分法求解最優控制時,要求容許軌線 x(t)x(t)x(t) 連續可微。
但是實際上常有軌線為分段光滑情況,即 x(t)x(t)x(t) 在有限個點上連續但不可微,這種點稱為角點。
2.5.1 維爾斯特拉斯-歐特曼條件(角點條件)
?L?x˙∣t1?=?L?x˙∣t1+\frac{\partial L}{\partial \dot{x}} | _{t_1^-} = \frac{\partial L}{\partial \dot{x}} | _{t_1^+}?x˙?L?∣t1???=?x˙?L?∣t1+??
(L?x˙T?L?x˙)∣t1?=?(L?x˙T?L?x˙)∣t1+(L - \dot{x}^T \frac{\partial L}{\partial \dot{x}}) | _{t_1^-} = -(L - \dot{x}^T \frac{\partial L}{\partial \dot{x}}) | _{t_1^+}(L?x˙T?x˙?L?)∣t1???=?(L?x˙T?x˙?L?)∣t1+??
2.5.2 內點約束條件
狀態軌線的中間點稱為內點。
《新程序員》:云原生和全面數字化實踐50位技術專家共同創作,文字、視頻、音頻交互閱讀總結
以上是生活随笔為你收集整理的【控制】《最优控制理论与系统》-胡寿松老师-第2章-最优控制中的变分法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【控制】《最优控制理论与系统》-胡寿松老
- 下一篇: 【Arduino】十秒挑战