LQR控制基本原理(包括Riccati方程具体推导过程)
全狀態(tài)反饋控制系統(tǒng)
狀態(tài)反饋控制器? ? ?
?
通過選擇K,可以改變的特征值,進(jìn)而控制系統(tǒng)表現(xiàn)。
LQR控制器
最優(yōu)控制,其本質(zhì)就是讓系統(tǒng)以某種最小的代價(jià)來讓系統(tǒng)運(yùn)行,當(dāng)這個(gè)代價(jià)被定義為二次泛函,且系統(tǒng)是線性的話,那么這個(gè)問題就稱為線性二次問題,設(shè)計(jì)的控制器(即問題的解)可以稱為LQR(Linear Quadratic Regulator)線性二次調(diào)節(jié)器。
1、連續(xù)時(shí)間
代價(jià)函數(shù)
一般來說,Q陣和R陣為單位對角陣,對角陣上的元素對應(yīng)著不同狀態(tài)量和控制量的權(quán)重大小,越大說明我們設(shè)計(jì)時(shí)對于該量的重視程度越大,即希望這個(gè)量在變化過程中保持較小的值,換種說法就是對于該量的“懲罰”越大。積分號說明從開始控制起到最終無限時(shí)間代價(jià)函數(shù)值的累積,因?yàn)槭嵌蔚?#xff0c;所以代價(jià)始終大于0,最終趨于0,我們的設(shè)計(jì)目標(biāo)就是得到一系列的控制序列使代價(jià)累積的最小。
具體推導(dǎo)過程
將代入代價(jià)函數(shù)J,有
假設(shè)存在一個(gè)常量矩陣P使得
將上式左側(cè)微分展開
代入控制量可以整理得到
觀察上面的等式,A,B,Q,R,P都是常值矩陣,唯一可變的是K陣,所以問題轉(zhuǎn)換為找到一個(gè)K使得代價(jià)函數(shù)最小,一種思路是如果我們可以把含有K的部分轉(zhuǎn)換成類似的結(jié)構(gòu),那么要使代價(jià)最小,只需使,那么K便可以求出。
令代入上式中,可以得到
將用待定系數(shù)法化成目標(biāo)形式,可得
且
令???????解出
代入Riccati方程中化簡后得
設(shè)計(jì)步驟
- 選擇Q、R參數(shù)矩陣
- 求解Riccati方程得到矩陣P
- 計(jì)算增益得到反饋控制量
2、離散時(shí)間
離散系統(tǒng)
代價(jià)函數(shù)
設(shè)計(jì)步驟
- 確定迭代范圍N
- 設(shè)置迭代初始值
- 從后向前循環(huán)迭代求解離散時(shí)間的代數(shù)RIccati方程
??????????????????????
- ?????循環(huán)計(jì)算反饋系數(shù)并得到控制量
????????
?參考資料:LQR最優(yōu)控制方法小結(jié) - 知乎
【控制理論】離散及連續(xù)的LQR控制算法原理推導(dǎo)_CHH3213的博客-CSDN博客_lqr控制
【Advanced控制理論】8_LQR 控制器_狀態(tài)空間系統(tǒng)Matlab/Simulink建模分析_嗶哩嗶哩_bilibili
總結(jié)
以上是生活随笔為你收集整理的LQR控制基本原理(包括Riccati方程具体推导过程)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 计算机的使用编码,计算机中使用的编码
- 下一篇: 大数据学习入门