[转载]模糊系统:挑战与机遇并存——十年研究之感悟 王立新
| [轉載]模糊系統:挑戰與機遇并存——十年研究之感悟 王立新 |
| http://www.ee.ust.hk/ece.php http://www.ee.ust.hk/~eewang/ 模糊系統:挑戰與機遇并存——十年研究之感悟 王立新王立新 于1984和1987年在西北工業大學分別獲學士和碩士學位 1992年于美南加州大學獲博士學位。1993年至今任教于香 港科技大學電機與電子工程系。研究成果被廣泛引用?,F為Automatic和IEEE Transaction on Fuzzy Systems 的副主編。負責有關模糊控制、模糊神經網絡、模糊系統逼近性能等方面論文的評審工作。 一直以來,模糊系統就是個充滿爭議的領域。從1990年我進入這個領域至今己整整十個年頭了。從開始剛到美國的博士生,拜師于模糊理論的創始人Zadeh 教授,到現在Automatic和IEEE Transaction on Fuzzy Systems 的 副主編,我一直沒有離開過這個領域。在一個充滿爭議的領域內工作是艱辛的。目睹這個領域從冷變熱 從普遍懷疑到基本接受,感悟甚多。這里借著這 個專刊的機遇,將感悟的一些要點寫出來與大家共享。 由于這些觀點帶有強烈的個人色彩,而又是針對一些敏感性且富有爭議的話題,所以敬請大家帶 探討的眼光來看。歡迎大家的批評與討論。 1 、挑戰 作為一個模糊系統領域的研究者,我最大的痛苦是在很多情況下還沒開口就已經被歸入一類人了。 這類人沒有嚴格的科學態度與積極的進取精神,這類 人做不出嚴格的理論結果所以就"模糊"一下算了,這類人沒有堅實的功底來解決傳統領域中的難題,所以就來到 "模糊"里面來淘金,還美其名曰提 出種種創新思想。為什么很多傳統領域的研究者對模糊理論持這樣的懷疑態度呢?我想有以下幾個方面的原因 1.1 模糊理論引起爭議的原因 原因1 模糊理論的某些出發點有問題 在一些模糊理論論文的引言中(包括一些經典論文)經常會看到這樣的話語:傳統理論的要求太精細了,越來越難以解決日益復雜的實際問題,所以需要一種"模 糊"理論。言外之意,在這里嚴格的證明、推導與驗證是不需要的。模糊模糊就行了 我不敢肯定有多大比例的模糊理論研究者持這種觀點,但這樣的研 究者肯定不在少數。而且在不同的場合不斷地傳播著這種觀點。這種觀點的支持者肯定有他們的道理,由于篇幅有限無法在這里就這個優點進行深入討論。所能說的 是我個人是非常反對這種觀點的,嚴格是在任何情況下都必須堅持的基本原則,不能以問題復雜為借口放棄。 原因2 模糊理論體系有不完善的地方 從工程應用的角度而言,20世紀90年代以前的模糊系統理論有兩個弱點。一是沒有一套系統而有效的方法來獲取知識,而只能采用專家問卷形式,費時日又難以 得到滿意的結果;二是缺少完整的理論體系來保證系統的穩定性、收斂性等基本要求。20世紀90年代以來模糊系統理論在這兩個方面取得了突破性的進展,利用 各種學習算法我們現在可以從數據中學習知識(所謂的模糊神經網絡)。而越來越多的具有嚴格數學證明的模糊控制論文的出現(如本專刊的大部分論文)使得模糊 控制不再是一種只能基于經驗的簡單控制器,而是具有嚴格理論支持的高性能非線性控制器。所以近年來基于這個原因,對模糊控制的批評越來越少。我們高興地看 到模糊系統的理論支柱已基本建立,我們的任務是不斷地完善它。 原因3 模糊領域的論文質量參差不齊 模糊控制的特點之一是容易上手:幾條規則,幾個仿真,結果還不錯——一篇論文,是應急(畢業、交差、保住飯碗等)的好方法。應急者能寫出好論文嗎?傳統領 域(如經典控制理論)就不同,必須經過嚴格的訓練,修很多門課才能上手。所以傳統領域較難用來應急(相對于模糊領域而言),一個領域質量差的論文多了,人 們對它的評價自然也就低了。但是,大浪淘沙,好論文終究會浮出水面。當積累的好論文多了這個領域也就慢慢成熟了。親身經歷這個成熟過程和領域一起成長,是 一件非常爽心的事。歡迎大家的參加。 原因4 部分模糊理論研究者對傳統領域不加分析地批評與否定 這與原因1中的優點有直接關系。這些論文一上來就否定傳統理論,說傳統理論不能解決某某問題,所以需要模糊理論。這種批評的很大一部分并不是建立在對傳統 理論深入分析的基礎上的。這樣的批評的后果就是將模糊理論與傳統理論對立起來,使模糊理論成為眾矢之的。近年來以Zadeh為首倡導的"軟計算"試圖將模 糊理論與其它傳統及新興理論溶為一體。"加強合作,避免對抗"取得了良好的效果。 1.2模糊理論常被問及的問題 問題1?????? 能否給出一個例子,只能用模糊控制來解決,而其它方法無法解決?(這是在各大控制會議上經常被問到的問總) 回答。有兩個回答,一個簡單一個復雜。簡單的回答是,這個問題不應該這樣問。因為沒有任何理論是解決某個問題的唯一方法(就絕大部分工程理論 而言)。請問什么問題只能用線性控制理論解決、而不能采用其它控制方案?問題是方法的好壞,而不是是否唯一。模糊控制是眾多控制方案中的一種,對某些問題 極有可能給出優于其他控制方案的控制結果這些問題有以下特點:一是沒有可用的數學模型,而被控對象又呈強非線性(因此現代控制與PID控制都難以使用); 另一個特點是有很好的專家經驗,充分利用這些經驗能明顯提高控制性能。這就引出了第二個復雜的回答。有這樣的例子。這個例子只有以上兩個特點,由于篇幅有 限,構造具體例子的任務就留給讀者自己了。 問題2?? 我們不需要模糊理論,因為模糊理論能解決的問題用概率論同樣可以解決而且會解決得更好(這是模糊與隨機辯論中最突出的論點)。 回答?;卮疬@個問題先要了解這個問題的起因,Zadeh提出模糊理論的出發點之一是描述不確定性。不確定性是多種多樣的,有模糊性、隨機性等。隨機性用概 率分布函數來描述,而模糊性則用模糊集的隸屬函數來描述,這是引入模糊集的基本出發點之一。而概念論的支持者正是懷疑這個基本出發點。他們認為所謂的模糊 不確定性同樣可以用概率分布函數來描述,他們認為模糊理論支持者在評價概率論時只提到了概率的頻率解釋,而忽略了概念的主觀解釋,即主觀概率及 Bayesian理論。因此,不需要一種專門的模糊理論來描述模糊不確定性,用概率論就夠了,基于概率論豐富的內涵及完整的理論體系肯定能得出更好的結 果。這是一個極具爭議的話題,如果只對不確定性的描述這一個問題來講,我個人同意概率論支持的觀點。問題是描述了以后怎么辦。我用一個函數描述一個不確定 現象,如 "很熱"這個函數叫什么并不重要(叫做模糊隸屬函數或概率分布函數)。重要的是下一步該怎么辦,該怎樣處理這個函,這是模糊理論與概 率論的分叉點。概率論的公理體系對運算有著嚴格的限制,而模糊理論就寬松與靈活得多正是這種寬松與靈活使得模糊理論在描述人類語言交流的各種復雜與充滿矛 盾的現象時變得得心應手。因此,模糊理論更適用于描述用人類語言表達的知識,并將這些知識應用于各種具體問題;而概率論更適用于描述數據的不確定性,進而 除去這些不確定性而透視數據所代表的核心內容。 問題3??????? 你所講的方法沒有什么模糊的地方。為什么叫做模糊系統方法?(這是我在宣讀完一篇論文后常被問到的一個問題)。 回答。人們常有一種誤解,認為模糊系統方法就是把問題變模糊。其實事實正好相反模糊方法是把模糊現象用確定的數學函數來表示。從而他模糊問題 變得清晰,即模糊方法本質上是解模糊,而不是模激化。"很熱"是一個模糊現象。而一旦用一個隸屬函數來描述"很熱","很熱"就不再模糊了,"很熱"就等 于這個隸屬函數。怎樣確定這個隸屬函數是另外一個問題,與模糊無關。比如可通過數據的學習來確定隸屬函數,還可用專家問卷方法等等。 問題4??? 模糊系統與其它非線形建模方法相比,如神經網絡、分段多項式(Spline)、決策樹、小波級數等優點在哪里?(這是我最喜歡問答的問題,因為一旦提問者接受了我的回答,他(她)很有可能在以后的研究與應用中嘗試使用模糊系統方法) 回答。模糊系統、神經網絡、分段多項式、決策樹、小波級數都是用來描述非線性關系時在非線性建模的世界里沒有絕對最優的方法。因為非線性關系包含所有可能 的關系,對于某種特定的方法我們總能找出適應于這種方法的非線性關系,從而使得這種方法對這類非線性關系為最優 。正是由于這個原因,所以才山 現了以上眾多非線性建模方法。那么怎樣比較不同方法的好壞呢?我想可以基于以下四個方面來考慮 1) 逼近精度與復雜度的平衡 以上方法都是萬能逼近器,即使用足夠多的項及參數以上方法均能逼近任意非線性函數到任意精度。項及參數越多,系統的復雜度就越高,而一般來講逼近精度也就 越高。現在的問題是對于相近的復雜度,哪種方法所能表達的非線性關系更加靈活,更加一般。在這個方面模糊系統、神經網絡、分段多項式、決策樹都是很不錯 的。具體地講,通過隸屬函數位置、形狀的選擇及不同的組合。模糊系統可以相當靈活地描述各種非線性關系。神經網絡有類似于投影的特性,可以自動尋找非線性 的方位,從而有效地表達。分段多項式及決策樹則通過區域的靈活劃分,簡處從簡,繁處用繁,效率很高。小波級數要差一點。因為小波級數的原始出發點是一維信 號的分解,直接推廣到高維后效率變低。 2) 學習算法的收斂速度 一般認為神經網絡及分段多項或收斂速度慢。但現在的情況并非一定如此,神經網絡及分段多項式也在不斷地改進。引入快速算法,收斂速度并不差。 3) 結果的可解釋性 即能否給出結構及參數的物理意義使其容易被一般人理解和接受。 4) 充分利用各種不同形式的信息 非線性建模的目的就是建立一級變量與另外一級變量之間的數學關系。而我們靠什么建立這種關系呢?靠的是我們可以得到的有關這兩級變量之間關系的各種信息。 這些信息可以是采樣數據,即一組變量取特定值時另一組變量是什么值;也可以是一般性的描述,如某某變量大則某某變量小;還可以是近似的數學關系等等。一個 好的方法應該能盡可能多地利用各種不同形式的信息。這個方面模糊系統有著十分突出的優點,模糊系統不僅僅可以利用采樣數據,還可以將一般性的描述很自然地 歸入系統之中,實現數據信息與語言信息的有機結合而其它方卻只能利用數據信息。 問題5? 為什么模糊理論在東方容易被接受,是不是與東方人的思維哲學有關?(回答了一些挑戰性及技術性很強的問題以后,我把這個問題當作一個很輕松的話題來回答。 言語不妥之處請大家見諒)。 回答。怎么說呢?或許是吧,東方人喜歡圓形,左推右推還是圓形。悠悠灑灑,融天地于一體,這不就是模糊嗎?你模糊我模糊,大家一起倒漿糊,倒 出經驗,倒出水平,倒它個上不冒泡下不沉底中間不結塊,倒出一個黑白合一的太平盛世,一個學者與騙子共存的學術階層。中庸之道、難得糊涂等作為中華文化的 重要組成部分世代相傳。它促進了社會的穩定,增強了民族的凝聚力,也造就了中國人溫文爾雅的性格。它的最大副作用是嚴重腐蝕了人性中最美麗的成份——真 誠!很多情況下一個人所說的和真正所想的相差其遠,云山霧里,拐彎抹角,由你自己理解了。成熟,被定義為知道而說不知道。由于缺少真誠,人與人之間很難建 立信任。必須交往時就只有模糊了事。還有很多類似的例子。這一切說明我們祖先留給我們的思維方式確實與"模糊"這兩個字有著千絲萬縷的聯系。難怪"模糊理 論"在西方一出現,我們很快就接受了。 所以,如果說模糊理論與東方人的思維理念相近。那么至少對于我來說是由于人們對模糊理論的誤解而造成的。正如我在問題3的回答中所說的,模糊理論并不模 糊,而是把模糊的現象用精確的理論來表述。也許有人問為什么模糊理論在日本也很受歡迎呢?我想主要原因是在日文中Fu是音譯的。像很多外來技術詞如 Computer 等都是音譯的一樣,它只是一個符號,代表一種新興技術,與模糊這兩個字的內涵無關。中文喜歡意譯,"用中國人的眼光看世界"誤解就容易發生了。或許大家想 知道為什么當初Zadeh選了模糊(Fu)這個詞?在一次吃午飯時我問過Zadeh這個問題。他的回答是,我當時想不出更好的詞來。我又問他現在看來這個 詞選對了還讓選錯了。他的回答是,就領域的推廣來講是選對了,現在有很多人在討論Fu,做這方面的研究。如果選用其它一般的詞,如連續 (Continuous)或平滑(Smooth)等,則很可能只是另外一個領域的一個分支,很難像現在這樣形成一個獨立的學派。我不知如何評價,請人家自 己琢磨吧。 2、 機遇 方向1 將模糊控制與非模糊控制相結合。一方面用傳統控制理論中的方法解決模糊控制問題,另一方面用模糊控制的理念為解決各種控制問題提供新的思路。 比較流行的做法有,將LMI理論及H無窮理論用于模糊控制器的分析與設計。也有用傳統最優控制理論設計最優模糊控制器,還有利用滑??刂频霓k法來分析模糊 控制器的性能。以及借鑒自適應控制理論的一些理念來設計自適應模糊控制器。這些應用與結合有些是比較直接的。而更多的則需要將已有的方法進行改進和推廣使 之適應于模糊控制問題。目前這類研究的不足之處是模糊控制的特點體現得不夠明確。即只適用于模糊控制器的特殊結果比較少,往往這些結果具有一般性。模糊控 制器只是一個非線性逼近器而已。如何將模糊控制器的結構細節考慮進動,量體裁衣,得到更為優化的結果是一個很有意義的研究方向。 方向2 深入分析模糊系統的結構特性及逼近精度,建立一套完整的理論體系,使人們在應用模糊系統時做到心中有數。經典非線性結構(如分段多項式)的優點之一是,人 們對它們已經進行了幾十甚至上百年的研究,積累了大量的理論結果。近年來神經網絡在這方面也取得了長足的進步。如果將這些非線性結構比做不同的動物,那么 這項研究就是對這些動物進行解剖的越詳細越徹底,我們對其的了解就越清楚,也就越能知道它適用于干什么及不適用于干什么。對模糊系統來說這方面研究的具內 容包括,不同的結構參數是怎樣具體地影響逼近精度;逼近誤差隨著參數個數的增多是以什么樣的速率在減小。局部性和全局性能否得到平衡;什么樣的非線分結構 特別適于表示等等 。近十年來這些方面的研究已取得了一些進展,但由于起步較晚,和分段多項式、神經網絡、小波級數等相比還存在著明顯的差距。 方向3 適用于模糊系統的不同學習算法的提出,算法的收斂性分析及學習完成后模糊系統的性能分析。若將方向2的研究比作對動物的靜態解剖,那么這個方向就是研究動 物在奔跑時的動態特性。顯然這個方向要相對困難一些。這個方向的研究又可進一步分為兩種情況:一種是數據可以任意采樣或已知數據的概率分布且數據的個數可 假設趨于無窮。另一種情況是只給出有限個數據采樣點且數據的分布不能人為控制。第一種情況容易得出比較深入的理論結果。但假設條件太強,與大部分實際情況 不符。第二種情況更加貼近于實際。但理論分析起來要困難得多。雖然兩種情況的研究都很會必要,但重點應放在第二種情況。目前,這兩個方向的理論研究都非常 欠缺。往往人們只給出算法的具體步驟,然后進行大量仿真,很少見到嚴格的理論分析與證明。神經網絡在這個方面的研究成果是比較少的,由于神經網絡的參數缺 少明確的物理意義。分析起來比模糊系統更加困難一些,這個方向的一種研究思路是利用模糊系統的分解特性,在小的局部進行簡化,從而得到收斂性的結果。 方向4 針對高維情況(輸入變量眾多)的模糊系統方法。假設我們的問題是預測一個主要變量的數值。于是我們將這個變量作為模糊系統的輸出,而將影響這個變量的各種 因素作為模糊系統的輸入。在很多實際情況下,影響這個主要變量的因素是非常眾多,那么是不是考慮的影響因素越多,即模糊系統的輸入變量越多,則預測的效果 就越好呢?遺憾的是情況并非這么簡單。維數越高,我們能找到真正的非線性關系的可能性就越低。這主要是由于隨著維數的增高,采樣數據變得越來越稀疏??紤] 一維區間[0,1]有100個采樣點,則可以說數據是很密的。將100個數據放在二維平面[0,1]2上,就不向那么密了。考慮三 維中間[0,1]3中的100個數據點,可以說是稀稀拉拉。那么將100個數據點放在四維、五維、更高維空間中會是什么情況呢?可 以說中間中的絕大部分區域沒有采樣點。如果一個區域內沒有采樣點,那么怎么能知道輸入變量落在這個區域時輸出變量是什么值呢?這就是高維問題的困難核心所 在,被Bellman稱做"邪惡的維數"(the curse of dimensionality)。解決高維問題的途 徑有兩種:一是減少輸入變量的個數。即只考慮重要的因素內忽略次要的因素;二是找到或有效地刻畫輸入變量之間的相互依賴關系,在輸入中間中引入結構,從而 限制搜索的范圍。第一種途徑比較簡單,但需要有效的方法來排列變量的重要程度。尋找這樣的方法是非常有實用價值的研究方向。第二種途徑是非常好的研究方 向,目前這個方向的研究成果不多,多層模糊系統是方法之一。利用決策樹的概念劃分輸入空間也是非常值得深入研究的課題。新的結構提出以后,還要象方向2和 方向3中所說的那樣進行系統的靜態解剖及動態分析。經典方法中投影跟隨是針對高維問題的好方法,由于神經網絡的結構具有投影跟隨的特點,而又比投影跟隨更 具一般性,所以神經網絡在很多實際問題中得到了成功的應用(大部分實際問題是高維的)。標準的模糊系統不具有適應高維的特點,所以必須改革,提出適應高維 情況的新的結構及相應的學習算法。 方向5 能夠利用其它知識及信息表達形式的模糊系統.現有的模糊系統只能利用IF-THEN規則。而我們人類表達知識及信息的形式是多種多樣的,比如說"類比"就 是我們人類用以表達及獲取知識的非常重要的方法。我們說"給這個人講道理就像對牛彈琴", 這是非常重要的信息。因為基于這個信息我們就可以基 本預測到如果給這個人講道理會得到什么樣的反應。這里問題的困難在于"對牛彈琴"和"給這個人講道理"是發生在兩個不問范疇內的事情,如何將它們表述在同 一個數學空間中不是容易的。只給出理念是不夠的,沒有細節等于什么都沒有。能夠利用類比信息的模糊系統必須是具體的數學表達式,必須能夠進行數值計算,同 時必須符合常理并具有可解釋性。這是一個非常具有挑戰性的方向,而一旦在這個方向取得突破,就從本質上擴大模糊系統的根基。從而使我們的領域得到長足的發 展。 以上就是我認為比較重要的五個研究方向。在結束本訪問之前以要強調的是以上研究方向只是針對模糊系統(包括模糊控制)這個領域的。而模糊系統只是整個模糊 理論的一個分支,模糊理論的其它重要分支包括,模糊數學、模糊優化、模糊邏輯等。這些領域同樣有非常重要的研究方向。本文沒在進行討論。另外,以上研究方 向屬于理論研究范疇,如何巧妙地將這些方法用于解決各種實際問題,是非常重要且極具趣味的課題。只有這些應用取得成功,理論方法才能站穩腳跟并受到普遍歡 迎。 3 總結 |
總結
以上是生活随笔為你收集整理的[转载]模糊系统:挑战与机遇并存——十年研究之感悟 王立新的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 构架、框架、设计模式之间的关系简述
- 下一篇: 人脸识别方法个人见解