博弈论概述 (转自百度百科)
                                                            生活随笔
收集整理的這篇文章主要介紹了
                                博弈论概述 (转自百度百科)
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.                        
                                
百科名片
博弈論(Game Theory),亦名“對策論”、“賽局理論”,屬應(yīng)用數(shù)學(xué)的一個分支, 目前在生物學(xué)、經(jīng)濟學(xué)、國際關(guān)系、計算機科學(xué)、政治學(xué)、軍事戰(zhàn)略和其他很多學(xué)科都有廣泛的應(yīng)用。博弈論主要研究公式化了的激勵結(jié)構(gòu)間的相互作用。是研究具有斗爭或競爭性質(zhì)現(xiàn)象的數(shù)學(xué)理論和方法。也是運籌學(xué)的一個重要學(xué)科。 博弈論考慮游戲中的個體的預(yù)測行為和實際行為,并研究它們的優(yōu)化策略。生物學(xué)家使用博弈理論來理解和預(yù)測進化論的某些結(jié)果。參見:行為生態(tài)學(xué)(behavioral ecology)
目錄
編輯本段歷史
約翰·馮·諾依曼
博弈論是二人在平等的對局中各自利用對方的策略變換自己的對抗策略,達到取勝的目的。博弈論思想古已有之,我國古代的《孫子兵法》就不僅是一部軍事著作,而且算是最早的一部博弈論著作。博弈論最初主要研究象棋、橋牌、賭博中的勝負問題,人們對博弈局勢的把握只停留在經(jīng)驗上,沒有向理論化發(fā)展。 博弈論考慮游戲中的個體的預(yù)測行為和實際行為,并研究它們的優(yōu)化策略。 近代對于博弈論的研究,開始于策墨洛(Zermelo),波雷爾(Borel)及馮·諾伊曼(von Neumann)。 1928年,馮·諾依曼證明了博弈論的基本原理,從而宣告了博弈論的正式誕生。1944年,馮·諾依曼和摩根斯坦共著的劃時代巨著《博弈論與經(jīng)濟行為》將二人博弈推廣到n人博弈結(jié)構(gòu)并將博弈論系統(tǒng)的應(yīng)用于經(jīng)濟領(lǐng)域,從而奠定了這一學(xué)科的基礎(chǔ)和理論體系。 1950~1951年,約翰·福布斯·納什(John Forbes Nash Jr)利用不動點定理證明了均衡點的存在,為博弈論的一般化奠定了堅實的策墨洛(Zermelo)
基礎(chǔ)。納什的開創(chuàng)性論文《n人博弈的均衡點》(1950),《非合作博弈》(1951)等等,給出了納什均衡的概念和均衡存在定理。此外,塞爾頓、哈桑尼的研究也對博弈論發(fā)展起到推動作用。今天博弈論已發(fā)展成一門較完善的學(xué)科。 21世紀,應(yīng)站在博弈論的前沿。盡管博弈經(jīng)濟學(xué)家很少,但其獲諾貝爾獎的比例最高。最能震動人類情感的是博弈,對未來最有影響力的還是博弈。 博弈論(Game Theory)和決策論(Decision Theory )、運籌學(xué)(Operations Research)等一起構(gòu)成現(xiàn)代企業(yè)經(jīng)濟、軍事戰(zhàn)略等系統(tǒng)管理學(xué)的理論基礎(chǔ)。 有很多學(xué)者和書籍定義過博弈論,這里采用的是比較通行的一種說法。 研究決策主體的行為發(fā)生直接相互作用時候的決策以及這種決策的均衡問題。編輯本段博弈論定義
博弈論的定義:Definition of the game theory: 我們把動物利用大自然移動的癮魂,在決策人期待的空間里,形成相對均衡的語文學(xué)理論,稱為博弈論。 (摘自《博弈圣經(jīng)》中《人類未知的藍色檔案》一文)。 The theory of relative balance about the mobile addicts and soul of animals in the nature and in the expectation of decision makers is called the game theory. (quoted from the article “The Blue Files Unknown to Humankind” in Bible of Game Theory編輯本段博弈論 - 博弈論的發(fā)展
對博弈論的研究可以追溯到19世紀,甚至更早。對于博弈論的研究,開始于策墨洛(Zermelo,1913),波雷爾(Borel,1921)及馮·諾伊曼(von Neumann, 1928),后來由馮·諾伊曼和奧斯卡·摩根斯坦(von Neumann and Morgenstern,1944,1947)(《博弈論與經(jīng)濟行為》)首次對其系統(tǒng)化和形式化(參照Myerson, 1991)。隨后約翰·福布斯·納什(John Forbes Nash Jr., 1950, 1951)利用不動點定理證明了均衡點的存在,為博弈論的一般化奠定了堅實的基礎(chǔ)。 直至《博弈圣經(jīng)》的出現(xiàn), 《博弈圣經(jīng)》與原有博弈論書籍最大的不同就在于,獨創(chuàng)了國正論、國正雙贏理論和粒子行為論,書中博弈取勝的文化理論統(tǒng)一了人類的博弈占優(yōu)行為。更重要的是,它讓博弈理論終于可以在現(xiàn)實生活中具體操作,讓普通大眾通過研習(xí),成為真正的博弈高手。因此, 《博弈圣經(jīng)》中的博弈理論在政治、經(jīng)濟、文化、生活、娛樂等社會的各個領(lǐng)域具有可應(yīng)用性,并且對于個人的工作、生活也有具體的指導(dǎo)意義。此外,塞爾頓、哈桑尼的研究也對博弈論發(fā)展起到推動作用。今天博弈論已發(fā)展成一門較完善的的學(xué)科。 我們應(yīng)用科學(xué)發(fā)展觀的博弈哲學(xué)思想,闡明了博弈論、矛盾論、概率論的戰(zhàn)術(shù)性質(zhì)。 博弈論是二人對局,一個叫決策人,一個稱對抗者。 矛盾論是兩個同性質(zhì)的二人對決。 概率論則是通過二人對局的個數(shù)之比得出。 博弈論、矛盾論、概率論各自都是兩個相同性質(zhì)的對決只能提供經(jīng)驗,只有對實體與性質(zhì)的區(qū)分才能稱為知識。西方文化大宗教理論都是極其渺小的個體性質(zhì)的戰(zhàn)術(shù)屬性,決不能處理博弈實體里的戰(zhàn)略。在任何博弈實體的系統(tǒng)里,在具體事件中,用矛盾論建立的二人博弈對局都是在悖論中自圓其說,都不能通達博弈實體的事實真相。博弈論、矛盾論、概率論這些文化大宗教理論已經(jīng)不能解決未來博弈實體里的文明,到了極不正常的歷史死亡階段。因為這些抄來抄去的非物質(zhì)文化概念,界定模糊,無法定性,無法區(qū)分,無法操作,無法驗證,不能證明,又不能證偽。它讓人沒有自在,沒有自我,沒有哲學(xué),更沒有科學(xué)。科學(xué)不是為哪個階級服務(wù)的,科學(xué)是大自然前進的規(guī)則,科學(xué)又像似監(jiān)工,《博弈圣經(jīng)》中說:“科學(xué)是專門批判他人的。”任何邪惡和迷信都會后退,科學(xué)的任務(wù)是如實地讓人們認識自然本來的面貌。粒子行為論、國正論、國邊常數(shù)1.992187是對政府和人民的提醒,也是讓懷疑論者百口難辨。博弈基因取勝的理論會引發(fā)更多人對戰(zhàn)略文化的思考。編輯本段博弈論與諾貝爾獎
博弈論已經(jīng)成為經(jīng)濟學(xué)的標準分析工具之一。從1994年諾貝爾經(jīng)濟學(xué)獎授予3位博弈論專家開始,共有5屆的諾貝爾經(jīng)濟學(xué)獎與博弈論的研究有關(guān),分別為: 1994年,授予美國伯克利加利福尼亞大學(xué)的約翰·海薩尼(J.Narsanyi)、普林斯頓大學(xué)約翰·納什(J.Nash)和德國波恩大學(xué)的賴因哈德·澤爾滕(Reinhard Selten)。 1996年,授予英國劍橋大學(xué)的?詹姆斯·莫里斯(James A. Mirrlees)與美國哥倫比亞大學(xué)的威廉·維克瑞(William Vickrey)。 2001年,授予美國加州大學(xué)伯克萊分校的喬治·阿克爾洛夫(George A. Akerlof )生于1940年、美國斯坦福大學(xué)的邁克爾·斯賓塞(A. Michael Spence )和美國紐約哥倫比亞大學(xué)的約瑟夫·斯蒂格利茨(Joseph E. Stiglitz)。 2005年,授予美國馬里蘭大學(xué)的托馬斯·克羅姆比·謝林?(Thomas Crombie Schelling)和耶路撒冷希伯來大學(xué)的羅伯特·約翰·奧曼(Robert John Aumann)。 2007年,授予美國明尼蘇達大學(xué)的里奧尼德·赫維茨(Leonid Hurwicz)、美國普林斯頓大學(xué)的埃里克·馬斯金(Eric S. Maskin)以及美國芝加哥大學(xué)的羅杰·邁爾森(Roger B. Myerson)。 作為一門工具學(xué)科能夠在經(jīng)濟學(xué)中如此廣泛運用并得到學(xué)界垂青實為罕見。編輯本段博弈論的基本概念
博弈要素: (1)決策人:在博弈中率先作出決策的一方,這一方往往依據(jù)自身的感受、經(jīng)驗和表面狀態(tài)優(yōu)先采取一種有方向性的行動。 (2) 對抗者:在博弈二人對局中行動滯后的那個人,與決策人要作出基本反面的決定,并且他的動作是滯后的、默認的、被動的,但最終占優(yōu)。他的策略可能依賴于決策人劣勢的策略選擇,占去空間特性,因此對抗是唯一占優(yōu)的方式,實為領(lǐng)導(dǎo)人的階段性終結(jié)行為。 (3)局中人(players):在一場競賽或博弈中,每一個有決策權(quán)的參與者成為一個局中人。只有兩個局中人的博弈現(xiàn)象稱為“兩人博弈”,而多于兩個局中人的博弈稱為 “多人博弈”。 (4)策略(strategies):一局博弈中,每個局中人都有選擇實際可行的完整的行動方案,即方案不是某階段的行動方案,而是指導(dǎo)整個行動的一個方案,一個局中人的一個可行的自始至終全局籌劃的一個行動方案,稱為這個局中人的一個策略。如果在一個博弈中局中人都總共有有限個策略,則稱為“有限博弈”,否則稱為“無限博弈”。 (5)得失(payoffs):一局博弈結(jié)局時的結(jié)果稱為得失。每個局中人在一局博弈結(jié)束時的得失,不僅與該局中人自身所選擇的策略有關(guān),而且與全局中人所取定的一組策略有關(guān)。所以,一局博弈結(jié)束時每個局中人的“得失”是全體局中人所取定的一組策略的函數(shù),通常稱為支付(payoff)函數(shù)。 (6)次序(orders):各博弈方的決策有先后之分,且一個博弈方要作不止一次的決策選擇,就出現(xiàn)了次序問題;其他要素相同次序不同,博弈就不同。 (7)博弈涉及到均衡:均衡是平衡的意思,在經(jīng)濟學(xué)中,均衡意即相關(guān)量處于穩(wěn)定值。在供求關(guān)系中,某一商品市場如果在某一價格下,想以此價格買此商品的人均能買到,而想賣的人均能賣出,此時我們就說,該商品的供求達到了均衡。所謂納什均衡,它是一穩(wěn)定的博弈結(jié)果。 納什均衡(Nash Equilibrium):在一策略組合中,所有的參與者面臨這樣一種情況,當(dāng)其他人不改變策略時,他此時的策略是最好的。也就是說,此時如果他改變策略他的支付將會降低。在納什均衡點上,每一個理性的參與者都不會有單獨改變策略的沖動。納什均衡點存在性證明的前提是“博弈均衡偶”概念的提出。所謂“均衡偶”是在二人零和博弈中,當(dāng)局中人A采取其最優(yōu)策略a*,局中人B也采取其最優(yōu)策略b*,如果局中人B仍采取b*,而局中人A卻采取另一種策略a,那么局中人A的支付不會超過他采取原來的策略a*的支付。這一結(jié)果對局中人B亦是如此。 這樣,“均衡偶”的明確定義為:一對策略a*(屬于策略集A)和策略b*(屬于策略集B)稱之為均衡偶,對任一策略a(屬于策略集A)和策略b(屬于策略集B),總有:偶對(a, b*)≤偶對(a*,b*)≥偶對(a*,b)。 對于非零和博弈也有如下定義:一對策略a*(屬于策略集A)和策略b*(屬于策略集B)稱為非零和博弈的均衡偶,對任一策略a(屬于策略集A)和策略 b(屬于策略集B),總有:對局中人A的偶對(a, b*) ≤偶對(a*,b*);對局中人B的偶對(a*,b)≤偶對(a*,b*)。 有了上述定義,就立即得到納什定理: 任何具有有限純策略的二人博弈至少有一個均衡偶。這一均衡偶就稱為納什均衡點。 納什定理的嚴格證明要用到不動點理論,不動點理論是經(jīng)濟均衡研究的主要工具。通俗地說,尋找均衡點的存在性等價于找到博弈的不動點。 納什均衡點概念提供了一種非常重要的分析手段,使博弈論研究可以在一個博弈結(jié)構(gòu)里尋找比較有意義的結(jié)果。 但納什均衡點定義只局限于任何局中人不想單方面變換策略,而忽視了其他局中人改變策略的可能性,因此,在很多情況下,納什均衡點的結(jié)論缺乏說服力,研究者們形象地稱之為“天真可愛的納什均衡點”。 塞爾頓(R·Selten)在多個均衡中剔除一些按照一定規(guī)則不合理的均衡點,從而形成了兩個均衡的精煉概念:子博弈完全均衡和顫抖的手完美均衡。夏普里值
考慮這樣一個合作博弈:a、b、c、投票決定如何分配100萬,他們分別擁有50%、40%、10%的權(quán)力,規(guī)則規(guī)定,當(dāng)超過50%的票認可了某種方案時才能通過。那么如何分配才是合理的呢?按票力分配,a50萬、b40萬、c10萬c向a提出:a70萬、b0、c30萬b向a提出:a80萬、b20萬、c0…… 權(quán)力指數(shù):每個決策者在決策時的權(quán)力體現(xiàn)在他在形成的獲勝聯(lián)盟中的“關(guān)鍵加入者”的個數(shù),這個“關(guān)鍵加入者”的個數(shù)就被稱為權(quán)利指數(shù)。 夏普里值(Shapley value):在各種可能的聯(lián)盟次序下,參與者對聯(lián)盟的邊際貢獻之和除以各種可能的聯(lián)盟組合。 次序 abc acb bac bca cab cba 關(guān)鍵加入者 b c a a a a 由此計算出a,b,c的夏普里值分別為4/6,1/6,1/6 所以a,b,c應(yīng)分別獲得100萬的2/3,1/6,1/6智豬博弈
智豬博弈(Pigs’payoffs)講的是:豬圈里有兩頭豬,一頭大豬,一頭小豬。豬圈的一邊有個踏板,每踩一下踏板,在遠離踏板的豬圈的另一邊的投食口就會落下少量的食物。如果有一只豬去踩踏板,另一只豬就有機會搶先吃到另一邊落下的食物。當(dāng)小豬踩動踏板時,大豬會在小豬跑到食槽之前剛好吃光所有的食物;若是大豬踩動了踏板,則還有機會在小豬吃完落下的食物之前跑到食槽,爭吃到另一半殘羹。 那么,兩只豬各會采取什么策略?答案是:小豬將選擇“搭便車”策略,也就是舒舒服服地等在食槽邊;而大豬則為一點殘羹不知疲倦地奔忙于踏板和食槽之間。 原因何在?因為,小豬踩踏板將一無所獲,不踩踏板反而能吃上食物。對小豬而言,無論大豬是否踩動踏板,不踩踏板總是好的選擇。反觀大豬,已明知小豬是不會去踩動踏板的,自己親自去踩踏板總比不踩強吧,所以只好親力親為了。 “小豬躺著大豬跑”的現(xiàn)象是由于故事中的游戲規(guī)則所導(dǎo)致的。規(guī)則的核心指標是:每次落下的食物數(shù)量和踏板與投食口之間的距離。 如果改變一下核心指標,豬圈里還會出現(xiàn)同樣的“小豬躺著大豬跑”的景象嗎?試試看。 改變方案一:減量方案。投食僅原來的一半分量。結(jié)果是小豬大豬都不去踩踏板了。小豬去踩,大豬將會把食物吃完;大豬去踩,小豬將也會把食物吃完。誰去踩踏板,就意味著為對方貢獻食物,所以誰也不會有踩踏板的動力了。 如果目的是想讓豬們?nèi)ザ嗖忍ぐ?#xff0c;這個游戲規(guī)則的設(shè)計顯然是失敗的。 改變方案二:增量方案。投食為原來的一倍分量。結(jié)果是小豬、大豬都會去踩踏板。誰想吃,誰就會去踩踏板。反正對方不會一次把食物吃完。小豬和大豬相當(dāng)于生活在物質(zhì)相對豐富的“共產(chǎn)主義”社會,所以競爭意識卻不會很強。 對于游戲規(guī)則的設(shè)計者來說,這個規(guī)則的成本相當(dāng)高(每次提供雙份的食物);而且因為競爭不強烈,想讓豬們?nèi)ザ嗖忍ぐ宓男Ч⒉缓谩! 「淖兎桨溉?#xff1a;減量加移位方案。投食僅原來的一半分量,但同時將投食口移到踏板附近。結(jié)果呢,小豬和大豬都在拼命地搶著踩踏板。等待者不得食,而多勞者多得。每次的收獲剛好消費完。 對于游戲設(shè)計者,這是一個最好的方案。成本不高,但收獲最大。 原版的“智豬博弈”故事給了競爭中的弱者(小豬)以等待為最佳策略的啟發(fā)。但是對于社會而言,因為小豬未能參與競爭,小豬搭便車時的社會資源配置的并不是最佳狀態(tài)。為使資源最有效配置,規(guī)則的設(shè)計者是不愿看見有人搭便車的,政府如此,公司的老板也是如此。而能否完全杜絕“搭便車”現(xiàn)象,就要看游戲規(guī)則的核心指標設(shè)置是否合適了。 比如,公司的激勵制度設(shè)計,獎勵力度太大,又是持股,又是期權(quán),公司職員個個都成了百萬富翁,成本高不說,員工的積極性并不一定很高。這相當(dāng)于“智豬博弈”增量方案所描述的情形。但是如果獎勵力度不大,而且見者有份(不勞動的“小豬”也有),一度十分努力的大豬也不會有動力了----就象“智豬博弈”減量方案一所描述的情形。最好的激勵機制設(shè)計就象改變方案三----減量加移位的辦法,獎勵并非人人有份,而是直接針對個人(如業(yè)務(wù)按比例提成),既節(jié)約了成本(對公司而言),又消除了“搭便車”現(xiàn)象,能實現(xiàn)有效的激勵。 許多人并未讀過“智豬博弈”的故事,但是卻在自覺地使用小豬的策略。股市上等待莊家抬轎的散戶;等待產(chǎn)業(yè)市場中出現(xiàn)具有贏利能力新產(chǎn)品、繼而大舉仿制牟取暴利的游資;公司里不創(chuàng)造效益但分享成果的人,等等。因此,對于制訂各種經(jīng)濟管理的游戲規(guī)則的人,必須深諳“智豬博弈”指標改變的個中道理。編輯本段博弈的類型
博弈的分類根據(jù)不同的基準也有不同的分類。一般認為,博弈主要可以分為合作博弈和非合作博弈。 合作博弈和非合作博弈的區(qū)別在于相互發(fā)生作用的當(dāng)事人之間有沒有一個具有約束力的協(xié)議,如果有,就是合作博弈,如果沒有,就是非合作博弈。 從行為的時間序列性,博弈論進一步分為靜態(tài)博弈、動態(tài)博弈兩類: 靜態(tài)博弈是指在博弈中,參與人同時選擇或雖非同時選擇但后行動者并不知道先行動者采取了什么具體行動; 動態(tài)博弈是指在博弈中,參與人的行動有先后順序,且后行動者能夠觀察到先行動者所選擇的行動。通俗的理解:"囚徒困境"就是同時決策的,屬于靜態(tài)博弈;而棋牌類游戲等決策或行動有先后次序的,屬于動態(tài)博弈 按照參與人對其他參與人的了解程度分為完全信息博弈和不完全信息博弈。 完全博弈是指在博弈過程中,每一位參與人對其他參與人的特征、策略空間及收益函數(shù)有準確的信息。 不完全信息博弈是指如果參與人對其他參與人的特征、策略空間及收益函數(shù)信息了解的不夠準確、或者不是對所有參與人的特征、策略空間及收益函數(shù)都有準確的信息,在這種情況下進行的博弈就是不完全信息博弈。 目前經(jīng)濟學(xué)家們現(xiàn)在所談的博弈論一般是指非合作博弈,由于合作博弈論比非合作博弈論復(fù)雜,在理論上的成熟度遠遠不如非合作博弈論。非合作博弈又分為:完全信息靜態(tài)博弈,完全信息動態(tài)博弈,不完全信息靜態(tài)博弈,不完全信息動態(tài)博弈。與上述四種博弈相對應(yīng)的均衡概念為:納什均衡(Nash equilibrium),子博弈精煉納什均衡(subgame perfect Nash equilibrium),貝葉斯納什均衡(Bayesian Nash equilibrium),精煉貝葉斯納什均衡(perfect Bayesian Nash equilibrium)。 博弈論還有很多分類,比如:以博弈進行的次數(shù)或者持續(xù)長短可以分為有限博弈和無限博弈;以表現(xiàn)形式也可以分為一般型(戰(zhàn)略型)或者展開型,等等。編輯本段意義
博弈論的研究方法和其他許多利用數(shù)學(xué)工具研究社會經(jīng)濟現(xiàn)象的學(xué)科一樣,都是從復(fù)雜的現(xiàn)象中抽象出基本的元素,對這些元素構(gòu)成的數(shù)學(xué)模型進行分析,而后逐步引入對其形勢產(chǎn)影響的其他因素,從而分析其結(jié)果。 基于不同抽象水平,形成三種博弈表述方式,標準型、擴展型和特征函數(shù)型利用這三種表述形式,可以研究形形色色的問題。因此,它被稱為“社會科學(xué)的數(shù)學(xué)”從理論上講,博弈論是研究理性的行動者相互作用的形式理論,而實際上正深入到經(jīng)濟學(xué)、政治學(xué)、社會學(xué)等等,被各門社會科學(xué)所應(yīng)用。 博弈論是指某個個人或是組織,面對一定的環(huán)境條件,在一定的規(guī)則約束下,依靠所掌握的信息,從各自選擇的行為或是策略進行選擇并加以實施,并從各自取得相應(yīng)結(jié)果或收益的過程,在經(jīng)濟學(xué)上博弈論是個非常重要的理論概念。 什么是博弈論?古語有云,世事如棋。生活中每個人如同棋手,其每一個行為如同在一張看不見的棋盤上布一個子,精明慎重的棋手們相互揣摩、相互牽制,人人爭贏,下出諸多精彩紛呈、變化多端的棋局。博弈論是研究棋手們 “出棋” 著數(shù)中理性化、邏輯化的部分,并將其系統(tǒng)化為一門科學(xué)。換句話說,就是研究個體如何在錯綜復(fù)雜的相互影響中得出最合理的策略。事實上,博弈論正是衍生于古老的游戲或曰博弈如象棋、撲克等。數(shù)學(xué)家們將具體的問題抽象化,通過建立自完備的邏輯框架、體系研究其規(guī)律及變化。這可不是件容易的事情,以最簡單的二人對弈為例,稍想一下便知此中大有玄妙:若假設(shè)雙方都精確地記得自己和對手的每一步棋且都是最“理性” 的棋手,甲出子的時候,為了贏棋,得仔細考慮乙的想法,而乙出子時也得考慮甲的想法,所以甲還得想到乙在想他的想法,乙當(dāng)然也知道甲想到了他在想甲的想法… 面對如許重重迷霧,博弈論怎樣著手分析解決問題,怎樣對作為現(xiàn)實歸納的抽象數(shù)學(xué)問題求出最優(yōu)解、從而為在理論上指導(dǎo)實踐提供可能性呢?現(xiàn)代博弈理論由匈牙利大數(shù)學(xué)家馮·諾伊曼于20世紀20年代開始創(chuàng)立,1944年他與經(jīng)濟學(xué)家奧斯卡·摩根斯特恩合作出版的巨著《博弈論與經(jīng)濟行為》,標志著現(xiàn)代系統(tǒng)博弈理論的初步形成。對于非合作、純競爭型博弈,諾伊曼所解決的只有二人零和博弈--好比兩個人下棋、或是打乒乓球,一個人贏一著則另一個人必輸一著,凈獲利為零。在這里抽象化后的博弈問題是,已知參與者集合(兩方),策略集合(所有棋著),和盈利集合(贏子輸子),能否且如何找到一個理論上的“解” 或“平衡” ,也就是對參與雙方來說都最“合理” 、最優(yōu)的具體策略?怎樣才是“合理” ?應(yīng)用傳統(tǒng)決定論中的“最小最大” 準則,即博弈的每一方都假設(shè)對方的所有功略的根本目的是使自己最大程度地失利,并據(jù)此最優(yōu)化自己的對策,諾伊曼從數(shù)學(xué)上證明,通過一定的線性運算,對于每一個二人零和博弈,都能夠找到一個“最小最大解” 。通過一定的線性運算,競爭雙方以概率分布的形式隨機使用某套最優(yōu)策略中的各個步驟,就可以最終達到彼此盈利最大且相當(dāng)。當(dāng)然,其隱含的意義在于,這套最優(yōu)策略并不依賴于對手在博弈中的操作。用通俗的話說,這個著名的最小最大定理所體現(xiàn)的基本“理性” 思想是“抱最好的希望,做最壞的打算” 。 博弈論不僅僅存在于數(shù)學(xué)的運籌學(xué)中,也正在經(jīng)濟學(xué)中占據(jù)越來越重要的地位,但如果你認為博弈論的應(yīng)用領(lǐng)域僅限于此的話,那你就大錯了。實際上,博弈論甚至在我們的工作和生活中無處不在!在工作中,你在和上司博弈,也在和下屬博弈,你也同樣會跟其他相關(guān)部門人員博弈;而要開展業(yè)務(wù),你更是在和你的客戶以及競爭對手博弈。在生活中,博弈仍然無處不在。博弈論代表著一種全新的分析包羅·薩繆爾遜
方法和全新的思想。 諾貝爾經(jīng)濟學(xué)獎獲得者包羅·薩繆爾遜如是說: 要想在現(xiàn)代社會做個有價值的人,你就必須對博弈論有個大致的了解。 也可以這樣說,要想贏得生意,不可不學(xué)博弈論;要想贏得生活,同樣不可不學(xué)博弈論。編輯本段應(yīng)用舉例
納什均衡
1950年和1951年納什的兩篇關(guān)于非合作博弈論的重要論文,徹底改變了人們對競爭和市場的看法。他證明了非合作博弈及其均衡解,并證明了均衡解的存在性,即著名的納什均衡。從而揭示了博弈均衡與經(jīng)濟均衡的內(nèi)在聯(lián)系。納什的研究奠定了現(xiàn)代非合作博弈論的基石,后來的博弈論研究基本上都沿著這條主線展開的。 1944年馮·諾依曼與奧斯卡·摩根斯特恩合著的巨作《博弈論與經(jīng)濟行為》出版,標志著現(xiàn)代系統(tǒng)博弈理論的的初步形成。盡管對具有博弈性質(zhì)的問題的研究可以追溯到19世紀甚至更早。例如,1838年古諾(Cournot)簡單雙寡頭壟斷博弈;1883年伯特蘭和1925年艾奇沃奇思研究了兩個寡頭的產(chǎn)量與價格壟斷;2000多年前中國著名軍事家孫武的后代孫臏利用博弈論方法幫助田忌賽馬取勝等等都屬于早期博弈論的萌芽,其特點是零星的,片斷的研究,帶有很大的偶然性,很不系統(tǒng)。馮·諾依曼和摩根斯特恩的《博弈論與經(jīng)濟行為》一書中提出的標準型、擴展型和合作型博弈模型解的概念和分析方法,奠定了這門學(xué)科的理論基礎(chǔ)。合作型博弈在20世紀50年代達到了巔峰期。然而,諾依曼的博弈論的局限性也日益暴露出來,由于它過于抽象,使應(yīng)用范圍受到很大限制,在很長時間里,人們對博弈論的研究知之甚少,只是少數(shù)數(shù)學(xué)家的專利,所以,影響力很有限。正是在這個時候,非合作博弈———“納什均衡”應(yīng)運而生了,它標志著博弈論的新時代的開始!納什不是一個按部就班的學(xué)生,他經(jīng)常曠課。據(jù)他的同學(xué)們回憶,他們根本想不起來曾經(jīng)什么時候和納什一起完完整整地上過一門必修課,但納什爭辯說,至少上過斯蒂恩羅德的代數(shù)拓撲學(xué)。斯蒂恩羅德恰恰是這門學(xué)科的創(chuàng)立者,可是,沒上幾次課,納什就認定這門課不符合他的口味。于是,又走人了。然而,納什畢竟是一位英才天縱的非凡人物,他廣泛涉獵數(shù)學(xué)王國的每一個分支,如拓撲學(xué)、代數(shù)幾何學(xué)、邏輯學(xué)、博弈論等等,深深地為之著迷。納什經(jīng)常顯示出他與眾不同的自信和自負,充滿咄咄逼人的學(xué)術(shù)野心。1950年整個夏天納什都忙于應(yīng)付緊張的考試,他的博弈論研究工作被迫中斷,他感到這是莫大的浪費。殊不知這種暫時的“放棄”,使原來模糊、雜亂和無緒的若干念頭,在潛意識的持續(xù)思考下,逐步形成一條清晰的脈絡(luò),突然來了靈感!這一年的10月,他驟感才思潮涌,妙筆生花。其中一個最耀眼的亮點就是日后被稱之為“納什均衡”的非合作博弈均衡的概念。納什的主要學(xué)術(shù)貢獻體現(xiàn)在1950年和1951年的兩篇論文之中(包括一篇博士論文)。1950年他才把自己的研究成果寫成題為“非合作博弈”的長篇博士論文,1950年11月刊登在美國全國科學(xué)院每月公報上,立即引起轟動。說起來這全靠師兄戴維·蓋爾之功,就在遭到馮·諾依曼貶低幾天之后,他遇到蓋爾,告訴他自己已經(jīng)將馮·諾依曼的“最小最大原理”(minimax solution)推到非合作博弈領(lǐng)域,找到了普遍化的方法和均衡點。蓋爾聽得很認真,他終于意識到納什的思路比馮·諾伊曼的合作博弈的理論更能反映現(xiàn)實的情況,而對其嚴密優(yōu)美的數(shù)學(xué)證明極為贊嘆。蓋爾建議他馬上整理出來發(fā)表,以免被別人捷足先登。納什這個初出茅廬的小子,根本不知道競爭的險惡,從未想過要這么做。結(jié)果還是蓋爾充當(dāng)了他的“經(jīng)紀人”,代為起草致科學(xué)院的短信,系主任列夫謝茨則親自將文稿遞交給科學(xué)院。納什寫的文章不多,就那么幾篇,但已經(jīng)足夠了,因為都是精品中的精品。這一點也是值得我們深思的。國內(nèi)提一個教授,要求在“核心的刊物”上發(fā)表多少篇文章。按照這個標準可能納什還不一定夠資格。 1996年諾貝爾經(jīng)濟學(xué)獎得主莫爾里斯當(dāng)牛津大學(xué)艾奇沃思經(jīng)濟學(xué)講座教授時也沒有發(fā)表過什么文章,特殊的人才,必須有特殊的選拔辦法。 納什在上大學(xué)時就開始從事純數(shù)學(xué)的博弈論研究,1948年進入普林斯頓大學(xué)后更是如魚得水。20歲出頭已成為聞名世界的數(shù)學(xué)家。特別是在經(jīng)濟博弈論領(lǐng)域,他做出了劃時代的貢獻,是繼馮·諾依曼之后最偉大的博弈論大師之一。他提出的著名的納什均衡的概念在非合作博弈理論中起著核心的作用。后續(xù)的研究者對博弈論的貢獻,都是建立在這一概念之上的。由于納什均衡的提出和不斷完善為博弈論廣泛應(yīng)用于經(jīng)濟學(xué)、管理學(xué)、社會學(xué)、政治學(xué)、軍事科學(xué)等領(lǐng)域奠定了堅實的理論基礎(chǔ)。囚徒困境
在博弈論中,含有占優(yōu)戰(zhàn)略均衡的一個著名例子是由塔克給出的“囚徒困境”(prisoners’ dilemma)博弈模型。該模型用一種特別的方式為我們講述了一個警察與小偷的故事。假設(shè)有兩個小偷A(chǔ)和B聯(lián)合犯事、私入民宅被警察抓住。警方將兩人分別置于不同的兩個房間內(nèi)進行審訊,對每一個犯罪嫌疑人,警方給出的政策是:如果兩個犯罪嫌疑人都坦白了罪行,交出了贓物,于是證據(jù)確鑿,兩人都被判有罪,各被判刑8年;如果只有一個犯罪嫌疑人坦白,另一個人沒有坦白而是抵賴,則以妨礙公務(wù)罪(因已有證據(jù)表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。如果兩人都抵賴,則警方因證據(jù)不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。表2.2給出了這個博弈的支付矩陣。 表2.2 囚徒困境博弈 [Prisoner's dilemma]| A╲B | 坦白 | 抵賴 | 
| 坦白 | -8,-8 | 0,-10 | 
| 抵賴 | -10,0 | -1,-1 | 
價格戰(zhàn)博弈
現(xiàn)在我們經(jīng)常會遇到各種各樣的家電價格大戰(zhàn),彩電大戰(zhàn)、冰箱大戰(zhàn)、空調(diào)大戰(zhàn)、微波爐大戰(zhàn)……這些大戰(zhàn)的受益者首先是消費者。每當(dāng)看到一種家電產(chǎn)品的價格大戰(zhàn),百姓都會“沒事兒偷著樂”。在這里,我們可以解釋廠家價格大戰(zhàn)的結(jié)局也是一個“納什均衡”,而且價格戰(zhàn)的結(jié)果是誰都沒錢賺。因為博弈雙方的利潤正好是零。競爭的結(jié)果是穩(wěn)定的,即是一個“納什均衡”。這個結(jié)果可能對消費者是有利的,但對廠商而言是災(zāi)難性的。所以,價格戰(zhàn)對廠商而言意味著自殺。從這個案例中我們可以引伸出兩個問題,一是競爭削價的結(jié)果或“納什均衡”可能導(dǎo)致一個有效率的零利潤結(jié)局。二是如果不采取價格戰(zhàn),作為一種敵對博弈論(rivalry game)其結(jié)果會如何呢?每一個企業(yè),都會考慮采取正常價格策略,還是采取高價格策略形成壟斷價格,并盡力獲取壟斷利潤。如果壟斷可以形成,則博弈雙方的共同利潤最大。這種情況就是壟斷經(jīng)營所做的,通常會抬高價格。另一個極端的情況是廠商用正常的價格,雙方都可以獲得利潤。從這一點,我們又引出一條基本準則:“把你自己的戰(zhàn)略建立在假定對手會按其最佳利益行動的基礎(chǔ)上”。事實上,完全競爭的均衡就是“納什均衡”或“非合作博弈均衡”。在這種狀態(tài)下,每一個廠商或消費者都是按照所有的別人已定的價格來進行決策。在這種均衡中,每一企業(yè)要使利潤最大化,消費者要使效用最大化,結(jié)果導(dǎo)致了零利潤,也就是說價格等于邊際成本。在完全競爭的情況下,非合作行為導(dǎo)致了社會所期望的經(jīng)濟效率狀態(tài)。如果廠商采取合作行動并決定轉(zhuǎn)向壟斷價格,那么社會的經(jīng)濟效率就會遭到破壞。這就是為什么WTO和各國政府要加強反壟斷的意義所在。污染博弈
假如市場經(jīng)濟中存在著污染,但政府并沒有管制的環(huán)境,企業(yè)為了追求利潤的最大化,寧愿以犧牲環(huán)境為代價,也絕不會主動增加環(huán)保設(shè)備投資。按照看不見的手的原理,所有企業(yè)都會從利己的目的出發(fā),采取不顧環(huán)境的策略,從而進入“納什均衡”狀態(tài)。如果一個企業(yè)從利他的目的出發(fā),投資治理污染,而其他企業(yè)仍然不顧環(huán)境污染,那么這個企業(yè)的生產(chǎn)成本就會增加,價格就要提高,它的產(chǎn)品就沒有競爭力,甚至企業(yè)還要破產(chǎn)。這是一個“看不見的手的有效的完全競爭機制”失敗的例證。直到20世紀90年代中期,中國鄉(xiāng)鎮(zhèn)企業(yè)的盲目發(fā)展造成嚴重污染的情況就是如此。只有在政府加強污染管制時,企業(yè)才會采取低污染的策略組合。企業(yè)在這種情況下,獲得與高污染同樣的利潤,但環(huán)境將更好。貿(mào)易戰(zhàn)博弈
貿(mào)易戰(zhàn)對于剛剛加入WTO的中國而言尤為重要。任何一個國家在國際貿(mào)易中都面臨著保持貿(mào)易自由與實行貿(mào)易保護主義的兩難選擇。貿(mào)易自由與壁壘問題,也是一個“納什均衡”,這個均衡是貿(mào)易雙方采取不合作博弈的策略,結(jié)果使雙方因貿(mào)易戰(zhàn)受到損害。X國試圖對Y國進行進口貿(mào)易限制,比如提高關(guān)稅,則Y國必然會進行反擊,也提高關(guān)稅,結(jié)果誰也沒有撈到好處。反之,如X和Y能達成合作性均衡,即從互惠互利的原則出發(fā),雙方都減少關(guān)稅限制,結(jié)果大家都從貿(mào)易自由中獲得了最大利益,而且全球貿(mào)易的總收益也增加了。 博弈論--這是一個熱得燙手的概念。它不僅僅存在于數(shù)學(xué)的運籌學(xué)中,也正在經(jīng)濟學(xué)中占據(jù)越來越重要的地位(近幾年諾貝爾經(jīng)濟學(xué)獎就頻頻授予博弈論研究者),但如果你認為博弈論的應(yīng)用領(lǐng)域僅限于此的話,那你就大錯了。實際上,博弈論甚至在我們的工作和生活中無處不在!在工作中,你在和上司博弈,也在和下屬博弈,你也同樣會跟其他相關(guān)部門人員博弈;而要開展業(yè)務(wù),你更是在和你的客戶以及競爭對手博弈。在生活中,博弈仍然無處不在。博弈論代表著一種全新的分析方法和全新的思想。 諾貝爾經(jīng)濟學(xué)獎獲得者包羅·薩繆爾遜如是說: 要想在現(xiàn)代社會做個有價值的人,你就必須對博弈論有個大致的了解。 也可以這樣說,要想贏得生意,不可不學(xué)博弈論;要想贏得生活,同樣不可不學(xué)博弈論。企業(yè)博弈
博弈論是分析寡頭壟斷企業(yè)市場行為的有力工具。博弈論研究機智而又理性的經(jīng)濟活動主體,在其行為相互影響時的決策以及這種決策的均衡問題。編輯本段主要范式
重復(fù)博弈
囚徒困境,砸了傳統(tǒng)經(jīng)濟學(xué)的場子。因為個人的自利行為,并不一定導(dǎo)致集體利益的最大化,“看不見的手”拉不住,人類向墮落之城下滑的趨勢,難道這真是一個悲哀?索性并非如此,撇去博弈論的理性假設(shè)不說。博弈論者很快發(fā)現(xiàn)囚徒困境只在單次博弈情形下明顯,一旦博弈的開始陷入重復(fù),合作將到來。因為,未來的收益將左右目前的決策。以牙還牙
重復(fù)的博弈理論上導(dǎo)致了合作的產(chǎn)生,但是誰也不能保證合作的繼續(xù),因為之前已經(jīng)說過,合作的代價是建立在損害個人利益基礎(chǔ)之上的。如果個人放棄未來收益或當(dāng)前背叛收益大于未來收益,背叛的風(fēng)險仍然存在。那么在重復(fù)博弈中怎樣的策略才是最優(yōu)。若干睿智而復(fù)雜在經(jīng)過計算機中PK之后,極其原始的“以牙換牙”策略脫穎而出,固然這個策略簡單至極,其威力卻無窮,以至于人們在短暫的欣喜之后,發(fā)現(xiàn)這把太阿指之劍倒持的可怕,一旦重復(fù)鏈條中出現(xiàn)一次(也許不經(jīng)意的)背叛,那據(jù)此原則行事的博弈將永無止境的背叛下去,個人利益極度膨脹的同時,集體利益無限衰微。幸好,這個世界不是模型,也不是如此簡單。很多時候,我們不必以牙還牙,第三方的規(guī)范:道德與法律就是我們的假牙,他們更加有利、有理、有節(jié)。人質(zhì)困境
一場憋屈的博弈。搶打出頭鳥,人質(zhì)聯(lián)合固然可以制服歹徒,但是誰愿出頭。這一點給了無數(shù)處于劫持者地位的一方以機會,類似于秦的遠交近攻、各個擊破的策略,將最終全盤贏下。人質(zhì)可有反制的策略,當(dāng)然有,不過艱難至極。人質(zhì)可以選擇沉默,這樣他有一定時間茍延殘喘;或者聯(lián)合劫持者對付人質(zhì),結(jié)局還是取決于劫持者,萬一他過河拆橋怎么辦;同時反抗,集體將獲得左右策略,但是這需要壯士斷腕的勇氣,部分人可能因此受傷。這里是實力與勇氣的較量,而且實力暫居上風(fēng)。酒吧博弈
如果人人理性,那么每一天到達酒吧的人數(shù)將是差不多正好的,但是人非圣賢,往往是有限理性的。第一次到酒吧的人多,那么大多人人認為酒吧人太多,太擠。第二次決定的時候,參考前次而不去酒吧。少數(shù)去的人發(fā)現(xiàn)酒吧的人第二天很少,感覺很爽,第三次將繼續(xù)回來,并重新帶回許多人……循環(huán)就此開始。酒吧博弈一方面顯示,現(xiàn)實的博弈參與者,是極其有限理性的,其理性只前延后伸一小段。歷史數(shù)據(jù)只對計算機有用,對人,則不一定。 另一個方面,酒吧博弈指出,勝利者永遠只是少數(shù)。盡管酒吧存在調(diào)諧的可能,譬如發(fā)短信時時提醒,但成本恐怕太高。而在其他場合,少數(shù)派可能更加會設(shè)置種種障礙阻止后進者的上升。也就是說,我們的世界仍然是操弄在少數(shù)派的手中。不過,總算這個世界不是模型,少數(shù)派的道路到底還是有跡可循的。老練的將軍仍舊會在八卦迷陣中找到唯一的生門。若你想要,必須做一個更加老練的將軍。槍手博弈
王者的悲哀。三人對槍自決,甲乙丙槍法優(yōu)劣遞減。最后無奈而神奇的結(jié)局,將不取決于同時開槍還是先后開槍,最優(yōu)良的槍手,倒下的概率將最高;而最蹩腳的槍手,存活的希望卻最大。因為沒有人會把威脅最小的槍手列為一號清楚目標。在這里,后發(fā)制人的弱勢者將勝出。以弱勝強,絕不是神話。 難道王者的命運就真如此不堪,呵,道別忘了每個理論模型都是有其前提的,擊破之中任何一個,王者仍將歸來。這就是先發(fā)優(yōu)勢。假設(shè)這是一場類似CS的競技,優(yōu)秀的槍手擊倒二號槍手,立刻獲得獎勵:盾牌。那么三號槍手將陷入絕境。不過,不管怎樣,這個博弈模型,到底給了弱勢者一份希望。機會永遠存在。獵鹿博弈
兩個獵人合作獵鹿獲得的收益將遠大于分別獵兔的收益,戰(zhàn)略聯(lián)盟將開始。這或許是件好事,不過有取決于最后獵獲的鹿——這一公共資源的分配,如果分配得當(dāng),整體的效率將增加。如果一方主導(dǎo),另一方受損,那么帕累托改善無法進行,合作可能終將破裂。 另外一個問題,更加大局的問題。合作的示范性將使得更多的獵人加入,獵獲的鹿將大大增加,人類的利益短期內(nèi)將呈幾何級數(shù)增長。但是最后,確是生態(tài)失衡,鹿群滅群。短暫的繁華之后,獵人將再一次回歸于原始獵兔生活。盡管為了避免這一悲劇,人類還有最后的希望:制度經(jīng)濟學(xué)的法寶——科斯定理以產(chǎn)權(quán)歸屬來解決外部經(jīng)濟問題。但由于談判成本以及可行性,人類社會的公共悲劇仍將不斷上演。智豬博弈
混沌之前最后的博弈。小豬和大豬住在豬圈的一邊(食槽在這里),開啟食物的開關(guān)在另一頭,誰去踩,誰喪失先機。結(jié)果怎樣?是小豬選擇“搭便車”,大豬勤跑。因為小豬無論跑還是停,大豬的最優(yōu)策略都是策略都是去踩機關(guān)。不過在實際生活中。這里依舊存在兩種策略。 小豬的“搭便車”。大豬有的時候,自覺或不自覺地自封“俠之大者,為國為民”,并因此承受一些不能承受之重。《博弈論的詭計》指出美國戰(zhàn)后的行為極似大豬,戰(zhàn)后的美國竭力宣傳自己的普世價值觀,并深入到海外事務(wù),甚至不惜重金協(xié)助小國防務(wù)。這樣小國不自覺地對大國進行了“剝削”。 大豬在擊破模型的一個假設(shè)之后,仍然有一個后發(fā)制人的機會。因為大豬和小豬的耐餓能力不一樣,大豬完全有能力撐得更久,小豬如果不想餓死,那只有一條豪賭的路子:龜兔賽跑式的豪賭,但愿大豬打了個盹兒,他回來的時候,還能吃上一兩口,要不然真是賠了夫人又折兵了。據(jù)此,再也不難解釋為什么很多人切齒的騰訊,毫無顧忌地跟風(fēng),做QQ旋風(fēng),做拍拍,做滔滔。因為不甘心的小豬早早把新技術(shù)研發(fā)的前期搞定了,大豬們只需要悄悄跟隨,適當(dāng)?shù)臅r候踢開擋路的,就可以了。 大豬在這里的后發(fā)制人和槍手博弈的后發(fā)并不一致,槍手后發(fā)是建立在他人惡斗的基礎(chǔ)上,大豬后發(fā)完全是以自身實力為基礎(chǔ)。而且大豬完全不必采取任何激進措施,只要跟隨就好。因為小豬獲勝的條件不是接近,還是距離。警察與小偷
令人沮喪的博弈結(jié)局。警察和小偷各只有一個機會去巡查或者偷盜A地或B地。A地的價值大于B地,那么警察應(yīng)該為了保護價值大而一直保護A地嗎。博弈論認為當(dāng)然不是,警察的合理策略應(yīng)當(dāng)是有傾向于A以一定概率的隨機巡查。這個概率就是:p=A地價值/AB地總價值。這種情況下才能使小偷最大得手幾率降至最低。但是很不幸的是,此時的小偷謀求的是,最小得手幾率的最大化。也就是說,警察的最優(yōu)策略將把小偷的最差策略改良!這個便是馮·諾伊曼提出的“最小最大定律”。 我們必須再一次感謝這個不完美的世界,因為現(xiàn)實之中,類似的現(xiàn)象,對于一方仍然可以設(shè)法找到對手致命的規(guī)律性行動(當(dāng)然必須考慮到對方是不是一個更加老練的獵手,故意放出的誘餌)。而保持自己的行動的無序性,則有可能成為欺騙策略的武器,這倒似張三豐所言道的:無招勝有招。斗雞博弈
兩只斗雞在決斗的時候,無論選擇進或退都是一個難題,因為納什均衡已經(jīng)給出了一勝一敗的最優(yōu)策略。在很多較量下,死拼將是得不償失的,因為很可能給第三者機會。因此,兩個已經(jīng)在戰(zhàn)場的強勢力很可能自覺的遵循納什均衡,當(dāng)一方攻擊時,另一方暫退。雖然可能某方暫時受損,但較之于兩敗俱傷是好得多的。不過,要維持這一狀況,必須保證下一次先期受損的一方發(fā)動攻勢的時候,另一方同樣的后退。于是這樣的攻擊性行為開始變得“儀式化”,沒有人真正流血。這只不過是兩個巨頭玩弄的游戲,目的是警告后來者,想進來,那么也得陪我們一起玩,可是你玩的起么?這正是百事的廣告,即使暗含挑釁也最多只到“敢為中國紅”這樣的地步的原因。協(xié)和謬誤
歐洲政府在大量投資協(xié)和飛機后,終于不能自拔。即使前景黯淡,也撐著面子投下去,非要走投無路才放棄。而這時投入的成本已經(jīng)全打水漂了。如果,發(fā)現(xiàn)不能繼續(xù)的時候,就果敢放手,損失會小得多。可是他們會、能這么做么?壯士斷腕,是何等的壯烈,卻也是何等的艱難! 沉沒成本很可能會延續(xù)人們無畏的堅持。已經(jīng)沉沒的本該放棄,可惜大部分有賭徒式的心理,相信阿基米德的杠桿終將啟動。可惜他們在爬到足夠撬動杠桿的支點之前,已經(jīng)窒息了。 協(xié)和謬誤,倒是給了人們半途而廢的理由,會不會有人擔(dān)心它的濫觴會左右一些本該堅持的目標?的確有這個可能,但是應(yīng)該相信人們足夠理智,完全可以比較沉沒成本、機會成本與未來收益的關(guān)系。看清了的,必定會坦然地走出協(xié)和謬誤。蜈蚣博弈
一場顛前倒后的博弈。蜈蚣博弈的機理是以最終的結(jié)果倒退至開始。這是一個睿智的策略,因果相報,把握好因緣,自有好結(jié)果。它的另一個好處,就是使得未來的計劃明晰化,是你不再徘徊。只可惜,很多時候,碌碌無為的我們并沒有看透迷局的眼睛。我們黑色的眼睛只習(xí)慣于黑夜。 蜈蚣博弈也有一個致命的悖論,仍舊是個人利益和集體利益的沖突,因為最后一次的背叛收益始終優(yōu)于合作。可悲的是,這一次背叛將由于人性的理智,穿越時光隧道,回到原始的地點:人們將從開始就拒絕合作。還是感謝我們這個不完美的世界吧,事實上人們很少這樣做。當(dāng)然合作到最后的也很少,這意味著,倒推法只在中間階段突然發(fā)生了作用,只不過誰也不能預(yù)測,中間一步在哪里。在那里,我們只有冀望信任、道德、良知等等。分蛋糕博弈
兩個小孩怎么分蛋糕?經(jīng)典的故事,經(jīng)典的解答:一個分,一個選。現(xiàn)實多如此,權(quán)利的合理分配將有效促進公平與效率。經(jīng)營權(quán)與所有權(quán)的分置的確使得經(jīng)濟更加活力。不過分蛋糕的進階模型卻強調(diào)了討價還價的策略,分蛋糕不是一次性的,而是多回合的,而且出現(xiàn)成本:蛋糕在融化。 時間稱本的加入,將使得分配變得復(fù)雜化。雙方如果不能及時達成交易,不僅集體的收益將減量,而且個體的收益也將減少。在此情況下,利用時間稱本以及威脅、承諾將對其中一方極其有利。顧客可能迫于情勢,必須盡快結(jié)束談判,這時賣方卻不慌不忙,故意拖延,顧客一方將不得不在價格上作出妥協(xié)。 顧客一方當(dāng)然也有策略,它的策略就是貨比三家,要求承諾或威脅。這個前提是買方市場的存在。顧客還應(yīng)當(dāng)保護自己討價還價的能力,這就是顧客有權(quán)投訴商家。鷹鴿博弈
這個博弈很多人等同于斗雞博弈。不過,斗雞是兩個兼具侵略性的個體,鷹鴿卻是兩個不同群體的博弈,一個和平,一個侵略。在只有鴿子一個苞谷場里,突然加入的鷹將大大獲益,并吸引同伴加入。但結(jié)果不是鷹將鴿逐出苞谷場,而是一定比例共存,因為鷹群增加一只鷹的邊際收益趨零時(鷹群發(fā)生內(nèi)斗),均衡將到來。 由此產(chǎn)生了ESS進化上的穩(wěn)定策略,也就是說一旦均衡形成,偏離的運動會受到自然選擇的打擊。也就是鷹群飽滿后,再試圖加入的鷹將會被鷹群排擠。 進化上的穩(wěn)定均衡最大的好處莫過于保持穩(wěn)定。但問題在于形成強勢的路徑依賴,也就是勝出的不一定是最好的。因為最好的會被當(dāng)作出頭鳥干掉,這是個體的失敗,集團的勝利以及集體的止步不前。臟臉博弈
恍然大悟的博弈。三個人在屋子里,不許說話。美女進來說:你們當(dāng)中至少一個人臉是臟的。三人環(huán)看,沒有反應(yīng)。美女又說:你們知道嗎?三人再看,頓悟,臉都紅了。為什么?因為美女后一句廢話點破天機,三個人都知道臟臉的存在,而且推測知道對方也知道了臟臉的存在(因為另兩人臉沒紅,說明他們看到臟臉了),而且知道對方知道自己已經(jīng)想到上一步……循環(huán)開始,知識開始共同化,真相大白:三個人都是臟臉,所有人都臉紅了。 這就是共同知識的作用,它的作用顯得有點可怕的強大。幾乎是一招無影腿,殺人不見血。在臺面上的博弈之前,私下的算計已經(jīng)置對手于死地。不過,很可能對方也預(yù)料到這一點,早也想到這一點,同時殺來。終于,形成雙死局面。 當(dāng)然,現(xiàn)實雖然存在類似現(xiàn)象,不過共同知識更大的作用在于減少交易成本。因為某些規(guī)則人盡皆知,雙方只要各自依之行事就可以了。信息均衡
很顯然,信息的作用在博弈之中非常重要。將博弈論還原到現(xiàn)實,人們不再完全理性,信息存在不對稱,博弈就需要在搶占信息高地上作出努力。 信息不對稱,是一個很大的障礙。信息的不對稱會造成“逆向選擇”和“道德風(fēng)險”,前者事前,后者事后。信息不對稱短期內(nèi)對某一方會有利,但最終會破壞整個市場。于是有兩個解決策略。信息傳遞
傳達你的正面的信息的策略,也就是說吸引顧客走到你的柜臺面前。它的要點是保持有效、減低成本。信息甄別
誘導(dǎo)對手暴露其私下?lián)碛械恼鎸嵭畔ⅰ>褪墙o顧客一個放大鏡,保證顧客不會走到其他柜臺去。這種策略顯然更加有效,不過風(fēng)險也更大:萬一顧客用放大鏡看出了了自己的瑕疵怎么辦?編輯本段相關(guān)理論
信息論 是運用概率論與數(shù)理統(tǒng)計的方法研究信息、信息熵、通信系統(tǒng)、數(shù)據(jù)傳輸、密碼學(xué)、數(shù)據(jù)壓縮等問題的應(yīng)用數(shù)學(xué)學(xué)科。 信息論將信息的傳遞作為一種統(tǒng)計現(xiàn)象來考慮,給出了估算通信信道容量的方法。信息傳輸和信息壓縮是信息論研究中的兩大領(lǐng)域。這兩個方面又由信息傳輸定理、信源-信道隔離定理相互聯(lián)系。 ·信息現(xiàn)代定義。[2006年,醫(yī)學(xué)信息(雜志),鄧宇等]. ·信息是物質(zhì)、能量、信息及其屬性的標示。逆維納信息定義 ·信息是確定性的增加。逆香農(nóng)信息定義 ·信息是事物現(xiàn)象及其屬性標識的集合。2002年 控制論 是研究動物(包括人類)和機器內(nèi)部的控制與通信的一般規(guī)律的學(xué)科,著重于研究過程中的數(shù)學(xué)關(guān)系 協(xié)同論 主要研究遠離平衡態(tài)的開放系統(tǒng)在與外界有物質(zhì)或能量交換的情況下,如何通過自己內(nèi)部協(xié)同作用,自發(fā)地出現(xiàn)時間、空間和功能上的有序結(jié)構(gòu)。協(xié)同論以現(xiàn)代科學(xué)的最新成果——系統(tǒng)論、信息論、控制論、突變論等為基礎(chǔ),吸取了結(jié)構(gòu)耗散理論的大量營養(yǎng),采用統(tǒng)計學(xué)和動力學(xué)相結(jié)合的方法,通過對不同的領(lǐng)域的分析,提出了多維相空間理論,建立了一整套的數(shù)學(xué)模型和處理方案,在微觀到宏觀的過渡上,描述了各種系統(tǒng)和現(xiàn)象中從無序到有序轉(zhuǎn)變的共同規(guī)律。 協(xié)同論是研究不同事物共同特征及其協(xié)同機理的新興學(xué)科,是近十幾年來獲得發(fā)展并被廣泛應(yīng)用的綜合性學(xué)科。它著重探討各種系統(tǒng)從無序變?yōu)橛行驎r的相似性。協(xié)同論的創(chuàng)始人哈肯說過,他把這個學(xué)科稱為“協(xié)同學(xué)”,一方面是由于我們所研究的對象是許多子系統(tǒng)的聯(lián)合作用,以產(chǎn)生宏觀尺度上結(jié)構(gòu)和功能;另一方面,它又是由許多不同的學(xué)科進行合作,來發(fā)現(xiàn)自組織系統(tǒng)的一般原理。 系統(tǒng)論 是研究系統(tǒng)的一般模式,結(jié)構(gòu)和規(guī)律的學(xué)問,它研究各種系統(tǒng)的共同特征,用數(shù)學(xué)方法定量地描述其功能,尋求并確立適用于一切系統(tǒng)的原理、原則和數(shù)學(xué)模型,是具有邏輯和數(shù)學(xué)性質(zhì)的一門新興的科學(xué) 突變論 突變論是研究客觀世界非連續(xù)性突然變化現(xiàn)象的一門新興學(xué)科,自本世紀70年代創(chuàng)立以來,十?dāng)?shù)年間獲得迅速發(fā)展和廣泛應(yīng)用,引起了科學(xué)界的重視。突變論的創(chuàng)始人是法國數(shù)學(xué)家雷內(nèi)托姆,他于1972年發(fā)表的《結(jié)構(gòu)穩(wěn)定性和形態(tài)發(fā)生學(xué)》一書闡述了突變理論,榮獲國際數(shù)學(xué)界的最高獎---菲爾茲獎?wù)隆M蛔冋摰某霈F(xiàn)引起各方面的重視,被稱之為“是牛頓和萊布尼茨發(fā)明微積分三百年以來數(shù)學(xué)上最大的革命”。 結(jié)構(gòu)論 研究系統(tǒng)的結(jié)構(gòu)、功能與發(fā)生演變及其相互關(guān)系的規(guī)律,也稱為泛進化或自組織系統(tǒng)的結(jié)構(gòu)理論(曾邦哲1986-1994年發(fā)展的系統(tǒng)綜合理論),探討系統(tǒng)的結(jié)構(gòu)本原模型、適應(yīng)穩(wěn)態(tài)結(jié)構(gòu)、系統(tǒng)層次的組織建構(gòu),以及實在系統(tǒng)與符號系統(tǒng)對應(yīng)轉(zhuǎn)換關(guān)系,探討系統(tǒng)的結(jié)構(gòu)邏輯學(xué)基礎(chǔ),以及宇宙、生命、文明的信息組織化過程的結(jié)構(gòu)演變規(guī)律。總結(jié)
以上是生活随笔為你收集整理的博弈论概述 (转自百度百科)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
                            
                        - 上一篇: php转换ofd文件格式,一种OFD格式
 - 下一篇: TCP/IP SOCKET HTTP及