博弈论基础知识--非合作博弈,零和博弈,负和博弈,主从博弈,Nash均衡
這幾天看一些crowdsourcing的經典文章,發現經常初選game theory,之前看過一段時間但是沒好好整理,重新整理一發
Non-cooperative Game
非合作博弈是指一種參與者不可能達成具有約束力的協議的博弈類型,這是一種具有互不相容味道的情形。非合作博弈研究人們在利益相互影響的局勢中如何選決策使自己的收益最大,即策略選擇問題。
負和博弈和零和博弈統稱為非合作博弈,正和博弈亦稱為合作博弈。
零和博弈
零和博弈是博弈論的一個概念,屬非合作博弈,指參與博弈的雙方,**在嚴格競爭下,一方的收益必然意味著另一方的損失,**博弈各方的收益和損失相加的總和永遠為“零”。雙方不存在合作的可能。零和博弈的結果是一方吃掉另一方,一方的所得正是另一方的所失,整個社會的利益并不會因此而增加一分。
當你看到兩位對弈者時,你就可以說他們正在玩“零和游戲”。因為在大多數情況下,總會有一個贏,一個輸,如果我們把獲勝計算為得1分,而輸棋為-1分,那么,這兩人得分之和就是:1+(-1)=0。
這正是“零和游戲”的基本內容:游戲者有輸有贏,一方所贏正是另一方所輸,游戲的總成績永遠是零。
零和游戲原理之所以廣受關注,主要是因為人們發現在社會的方方面面都能發現與“零和游戲”類似的局面,勝利者的光榮后面往往隱藏著失敗者的辛酸和苦澀。從個人到國家,從政治到經濟,似乎無不驗證了世界正是一個巨大的“零和游戲”場。這種理論認為,世界是一個封閉的系統,財富、資源、機遇都是有限的,個別人、個別地區和個別國家財富的增加必然意味著對其他人、其他地區和國家的掠奪,這是一個“邪惡進化論”式的弱肉強食的世界。
但20世紀人類在經歷了兩次世界大戰,經濟的高速增長、科技進步、全球化以及日益嚴重的環境污染之后,“零和游戲”觀念正逐漸被“雙贏”觀念所取代。人們開始認識到“利己”不一定要建立在“損人”的基礎上。通過有效合作,皆大歡喜的結局是可能出現的。但從“零和游戲”走向“雙贏”,要求各方要有真誠合作的精神和勇氣,在合作中不要耍小聰明,不要總想占別人的小便宜,要遵守游戲規則,否則“雙贏”的局面就不可能出現,最終吃虧的還是自己。
負和博弈
所謂負和博弈,是指雙方沖突和斗爭的結果,是所得小于所失,就是我們通常所說的其結果的總和為負數,也是一種兩敗俱傷的博弈,結果雙方都有不同程度的損失。
Stackelberg game–主從博弈–mobile computing最常用模型
一方先行動,一方后行動的博弈也稱為斯坦克伯格問題,也可稱為主從博弈(leader and follower),與經典博弈模型相比,Stackelberg是一個動態的過程。即在經典博弈中的每一個參與人在博弈中地位是一致的,而主從博弈中的參與者的地位是不一致的,跟隨者的策略選擇依賴于領導者的策略選擇。
Stackelberg game往往存在一個均衡的情況,這也是大部分模型想要達到或者計算的case,給一個最經典的例子
假定:某寡頭市場上有兩個廠商,他們生產相同的產品。
Nash均衡
納什均衡定義
經濟學定義[3]
所謂納什均衡,指的是參與人的這樣一種策略組合,在該策略組合上,任何參與人單獨改變策略都不會得到好處。換句話說,如果在一個策略組合上,當所有其他人都不改變策略時,沒有人會改變自己的策略,則該策略組合就是一個納什均衡。
維基百科:
在博弈論中,納什均衡(英語:Nash equilibrium,或稱納什均衡點)是指在包含兩個或以上參與者的非合作博弈(Non-cooperative game)中,假設每個參與者都知道其他參與者的均衡策略的情況下,沒有參與者可以透過改變自身策略使自身受益時的一個概念解。該術語以約翰·福布斯·納什命名。在博弈論中,如果每個參與者都選擇了自己的策略,并且沒有玩家可以透過改變策略而其他參與者保持不變而獲益,那么當前的策略選擇的集合及其相應的結果構成了納什均衡。即若 pi(s)=maxri[pi(s;ri)]{\displaystyle p_{i}(s)=max_{r_{i}}[p_{i}(s;r_{i})]}pi?(s)=maxri??[pi?(s;ri?)],則稱s為納什均衡點,其中: pi{\displaystyle p_{i}}pi? 為參與者i的收獲(payoff),si{\displaystyle s_{i}}si?代表所有參與者之策略,ri{\displaystyle r_{i}}ri?代表參與者i的一種可能策略, (s;ri){\displaystyle (s;r_{i})}(s;ri?) 指參與者i單方面改變策略為 ri{\displaystyle r_{i}}ri?
即,納什均衡的意思是:任何一方采取的策略都是對其余所有方采取策略組合下的最佳對策;當所有其他人都不改變策略時,為了讓自己的收益最大,任何一方都不會(或者無法)改變自己的策略,這個時候的策略組合就是一個納什均衡。
納什證明了在每個參與者都只有有限種策略選擇、并允許混合策略的前提下,納什均衡一定存在。以兩家公司的價格大戰為例,納什均衡意味著兩敗俱傷的可能:在對方不改變價格的條件下,既不能提價,否則會進一步喪失市場;也不能降價,因為會出現賠本甩賣。于是兩家公司可以改變原先的利益格局,通過談判尋求新的利益評估分攤方案,也就是Nash均衡。類似的推理當然也可以用到選舉,群體之間的利益沖突,潛在戰爭爆發前的僵局,議會中的法案爭執等。
總結
以上是生活随笔為你收集整理的博弈论基础知识--非合作博弈,零和博弈,负和博弈,主从博弈,Nash均衡的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 数独一
- 下一篇: js 获取url参数(QueryStri