當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

经典的囚徒困境

發(fā)布時(shí)間：2024/1/18 编程问答 41 豆豆

生活随笔收集整理的這篇文章主要介紹了经典的囚徒困境小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

經(jīng)典的囚徒困境

1950年，由就職于蘭德公司的梅里爾·弗勒德（Merrill Flood）和梅爾文·德雷希爾（Melvin Dresher）擬定出相關(guān)困境的理論，后來由顧問艾伯特·塔克（Albert Tucker）以囚徒方式闡述，并命名為“囚徒困境”。經(jīng)典的囚徒困境如下：

警方逮捕甲、乙兩名嫌疑犯，但沒有足夠證據(jù)指控二人入罪。于是警方分開囚禁嫌疑犯，分別和二人見面，并向雙方提供以下相同的選擇：

?* 若一人認(rèn)罪并作證檢控對方（相關(guān)術(shù)語稱“背叛”對方），而對方保持沉默，此人將即時(shí)獲釋，沉默者將判監(jiān)10年。

?* 若二人都保持沉默（相關(guān)術(shù)語稱互相“合作”），則二人同樣判監(jiān)半年。

?* 若二人都互相檢舉（互相“背叛”），則二人同樣判監(jiān)2年。

用表格概述如下：

解說

如同博弈論的其他例證，囚徒困境假定每個(gè)參與者（即“囚徒”）都是利己的，即都尋求最大自身利益，而不關(guān)心另一參與者的利益。參與者某一策略所得利益，如果在任何情況下都比其他策略要低的話，此策略稱為“嚴(yán)格劣勢”，理性的參與者絕不會選擇。另外，沒有任何其他力量干預(yù)個(gè)人決策，參與者可完全按照自己意愿選擇策略。

囚徒到底應(yīng)該選擇哪一項(xiàng)策略，才能將自己個(gè)人的刑期縮至最短？兩名囚徒由于隔絕監(jiān)禁，并不知道對方選擇；而即使他們能交談，還是未必能夠盡信對方不會反口。就個(gè)人的理性選擇而言，檢舉背叛對方所得刑期，總比沉默要來得低。試設(shè)想困境中兩名理性囚徒會如何作出選擇：

* 若對方沉默、背叛會讓我獲釋，所以會選擇背叛。

* 若對方背叛指控我，我也要指控對方才能得到較低的刑期，所以也是會選擇背叛。

二人面對的情況一樣，所以二人的理性思考都會得出相同的結(jié)論——選擇背叛。背叛是兩種策略之中的支配性策略。因此，這場博弈中唯一可能達(dá)到的納什均衡，就是雙方參與者都背叛對方，結(jié)果二人同樣服刑2年。

這場博弈的納什均衡，顯然不是顧及團(tuán)體利益的帕累托最優(yōu)解決方案。以全體利益而言，如果兩個(gè)參與者都合作保持沉默，兩人都只會被判刑半年，總體利益更高，結(jié)果也比兩人背叛對方、判刑2年的情況較佳。但根據(jù)以上假設(shè)，二人均為理性的個(gè)人，且只追求自己個(gè)人利益。均衡狀況會是兩個(gè)囚徒都選擇背叛，結(jié)果二人判決均比合作為高，總體利益較合作為低。這就是“困境”所在。例子漂亮地證明了：非零和博弈中，帕累托最優(yōu)和納什均衡是相沖突的。

總結(jié)

以上是生活随笔為你收集整理的经典的囚徒困境的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

编程问答

经典的囚徒困境

總結(jié)