博弈论 斯坦福game theory stanford week 1.1
title: 博弈論 斯坦福game theory stanford week 1-2
tags: note
notebook: 6- 英文課程-15-game theory
---
博弈論 斯坦福game theory stanford week 1-2
貪婪代理
貪婪代理是什么?:
這種代理有一個獨特的方法
定義博弈
players: 決策者,就是決定的做出者
action:就是行為,也就是決策者做出的行動
payoff:收益,也就是決策可以收到的利益
normal form:一般形式,矩陣形式和策略形式來討論的一種進行決策的形式,以列表表示
extensive form:廣泛形式,樹形表示
如下圖的形式:
就是一個矩陣形式
一個大的博弈參與者可以有很多
行為也可以有很多
如果我們能夠定義以上的各種變量,也就可以定義一個博弈
例子
如圖所示,是一個違反直覺的博弈的例子,我們看到a>b>c>d
如果兩個人選擇c,都會得到較大的收益,但是卻因為害怕對方選擇D而讓自己的收益下降,都選擇了D,都獲得了較小的收益。
從而引出博弈的種類:
零和博弈,就是決策造成的利益總和不發(fā)生改變
合作的基礎(chǔ)
我們從博弈論中可以對合作的基礎(chǔ)進行簡單的分析,合作者擁有相同的利益,
不過有些場合時不能合作的
納什均衡
舉個例子,如果大家進行選美比賽,你要怎么選才能成功選中,結(jié)果是,你不要選你認為最漂亮的,而是要選你認為大叫都會選的。
那么會發(fā)生什么呢?
- 我們定義:每一個游戲者都會被編號1-100
- the player who name the integer closest to two thirds of the average integer wins a prize, the other players get nothing.
- 也就是說最接近平均數(shù)2/3的玩家獲得獎品,
- ties are broken uniformly at random
所有的關(guān)系都是隨機的
關(guān)于這一點,我們來做一個“選美比賽”博弈實驗。博弈程序如下:一群受試者在0~100之間選一個整數(shù),選的數(shù)字最接近猜測平均數(shù)的2/3為贏家,可獲得獎品10萬元。當(dāng)然,每個人的思維邏輯是不同的,但一般地,以下兩種是大多數(shù)受試者面對這個博弈情形的基本思維方式。
【思維一:最大平均數(shù)思維】由于67是100的2/3的最大平均數(shù),因此,博弈方應(yīng)該選擇比67小的數(shù)字而取得占優(yōu)策略,所有博弈方的選擇范圍縮小到[0,67]。給定這個共同知識,由于44是67的2/3的最大平均數(shù),因此,博弈方就應(yīng)該選擇比44小的數(shù)字而取得占優(yōu)策略,所有博弈方的選擇范圍縮小到[0,44]。給定這個共同知識,由于29是44的2/3的最大平均數(shù),因此,博弈方就應(yīng)該選擇比29小的數(shù)字而取得占優(yōu)策略,所有博弈方的選擇范圍又縮小到[0,29]都會小于29。隨后在被縮小到[0,20]…… 以此類推,那么就可以得到唯一的納什均衡0。
【思維二:隨機平均數(shù)思維】假設(shè)人們的選擇是隨機的,那么,在[0,100]中選擇的中位數(shù)或平均數(shù)就是50,因而33就成為最佳選擇;但如果給定他人都選擇33的情況下, 22又成為更佳的選擇;……這樣循環(huán)下去,最后的結(jié)果還是0。
總結(jié)
以上是生活随笔為你收集整理的博弈论 斯坦福game theory stanford week 1.1的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: PhpStorm快捷键
- 下一篇: python3.5连接MySQL