蒙特卡罗法
MC法與競爭性隨即過程的計算密切相關,正在學習中,那位能否對電腦圍棋中的MC方法做深入一點的介紹呢?尤其是看懂英文論文的斑竹們。能否給些提示。
我現在給出自己學習一般MC法的入門級理解:
蒙特卡羅法的解決問題思路是這樣的:
1.一種隨機事件可能有理論上的概率計算方法;
2.對這種隨機事件還可以通過實驗的方法,實際測量隨機事件出現的頻率;
3.當實驗的次數趨于無窮多次的時候,實驗所得到的頻率就會趨近于理論計算的概率;
比方說,仍硬幣,理論計算出現正面的概率是:正面的面數1/硬幣總共擁有的面數2 = 0.5;
然后,通過實驗20次,100次,我們會得到實際出現正面的頻率數據,如:11/20,52/100等;當實驗次數無限多的時候,頻率就約等于概率。
4.假若理論上的概率計算公式中用到的變量,除了概率外,還有一個是未知的變量,而其余的都是已知變量。
5.我們就可以通過實驗的辦法來得到頻率數據來代替概率,從而求得未知變量的解。
就好比假設我們不知道硬幣有多少個面,但我們知道,叫做”正面“的面只有1個,于是,通過100次實驗我們發現得到正面頻率是52/100
于是,解方程 1/X = 52/100,我們就會發現,硬幣有2個面。
這就是蒙特卡羅法求解問題的核心思路。
總結
- 上一篇: 李开复开发的国际象棋软件
- 下一篇: 数学精彩摘录