数学教材里的神秘数表在国外红出圈,网友:引人入胜、猜不到结局
本文受權轉載自“把科學帶回家”,ID:steamforkidsie
有這樣一本神書,它的正文不包含任何字母卻暢銷60多年,再版了3次,在亞馬遜上的評論量超過了亞馬遜十大暢銷書之一的《饑餓游戲》的第一部,獲得了4.2/5的高評分,并引發《紐約時報》、《華爾街日報》等主流媒體報道。
2001年《紐約時報》對《百萬隨機數表》(A Million Random Digits With 100,000 Normal Deviates)的報道。
此書中的章節還經常出現在各種統計學教材中,它就是附錄中經常出現的神秘數表的常見來源。
統計教材中的隨機數表。圖片來源:WHO Health Systems Library
這本書就是標志著人類核武器時代到來的著作,在個人計算機時代前被統計工作者奉為圣經的《百萬隨機數表》(A Million Random Digits With 100,000 Normal Deviates)(下文中稱為百萬)。
沒錯,這本書的正文就是100萬個隨機數。為美國空軍制造RAND計算機的計算機學家 Gary Briggs 表示,這本書是一個有65年歷史的巨著,“我們都崇敬它。”賓夕法尼亞大學沃頓商學院副教授 Ethan Mollick 則指出,在計算機出現前,百萬這本書是隨機數的最常見來源。
截至今年八月,這本書的評論量已經有699條。與此相比,亞馬遜的十大暢銷書之一的《饑餓游戲》的平裝初版也只有200多條評論。
我們先來看看亞馬遜網友對這本書的評價——
“一本引人入勝的大作,具有重要的歷史意義,不看到最后你猜不到結局。”
“百萬隨機數?他們只用了10,然后用不同的組合重復,不要被騙了!”
“我被書名騙了...我以為里面是隨機數,但是看了一會兒后我發現還是有規律的…在做了好幾個小時的數學模擬后我證明…每頁左上角的數字可以形成1-628的遞增序列。”
好的,網友們的評價非常中肯貼切,作為一本你完全揣摩不透的書,百萬完全擔得起這樣的美譽。
要了解這本書的劃時代性,我們有必要要了解一下隨機數有多么難獲得。
隨機性看起來無處不在,比如馬路邊的石子兒、女孩的心情、學渣的答案…但實際上,要獲得高質量的隨機數真的很難。計算機輸出的隨機數是“偽隨機數”,因為給計算機什么指令,它們就會穩定進行同樣的操作,輸出同樣的結果。也就是說,計算機無法輸出真隨機數。
真隨機數的唯一來源是自然界。比如,核裂變。
你可能想問,我們怎么知道隨機數是真的還是偽的呢?
很簡單,畫圖就好了。
真隨機數會形成隨機游走。圖片來源:khan academy
如果用一串隨機數做一個貪吃蛇的圖,讓貪吃蛇每走一步就根據這個數列里的數字轉向,那么真隨機數形成的貪吃蛇看起來毫無規律,不管把這個圖放大還是縮小,在任何尺度上貪吃蛇都在亂走。而真隨機的貪吃蛇走出來的這張圖就叫做隨機游走(random walk)。
但是,計算機生成的偽隨機數最終會展現出規律性,貪吃蛇的步伐最后會以特定周期不斷重復。
偽隨機數(藍色)最終會展現出規律。圖片來源:khan academy
真隨機數和偽隨機數的對峙在20世紀40年代被推向了高潮,因為在研究核物理時,人們才意識到真隨機數有多重要。
比如在設計核反應堆時,最關鍵的一步就是預測中子的分布。了解中子是誰,中子從哪兒來,中子要到哪兒去的終極三問就成了設計核反應堆時的核心,而這個研究方向也叫做中子輸運(Neutron transport )。
在反應堆中,中子(藍)引發鈾235(黃)裂變。圖片來源:wikipedia
核物理研究者們一般認為,中子就像氣體一樣在反應核里擴散,并用中子輸運方程模擬這個過程。但是,暴力強解中子輸運方程太復雜,當時的物理學家們很頭疼。
后來,這個問題被洛斯阿拉莫斯國家實驗室的數學家斯塔尼斯拉夫·烏拉姆(Stanislaw Ulam)破解了。烏拉姆的思路是,方程太復雜了老子不解了好伐,我直接模擬中子怎么動不就好了。這種“你動動我試試”的方法就是著名的統計學技術——蒙特卡羅方法。
蒙特卡洛方法其實不難理解。比如要看方形和圓形的面積比,我們可以在兩個盒子上方隨機倒珠子,倒了巨量珠子后,看一下兩個盒子里的珠子數量比,這個比值就是它們的面積之比。圖片來源:marble science
蒙特卡洛方法不需要求解中子輸運方程,而是通過模擬大量中子的運動軌跡來對反應堆中中子的擴散過程進行預測。在洛斯阿拉莫斯國家實驗室發明和推廣了蒙特卡洛方法后,其他學科也紛紛覺得它好用。現在蒙特卡洛方法被廣泛用于研究各種復雜系統的行為,比如金融市場、湍流啥的。
顯然,蒙特卡洛方法依賴大量隨機數,這樣才能保證模擬結果無限接近真實。洛斯阿拉莫斯國家實驗室發明的這個統計學工具讓高質量的隨機數變成了炙手可熱的學術“商品”,百萬這本書也是依托這種需求誕生的。
為了滿足暴漲的需求,1947年,為美國軍方服務的蘭德公司(RAND Corporation)就開始制造這種“商品”。1955年,百萬的第一版開始發行。
那么,這些高質量的隨機數是怎么產生的呢?
首先,一個來自自然界的隨機脈沖源發出隨機脈沖。這個脈沖源和一個電子輪盤相連,輪盤把隨機信號轉化為0-9的十進制數。
圖片來源:wikimedia
接著,這些十進制的數字又被轉化為2萬張能被計算機讀取的卡片。這些卡片被插入一臺IBM計算機里,這臺計算機就產生了一百萬個隨機數。
當然了,隨機數的質量取決于隨機脈沖的質量。蘭德公司并沒有公布它的來源,一些人猜測隨機脈沖來自對著鈾礦的蓋革計數器。
天然鈾礦。圖片來源:wikimedia
鈾會衰變,在這個過程中釋放出粒子,不過兩次衰變之間的間隔是隨機的,因此記錄到粒子的蓋革計數器的信號也是隨機的。
出版后,這本書也成了蘭德公司最暢銷的書籍。蘭德公司表示,這本書是“史上已出版的最大隨機數表。”
高質量的隨機數很難獲得,因此這本書對于教師、學生、研究者等等一系列需要和統計數字打交道的職業來說就是必不可少的。而根據蘭德公司的介紹,百萬這本書已經成了工程學和計量經濟學教材中的標準參考書。
大部分科學研究都需要隨機取樣。圖片來源:wikimedia
比如在2000年出版的經典社會統計教材?Social Research Methods: Qualitative and Quantitative Approaches?寫道,要隨機取樣的話,可以用百萬這本書。
昆士蘭大學的數學系教授 Anthony J. Richardson、康奈爾大學工程學榮譽教授 Arnim H. Meyburg 和同事 Elizabeth S. Ampt 甚至指出,百萬這本書是最知名的隨機數表,大多數統計學教材都會摘錄百萬這本書中的部分隨機數。
這本書也被廣泛用于游戲設計和模擬中。在設計游戲時,研發者要讓玩家時不時遇到不可測的情況,從而增加游戲的成癮性,這時也需要大量隨機數。
實際上在麻省理工學院數字媒體教授 Nick Montfort 和佐治亞理工學院助理教授 Ian Bogost 撰寫的電子游戲史《與電子束賽跑——雅達利視頻計算機系統》(Racing the Beam: The Atari Video Computer System)一書中就提到,游戲設計師經常使用百萬這本書中的隨機數。
蘭德公司還表示,直到現在,百萬這本書依舊是隨機數的最大已知來源,統計學家、物理學家、市場分析師、民意測驗者、品控工程師還在利用這本書里的隨機數。
比如,在對橋梁的焊接部位進行定期檢查時就需要隨機數,因為工程師不可能調查每一個焊接處,因此就要隨機地挑選幾個樣本進行調查。
甚至出現了一種傳言,那就是美國海軍潛艇還曾用這本書里的數字來進行無規律的航行,從而避免被敵軍發現。但搞笑的是,紐約公立圖書館一開始把這本書歸到“心理學”里。
除了百萬這本書,2013年9月5日,美國國家標準技術研究所(NIST)開始每60秒發布一次高質量的隨機數。
雖然這些隨機數表又大又方又好,是重要的工具,但是對于計算機安全來說,它們是“禁書”。這是因為,這些公開的隨機數已經不是秘密,也就是說它們已經失去了不可預測性,壞人可以用這些已知的隨機數破解密碼,因此它們不能用于加密,美國國家標準技術研究所也強調了這一點。
美國國家標準技術研究所(NIST)的紅字警告:不要將本所的隨機數用于加密!!!圖片來源:beacon.nist.gov/home
隨機數出名后反而不“隨機”了,因為它不再能讓人感到意外了,這真是讓人意外呢。
數學老師的作業:這本著作非常經典,建議大家全文背誦。
封面來源:wired
參考資料:https://docs.qq.com/doc/DVEhpVXpOY1VXSktX
原創文章版權歸微信公眾號“把科學帶回家”所有
轉載請聯系 bd@wanwuweb.com
往期精品(點擊圖片直達文字對應教程)
機器學習
后臺回復“生信寶典福利第一波”或點擊閱讀原文獲取教程合集
總結
以上是生活随笔為你收集整理的数学教材里的神秘数表在国外红出圈,网友:引人入胜、猜不到结局的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: C运行库和C语言函数库/Microsof
- 下一篇: C语言函数手册:c语言库函数大全|C语言