中美两本有影响力数理统计学教材的对比及其启示(龚凤乾)
【推薦理由】陳希孺先生的作品,讀起來字字璣珠,條理清晰,并且會用樸素的語言來演繹一個復雜的道理,收放自如,他的書本本精品,值得收藏,這年頭大V太多,大師太少。
小插曲:有一日和太太討論,我買了全套陳希孺的文集還不到200元,可以閱讀終身,爾隨便一個衣服配件就大大超過200元,也只能穿一季,太浪費了。太太回曰:明天你穿本書出門。
?
中美兩本有影響力數理統計學教材的對比及其啟示
天津財經大學 龔鳳乾
內容提要: 本文對比已故陳希孺院士所著《高等數理統計學》及美國Bickel等人所著《數理統計:基本思想與專題,上卷》。全文共分五部分:第一部分“中美兩本數理統計學教材內容對比”,第二部分“中美兩本數理統計學教材開篇部分對比”,第三部分“兩本教材關于統計推斷與統計決策的看法擇要”,第四部分“中美兩本數理統計學教材習題安排一覽”,第五部分“結語”。通過勾勒這兩本教材的不同凡響之處,本文希望能引起讀者對它們的關注,所提包括打好數學基礎在內的七條閱讀建議有一定的參考價值。
關鍵詞:統計模型;充分統計量;統計推斷;統計決策
A Comparison Between Two Influential Textbooks of Mathematical Statistics: Tentative Conclusions and Suggestions
Abstract: This paper makes a fairly thorough comparison between two quite influential mathematical statistics textbooks, i.e. An Advanced Course in Mathematical Statistics by the late academician of the Academy of Sciences of China, professor Chen Xiru, and Mathematical Statistics: Basic Ideas and Selected Topics, Vol. 1. (2nd Ed) by Peter J. Bickel et al. The former was published by University of Science and Technology of China in 1999, and the latter by China Statistics Press in 2004. There are five parts in this paper, namely, Part 1 Comparison Between the Contents of the Two Textbooks, Part 2 Comparison Between the First Chapters of the Two Textbooks, Part 3 Issues About Statistical Inference and Statistical Decision of the two textbooks, Part 4 Questions and Problems of the two textbooks, and Part 5 Conclusions and Suggestions. The purpose of it is to draw due attention of the general reader toward these two books, and make the reader get interested in reading them. Seven suggestions are made at the end of the paper.
Key Words: Models of Statistics, Sufficient Statistic(s), Statistical Inference, and Statistical Decision
一、 中美兩本數理統計學教材內容對比
陳希孺先生將《高等數理統計學》①定位為“基于測度論的數理統計學基礎教科書”,表明本書側重從測度論的角度闡述所論統計理論與方法的性質。本書32開、共719頁,其中,正文部分383頁,附錄5頁,習題及習題提示331頁。全書分為8章:第一章“預備知識”,著重講述統計模型以及統計問題賴以解決的表達形式(即統計量)。第二章“無偏估計與同變估計”,討論的主題是從Wald統計決策理論的觀點來研究參數的點估計:即引進某種要求(無偏、同變)以限制所考慮的估計量的類,再在該縮小了的估計類中,找出一致最優估計量。第三章“Bayes估計與Minimax估計”,與第二章相反,本章不再限制估計量的類,而是降低“一致最優”的要求,代之以一種相對風險函數而言的更寬泛的整體性指標(因在一致最優準則下,風險函數要與參數θ作逐點比較)。第四章“大樣本估計”,討論點估計若干基本的大樣本性質,以及某些重要的、以大樣本性質為依托的估計(如極大似然估計)。第五章“假設檢驗的優化理論”,討論可轉化為數學優化問題且具有小樣本性質假設檢驗的理論與方法(熟知,無論按Neyman-Pearson所建立的統計推斷理論或按Wald所建立的統計決策理論,假設檢驗問題都可以化為一個數學優化問題)。第六章“大樣本檢驗”,討論如何從直觀的想法出發,設法構造一個或一些看上去合理的檢驗法,故檢驗臨界值的確定,主要依賴檢驗統計量的漸近分布,屬于大樣本檢驗的范圍。第七章“區間估計”,敘述區間估計的基本理論:由于問題的復雜性,本章對流行的Neyman置信區間理論、Fisher的信仰推斷(Fiducial Inference)及Bayes 推斷都作了討論,對統計決策觀點下的區間估計以及區間估計的大樣本方法也有評價。第八章“線性統計模型”,討論一類在應用上很重要、其線性結構又可以精確定義的所謂“線性統計模型”的理論基礎。
綜上可知,除第一章“預備知識”及第八章“線性統計模型”外,本書主要討論幾種基本統計推斷形式(點估計及區間估計、假設檢驗)的大小樣本理論和方法。所有這些,對于提高我們的統計學理論素養,增強閱讀當代統計學專著、文獻的能力,都具有非常重要的作用。
以下考察Bickel等人所著《數理統計:基本思想與專題,上卷》①的主要內容。
Bickel等人將該書定位為“基于線性代數、矩陣論及高等微積分(不要求測度論)的、側重于解決實際統計學問題的當代數理統計學教科書”。為此,它追求提供更可能多的細節,包括證明、演算、統計量之大樣本表現,等等。本書16開,總共556頁,其中正文部分440頁,附錄部分106頁,索引10頁。全書共分6章:第一章“統計模型、目標與性能準則”:本章先是介紹非參數及半參數模型,然后是參數模型,以強調模型識別的作用;作為樣本空間函數的統計量也受到重視;對回歸模型、貝葉斯方法、統計決策框架、具有k個參數的指數分布族等專題,也都給予了相當詳細的闡述。第二章“關于估計的方法”:主要討論估計問題、特別是極大似然估計(MLEs),給出了關于多參數指數族MLEs算法收斂性的常規證明,并對EM算法作了介紹(更指出了EM算法的局限)。第三章“性能度量、優化的概念與方法”及第四章“檢驗與置信域”,主要對檢驗理論和置信區間展開討論,關于估計的優化理論、估計量穩健性也有所講述;這兩章的基調,總的說來是不刻意強調關于檢驗與估計的無偏性②,但對統計決策觀點下的風險不等式、“非標準”統計決策觀點下估計量的可計算性、可解釋性、穩健性等,卻給予了較詳細的闡述(所謂“非標準”,指盡管損失函數及相應的決策模型業已確定,但估計量的其它一些特征如穩健性等,在決定采用何種決策方法時比風險函數更需予以考慮)。第五章“漸近近似”:提供關于一致性、漸近正態性、統計推斷極大似然方法最優性的證明;本章還介紹了如何以Bernstein-von Mises定理做媒介,把貝葉斯推斷與頻率學派意義下的推斷聯系起來的途徑。第六章“多參數情況的推斷”:討論多參數模型極大似然估計量的漸近正態性,廣義線性模型下的推斷問題,似然比檢驗漸近分布的Wilks定理,Wald和Rao統計量及其相應的置信區間;本章認為,多元微積分對于多參數統計分析具有一種“自然的內在聯系”(“intrinsic”),讀者必須熟悉,否則就不易進入當代統計學研究領域。
此外,本書還有兩個附錄,即附錄A“概率論基礎回顧”,附錄B“概率與分析的其他主題”。
可以說,對任何有志于當代統計學研究的讀者而言,這本書都能提供多方面有益的指導。
順便指出,《高等數理統計學》在每一章開頭的導言中,都簡明扼要地交待這一章的主要內容、所涉及的統計思想、與上一章和/或下一章的聯系,等等,使讀者心中有底,思路清晰;而《數理統計:基本思想與專題,上卷》各章節開始部分不拘一格,但它為每一節都提供一段精煉的總結性文字(共30多段此種文字),使讀者能夠及時考察自己的閱讀實效,扎扎實實地向前推進。
二、中美兩本數理統計學教材開篇部分對比
這兩本書的開篇部分(第一章)都非常精彩,把握好它們,將大大有助于對整本教材的理解。
《高等數理統計學》第一章包括四節內容,即1.1 樣本空間與樣本分布族,1.2統計決策理論的基本概念,1.3 統計量,1.4統計量的充分性,此外,還包括一個關于因子分解定理證明的附錄。雖然為顧及后續章節的需要,本章對統計決策函數及風險函數、隨機化決策函數、統計三大分布、冪等方陣等內容也在文中作了扼要敘述,但本章的中心,乃是闡述構成一個統計問題的各種要素即樣本空間連同賦予其上的樣本分布族,即統計模型(也可稱概率模型),以及統計問題賴以解決的表達形式即統計量。這兩個方面都非同小可,它們“是數理統計基礎中的基礎”(陳希孺先生語)。讀者務必高度重視。
統計模型就是樣本分布,而不管抽樣的目的是什么。具體說來,一個問題的統計模型,指的就是研究該問題時所抽樣本的分布。因此,模型是對確定的樣本而言的,即只有在明確了樣本產生方法、并輔以必要的假定,才能定下模型;而有了樣本并規定了其分布之后,就可以提出各種所感興趣的問題。不言而喻,統計模型具有高度的數學抽象性,其基礎就是概率論;但模型的選定、有意義統計問題的提煉以及對結果做出恰當的解釋和利用,都不能離開實際背景。這些就是我們對統計模型應有的理解①。
對于統計量,則應理解它是樣本的函數,不能依賴任何未知參數,因為它本來就是用于對未知參數進行推斷的。統計量是否具備充分性關系重大。所謂充分統計量,就是不損失關于參數θ信息的統計量。直接根據定義驗證一個統計量是否充分,往往要經過復雜的計算,不太方便。所以,人們經常使用的是另一個更為便捷的判別準則,即因子分解定理
本文認為,在對統計模型和統計量有所把握之后,熟悉測度論中的一個著名定理即 “Radon-Nikodym定理②”,就顯得十分必要了。事實上,陳希孺先生就是以引述這個定理為開端而展開第一章“預備知識”討論的。該定理不僅有助于我們認識定義在樣本空間上的概率分布族,而且有助于我們理解密度函數,從而為我們討論隨機變量的條件期望、條件概率及證明因子分解定理帶來方便。前已指出,Bickel等人的書并不要求測度論,但他們在序言中對所論統計模型作了專門的假定,又在第一章末尾的注釋部分追加了說明,我們將在下面的行文中論及此事。
可以看出,學好第一章,對于理解其余各章具有重大影響。本章雖然篇幅不長(32開僅52頁),但由于它借助測度論,用嚴格的數學語言扼要而又全面地闡述數理統計學基礎,故對于沒有學過測度論或實變函數論的讀者而言,難度較大。此外,如果讀者關于統計推斷的知識較薄弱,也會在閱讀時遇到麻煩。我們認為,對基礎較差的讀者來說,選擇一、兩本中級數理統計學教材以及測度論教材作為過渡,是一個可行的措施。
以下考察《數理統計:基本思想與專題,上卷》第一章的內容。
該書這一章包含九節內容,即1.1數據、模型、參數與統計量,1.2 貝葉斯模型,1.3 決策論框架,1.4 預測,1.5 充分性,1.6 指數族,1.7 問題與補充,1.8 注釋,1.9參考文獻。需要指出,本章的最后三節是 “問題與補充”、“注釋”以及“參考文獻”(其余各章也都同此),它們是各章的有機組成部分,不可忽視。
??? 借助于大量的例子,本章對非參數模型、半參數模型及參數模型,對統計量、回歸模型、貝葉斯方法、統計決策框架、統計預測、具有k個參數的指數分布族等專題,都作了相當細致的闡述。不言而喻,本章的中心是討論統計學參數模型。由于不要求測度論,作這種討論就必須有所假設。作者未雨綢繆,在序言中早就聲明:“As in the first edition, we do not require measure theory but assume from the start that our models are what we call‘regular.’That is, we assume either a discrete probability whose support does not depend on the parameter set, or the absolutely continuous case with a density.”(“像本書初版一樣,我們在第二版也不要求測度論,但我們一開始就假定,本書所用的模型都是所謂的正則模型,即若為離散概率模型,其支撐集不依賴其參數集,若為絕對連續概率模型,它將具有密度”)。所謂分布的支撐集就是求概率時實質上起作用的集合。這一聲明的重要性在于,加上這些簡單的正則條件之后,離散情形以及連續情形下概率測度族的一致有界性,都能得到保證,從而為(雖未要求測度論時)證明因子分解定理①即統計量充要條件的判別準則提供了保證。
更進一步,作者在第一章末尾的注釋中又寫道:“For the measure theoretically minded we can assume more generally that the?? are all dominated by a? finite measure?? and that?? denotes , the Radon-Nikodym derivative. (“從測度論的角度,我們可以更一般地假定,所有的 都受控于一 有限測度 ,并假定 指的就是Radon-Nikodym導數 ”)。序言中的聲明滿足了本書的定位要求(不要求測度論),而這里的注釋,又從測度論嚴密性的角度幫助讀者看清楚概率函數或頻率函數 的實質,補充了正文的內容。
本章雖然沒有要求測度論,但在運用矩陣、微積分及數理統計基礎知識分析高深統計學問題時,它注重細節(“The devil is in the details.”),技巧嫻熟,給人留下深刻印象,這應引起讀者注意,而把所用案例(不限于第一章)理解透徹,對應用統計理論和方法解決實際問題很有借鑒價值。
? 三、兩本教材關于統計推斷與統計決策的看法擇要
熟知,統計推斷的目的在于“弄清情況”,而統計決策的目的在于“采取行動”,明確這一點有很大的理論和實際意義。因此,任何一本當代數理統計學教材,如果不討論統計推斷與統計決策之間的區別和聯系,就難免會讓人覺得不充分、不全面。
半個多世紀以前,統計決策理論的創始人Ward在其名著Statistical Decision Function中表明,引進統計決策理論的目的,是建立一種統一處理各種形式不同的統計推斷問題的方法,強調統一性。但由于決策問題要考慮行動的損失而統計推斷問題不需要考慮這種損失,于是就有學者強調它們的區別,而極端意見則認為推斷與決策完全是兩回事。
陳先生的看法是,“不大可能把二者截然劃開”。細讀《高等數理統計學》有關章節,可以說它既不忽視推斷與決策的差別,也承認二者確有密切聯系(實為一種折衷),這就為作者靈活而又不失一般性地處理推斷與決策問題帶來了便利(詳見《高等數理統計學》第一章1.2節、第三章3.1、3.2、3.3節)。另外,因為統計決策和涉及全局比較的貝葉斯方法、極小化極大方法之間存在密切聯系,所以,在每提出這樣一種方法時(貝葉斯估計、極小化極大估計、廣義貝葉斯估計、經驗貝葉斯估計等),作者都注意從統計基礎①的角度考察這些方法的含義、合理性及其優缺點,而不是僅僅羅列一大堆條件與結論的純數學推演,這就使其敘述無枯燥之感而引人入勝。
在列舉大量實例的基礎上,Bickel等人認為:“Decision theory enables us to think clearly about an important hybrid of testing and estimation, confidence bounds and intervals(and more generally regions).”(“統計決策理論能使我們明確考慮一種重要的、具有混合性質的方法,它可以把檢驗與估計、置信界與區間、或更一般的置信界與區域,結為一體”)。從有關章節就可以清楚地看出,Bickel等人認為推斷與決策相互聯系緊密,統計檢驗問題完全可以從統計決策的觀點予以對待(英文“hybrid”一詞很值得玩味);而通過引進容許性②等概念,決策最優化也得到了討論,等等(詳見《數理統計:基本思想與專題,上卷》第一章1.3節及第四章4.1~4.9諸節)。
可見,不對統計推斷與統計決策采取極端的看法,而是認識到它們的區別和聯系,充分利用它們發展新的統計思想與方法,是這兩本教材的另一個共同之處。
???? 四、中美兩本數理統計學教材習題安排一覽
??? 習題具有不可替代的作用,對此,兩本教材均給予極大重視。陳希孺先生在《高等數理統計學》序言中指出:“作者一向主張,在打基礎的階段,應強調多做習題”;Bickel等人也在《數理統計:基本思想與專題,上卷》第二版序言中申明:“As in the first edition problems play a critical role by elucidating and often substantially expanding the text”(“與本書初版一樣,本版的習題在減輕教材難點及拓展教材內容方面,也具有非常重要的作用”)。大致說來,陳希孺先生的《高等數理統計學》包含500道習題(若計小題,則超過1000道);而Bickel等人的《數理統計:基本思想與專題,上卷》第二版也包含大量習題(共計526道),其中有不少都是一題多問,如此一來其習題總數也達上千道之多。
《高等數理統計學》習題的難易程度分為三類,加“*”號的難度較大,加“o”號的相對容易,不加任何記號的,難度介于二者之間。如果一道題包含若干小題,各小題的難度可以不同。例如,第一章共有72道題,但加“*”號者只有三道題,它們是33、59、61這三道題,其余大部分為加“o”號的較為容易的題。因該章著重講述統計模型以及統計量,讀者不難想象加“*”號者應與它們有關,事實也確實如此。
陳希孺先生為讀者著想,在書末為提供了全部習題的詳細解題提示,并對大多數較難的題給出了完整解答。因為“鑒于這些題的難度,需要有一個解答文本在,以作為依據。” 但他提醒我們:“對讀者而言,筆者切望這部分是備而不用、備而少用。如碰到一個題一時做不出來,寧肯暫時擱一擱,也不要輕易翻看解答。譬如登山,經過艱苦努力上了頂峰,自有其樂趣和成就感。反之,如在未盡全力之前就任人抬上去,則不惟無益,適足以挫折作者信心。” 陳希孺先生對讀者的良苦用心可見一斑。
《數理統計:基本思想與專題,上卷》第二版的習題,從易到難也有梯度:占大多數的、單純用于強化概念、以及部分補充課文內容的題目,比較容易,而少數綜合性題目則有較大難度。
值得一提的是,蘭州大學李澤慧教授等人,曾于1991年將《數理統計:基本思想與專題,上卷》第一版譯成中文出版,還于1994年將該書第一版全部習題的解答(分上下兩冊)整理出版。陳希孺先生也曾給這本習題解答做序,在那里他又一次強調了習題的重要作用,并諄諄告誡讀者不可一味依賴現成解答,主要還是靠自己動手練習。讀者可以使用此習題解答作為學習該書第二版的參考(但應注意這兩版的章節不一致,并且第二版題目也增加了,詳見《數理統計:基本思想與專題,上卷》第二版序言)。
五、結語
從以上的對比中我們得出結論:這兩本教材均出自大家手筆,定位雖然不同,但互補性很強;而且,它們都注重關于各種理論與方法的統計學思想的闡述,非常難能可貴。
我們還得出結論,沒有良好的數學基礎,或基礎不牢固,也很難把這兩本書讀好。
還有一個語言問題,如果讀者使用英語時“攔路虎”較多,關鍵之處理解不透,同樣會增加使用Bickel等人所編教材的困難。
我們試提出以下7條建議供讀者參考:
1. 下苦功學好線性代數、矩陣論(含廣義逆)及高等微積分(含示性函數)。
2. 選擇輔助讀本,降低閱讀難度。例如,上海科學技術出版社1988年出版的,陳希孺、倪國熙合編的《數理統計學教程》(現已有陳希孺所編同名著作面世);中國科學技術大學出版社2000年出版的,陳希孺編著的《概率論與數理統計》等,都是很好的讀物,可以選擇它們作為閱讀《高等數理統計學》的輔助讀本。
3. 測度論基礎較薄弱的讀者,可以閱讀西安電子科技大學出版社2002年出版的,趙榮俠、崔群芳編著的《測度與積分》;北京師范大學出版社2004年出版的,嚴士健、劉秀芳編著的《測度與概率》或其它適宜的測度論著作,作為補課的參考。
4. 搜索相關文獻、特別是有關專題的綜述性文獻,它們對攻讀大部頭學術專著非常有用(參看下條)。
5. 英語基礎相當好但閱讀能力較差的讀者,應該樹立信心,事實上閱讀數理統計英語文獻并不像人們想象的那樣難。大學英語六級考試過關者已經具備一定的閱讀能力,要充分利用,這種能力真的是“用進廢退”!
6. 不恥下問,閱讀中經過自學實在理解不了的問題,要勤于向行家請教。
7. 按照陳希孺先生的教導去做,不到萬不得已,不去翻看習題解答;即使看過解答,也應該反思自己“卡殼”的原因,并應自行嘗試其它解法。
“經典不厭百回讀”。本文真誠希望所介紹的這兩部數理統計教材成為讀者的案頭必備!
參考文獻
1. 陳希孺. 數理統計引論 [M]. 北京. 科學出版社. 1981.
2. 陳希孺. 數理統計學簡史 [M]. 湖南. 湖南教育出版社. 2002. 213-278.
3. 陳希孺. 陳希孺統計文選 [M]. 合肥. 中國科學技術大學出版社. 2003. 1-35.
4. 史寧中. 統計檢驗的理論與方法. [M]. 北京. 科學出版社. 2008. 1-187.
5. 梁之舜等. 概率論及數理統計(第三版,上下冊) [M]. 北京. 高等教育出版社. 2005.
6. 范劍青. H. L. Koul. Frontiers in Statistics. [C]. London. Imperial College Press. 2006.
7. J. S. Maritz. Distribution-free Statistical Methods. [M]. Chapman and Hall. 1984.
8. 陳培德. 隨機數學引論. [M]. 北京. 科學出版社. 2001. 92-146.
9. 陸璇. 數理統計基礎. [M]. 北京. 清華大學出版社. 2006. 132-213.
10. [美] David Freedman等著. 魏宗舒等譯. 統計學 [M].? 吳喜之校. 北京. 中國統計出版社. 1997. 1-735.
11. 張堯庭. 多元統計分析選講. [M]. 北京. 中國統計出版社. 2002.
12. 黎子良. 統計推斷與決策. [M]. 天津. 南開大學出版社. 1987.
總結
以上是生活随笔為你收集整理的中美两本有影响力数理统计学教材的对比及其启示(龚凤乾)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: (转)直接拿来用!最火的iOS开源项目(
- 下一篇: 【RK3399Pro学习笔记】十、ROS