到达什么水平才能算是学会了数学?
我最近開始自學數學,學了有一年了。我覺得如果想把數學學懂的話,一定要從最基礎開始,一步一步的學,并且選好教材。而且往往需要用數學系的教材才行。
先說一下背景。我本科畢業于上海一所普通大學,食品專業,畢業后工作兩年完全跟專業不相關,覺得沒前途,想轉行學計算機。現在在讀計算機研究生研二。
去年開始學習之前,只有本科上過的高數(同濟)和線性代數(學校自編)的基礎,但是全都忘光了。現在讀研經常看到有線性代數的知識,而回想一下本科學的線性代數最多就會算一下特征值,應用一下克萊姆法則解方程,而且連特征值是什么都說不清楚,所以萌生了補習數學基礎的想法。因為之前本科的時候也好高騖遠,借過一些非常高大上的數學書來讀,發現什么都看不懂,比如印象深刻的是有一本書上來就介紹巴拿赫空間,但當時我連線性空間都沒啥印象,怎么可能看懂。所以這次學習,我決心要從最基礎的開始看起,不能急功近利。
我先從線性代數開始學的,最初的動機就是我們Information Retrieval課程經常會用到矩陣乘法,還有特征值,我想最起碼也要理解什么是特征值才行。選了一陣子教材,后來不知道從哪兒看到說Linear Algebra Done Right這本書講的很好,講法很新穎,并且全書最后才講行列式。我個人比較喜歡嘗新,而且當時并不具備任何數學方面的成熟度(估計現在也不成熟,不過比當時好多了),覺得這種講法可能會教給我一些對數學的直觀洞察,就選用了這本書。
這本書一開始三章給我的感覺就是完全抽象。各種定義,各種性質。而最開始的我很明顯缺少相應的數學素養,還是沿用高中的數學學習方法(對,我認為本科學的高數和線性代數根本沒有教會我怎么去學習真正的數學),嘗試用已知的經驗去套用這些定義,就想當然的以為自己懂了。我也會去想每一個定義的動機,并且每一頁都要讀1小時以上(就像這本書前言說的),但是后來發現我對每一個定義和性質的理解還是太具體。我舉個例子:
這本書開始介紹了向量和向量空間的概念,直到第六章才引入了內積,長度(范數),正交等概念。但是在這里我就犯了先入為主的錯誤。我在讀前五章時,就想當然的以為向量就對應著一段有長度有方向的線段,從而我腦海里的向量的概念其實只是真正的向量概念的特例。當然這種直觀的方法很多時候都沒有問題,畢竟特例也是向量,所以向量空間的所有性質看起來都很相容。但是如果一直在腦海中留著這兩個概念并帶到這些定理(性質)的理解中去,就會導致不能夠理解這些定理的本質,也就是學不明白,而且會覺得這些知識很繁瑣。比如對我來說曾經最大的一個困擾是,我很難去理解為什么書里面表示一個映射用的是T(x, y) = (x+3y, 2x+5y, 7x+9y),然后他又能能夠很自然的找到表示這個映射的矩陣?對于當時的我來說,(x, y)是一個向量,(x+3y, 2x+5y, 7x+9y)是另一個向量,怎么找矩陣嘛!再一個例子就是,我會花一些時間去理解(甚至根本不能理解)為什么多項式,還有三角函數也能夠看成向量,因為根本就無法具象化啊!比如,如果我想在腦海中把一個多項式當作歐式空間中的向量來看的話,sinx的長度是多少?夾角是多少?
再加上沒有人討論,點撥,所以我后來花了很長時間去摒棄我先入為主的很多觀念。當我真正發現原來我自身帶有的這種先入為主的對向量的刻板印象是錯誤的時候,那感覺就像頓悟一樣,突然前面的這些定理都通了。那個時刻我非常的興奮,感覺三觀被重塑一樣。然而實際上,我摒棄了那些沒用的刻板觀念之后,我發現線性空間其實是非常簡單的空間,而前面那幾章其實都是在講一些簡單的道理(這個感覺我在學卓里奇的數學分析前幾章的時候也發生了)。我需要學習的東西一下又變少了,那確實是一種通了的感覺。當時真的有一種三觀被重塑的感覺,而且,看待事物的方式也被潛移默化的影響了,開始喜歡數學這種下定義,嚴謹證明的方式了。
那我是怎么摒棄那些先入為主的概念呢?其實明白過來以后也很簡單,但關鍵就看能不能轉過這個彎了。有人說集合是數學的基本語言,我轉過這個彎靠的就是集合加上去理解定義,尤其是向量空間的定義。一開始的時候我看向量空間的定義時很快就自以為理解跳過了,后來學不明白回來看的時候,才注意到向量空間其實是一個集合!一個包含元素的集合!并且這個集合上的元素滿足交換律,結合律等等的性質。關鍵點就在于這是個集合!集合里的元素并沒有長度,并沒有大小。并且只要能夠滿足后面給的這6條運算性質,集合里的什么元素我都可以叫他向量。所以多項式也可以是向量,sinx也可以是向量,甚至生活中的一些東西都可以叫一個向量了。
這本書的前言里說如果讀書的時候任何一頁閱讀以及理解的時間少于1小時,說明讀快了。事實上,這本書我每天讀,讀了20多天,也才看完前三章。確實每一頁都讀了1小時左右(或許更多)。因為這本書一上來簡直太抽象了,而且我本科學習數學的時候根本就是沿用了高中那一套,盡管我每一個定義都盡力去理解并且盡力去記憶,還是很難轉過那道從高中數學到大學數學的彎。后來學完第三章以后,感覺三觀都被重塑了。
后來開學了,沒時間繼續看了。放暑假后,我又繼續看這本線性代數,從第六章看到結束,大概又花了一個多月。盡管很花時間,但理解各個定理,以及證明都沒有太大問題。但是呢,當時的我還是太naive,以為就是學好了線性代數呢。直到后來開學,選了data mining的課。老師本身很水,講的也不難,但是我還是想好好學嘛。本科由于沒學過概率論(該死我我們學校老師都不知道怎么安排的課程,食品專業也應該教概率論呀!),所以我又自學了概率論(陳希儒寫的),并且把所有分布以及各種大數定理,中信極限定理,都證明了一遍(這是另一個故事,后面再講)。但是我發現盡管我有了一些線性代數的理解,也知道了幾種“transformation”/“operator”的分解,卻還是不能很好的理解課上講的各種矩陣運算,還有嘗試理解SVD也花了很長時間,而且感覺并沒有理解透徹。我現在找到了原因,因為Linear Algebra Done Right太強調抽象了,作為理論固然很好,但是在應用的時候,就發現跟矩陣脫節了。比如這本書里定義的Normal Operator,我根本對應不上是一個什么樣子的矩陣。我也不知道原來能夠上三角化(前提是標準正交基)指的就是能夠找到可逆的酉矩陣,一左乘,一逆右乘把他化為上三角矩陣。我發現我在理解一個抽象概念,并把抽象概念轉化成可以實際應用的矩陣表示之間存在這一個鴻溝。所以我在上個月考完試之后又開始學習線性代數了,這一次想要彌補這個坎。
這次又學線性代數我仍然是結合著這本linear algebra done right教材,并在網上找了一個視頻(是我在嘗試理解某個概念時搜到的)結合著學習。視頻是臺灣交通大學的莊重老師講的線性代數。說實話,我是一聽到他講的課就愛上了。講的實在是清晰,并且我覺得,如果我最開始就跟著他學習線性代數的話,應該就不會走這么多彎路了。我其實也是從他的下學期的內積空間的幾堂課開始聽的,主要就是針對一些我之前沒有弄懂的抽象與具體對應的一些問題挑著看。他的可很好的一點就是,比如講舒爾定理時,他先寫了一個抽象的定義,緊接著他又給出了對應定義的矩陣表示形式,從而幫助理解。而且他也有一些介紹某個定理該怎么用的課。我看完了他的課之后,又覺得線性代數有了很大的提高。目前我線性代數就學到這里,盡管可能還是不入流,但是自覺的比之前的我強了太多太多。
我還想分享我自學數學分析的經歷。我在去年暑假看完線性代數的時候,就開始學習數學分析了。數學分析挑教材的時候,又是上網搜,包括知乎(知乎真是太好了)。當然又挺非主流,我被卓里奇的數學分析吸引了。因為介紹說是清華什么很牛的班用的數學分析教材,并且觀點非常之高。所以我就淘寶淘了上下兩冊(暑假在國內學的)。數學分析上來以后不像線性代數,他更詳細的介紹了集合論。我覺得這也是重塑三觀的一個過程。印象最深刻的有幾個。一個是用公理化集合論代替樸素的集合論去繞過羅素悖論。一個是連續性的那幾個公理,比如實數連續性公理,區間套公理,有限覆蓋公理。我花了好多天去理解,當時的狀態就是,把這幾個中的某一條讀的滾瓜爛熟,就是不知道為什么要這么拐彎子的定義公理去定義實數,所以每天該干嘛干嘛,但是一有閑下來的時間就漫無目的的游走或者靜坐思考這幾個公理,或者睡前繼續想直到腦海中都模糊了。想了幾天才拐過這個彎,理解到原來還是集合的問題。這幾個公理其實要表達的也很簡單,就是告訴我們實數是連續的,能夠存在像根號2這樣的無理數。這幾個公理看起來可能挺復雜,但我理解可能已經是用集合的語言,來表達連續性(也就是無理數存在)的最簡單的定義方式了。
理解了以上這些集合論,以及連續的概念之后,我們才可以在這基礎上定義極限。因為由連續可以證明極限的存在性。極限也是一步一步導出的。由之前的工具其實只能證明一個序列的極限。有了序列的極限之后,又討論了級數的極限,因為級數的每一項和都可以看作某個序列中的一項。再之后才定義了函數在某點的極限。每一個后面的定義都需要用到前面的定義以及結論。定義了函數在某點的極限之后,才能定義函數在區間的連續性(區間內處處連續)。
剛剛讀完前面4章的時候,我的心情也是非常激動的,我感覺智力上得到了挑戰,并且我成功的理解了他們,非常有成就感。我也感嘆于數學理論的精巧以及嚴密。對數字本身也有了更有趣的洞察;并且對這種定義,公理,定理的體系也更適應了。實數連續性那幾個公理確實也很塑造三觀。我覺得如果沒有轉換過一個觀念,仍然輕易去接受看起來符合直覺的數學定理,而不追問自己這個定理是怎么來的,確實容易有“這么顯而易見的事情也要證明”的困惑。而且,如果沒有脈絡,不知道數學其實是一個一步一步逐漸搭起來的過程,去被迫接受很多書上的定理并拿來使用的話,很容易被眾多的定理搞的頭昏腦漲。
從第五章開始到第八章,講的是微分,積分,然后再把微分和積分拓展到高維上去。我學的時候感覺可能是偏應用吧,并且同濟的高數教材這些內容講的比較多,并沒有遇到太多的困難。感覺很有趣的是復數部分。以前在學習數學的時候學到復數,完全不知道這個數的動機是什么。盡管我絞盡腦汁,而且嘗試各種尋找復數的直觀理解,并且還真找到了各種直觀的理解,卻總不能在情感上接受。而且,更難以接受的是,為什么偏偏定義這種二元數,不繼續定義三元數四元數呢(或者定義了卻沒有廣泛應用)?但是學了數學分析里關于復數的部分,再加上自己的一些思考,盡管我仍然不能解釋后面三元數四元數的問題,卻大體有了一些思路,了解了一些動機,并且在以后自己遇到相似的問題的時候,如果有需要,我也敢自己創造屬于我自己的什么元數出來。這其中的關鍵就在于“如果有需要”這幾個字。我理解定義復數實際上是對已有的實數的一種延拓(可能我在濫用術語了)。類比我們之前的幾次延拓應該能夠找到一些感覺,也就是什么時候我們應該去延拓一些東西的感覺。之前我們在學習的過程中已經做過幾次延拓了。我們在定義數的時候,其實我們是先從自然數開始定義的。自然數我們先從1開始定義,并且定義加法。然后1可以不斷加1,我們給每一個數起個名字,就構造出了自然數。有了自然數和加法,自然就想到了有沒有加法的逆運算,也就是減法?如果減法存在的話,那么1-2等于多少呢?這里是我認為對數的第一次延拓,這次延拓的結果就是增加了0和負數。然后有了加法,我們自然也想到了乘法,也就是x個y的運算。然后聰明的我們又開始想乘法的逆運算,也就是除法。整數又不夠用了,于是構造出了有理數,這是對整數的延拓。有了乘法,我們又構造出了乘方,然后乘方有逆運算嗎?我們定義了它的逆運算開方,結果有理數又不夠用了,我們延拓出了無理數,也就是實數了。但是其實實數還是不夠用的,因為負數現在沒有開方。我們為了讓運算封閉,并且都有意義,干脆構造出了虛數(又一次延拓),以及復數。并且,我們定義完復數之后,給它制定了運算規則,發現他很守規矩,可以很好的幫助我們計算,而且我們甚至能夠找到對它的直觀解釋,即復平面。因此我們也接受了復數。因此我感覺延拓就好像你在做數學的時候,發現現有的數學工具不能滿足自己的需求,而定義的一種新的工具。這種新的工具可能能夠幫助簡化計算,或者能夠將某個具體問題泛化成更抽象的更通用的的概念,從而幫助研究這個具體的問題。甚至有的延拓本身就足夠有趣從而值得去研究。
還有一些困難是當這本書進行到高維的時候,實在是非常抽象,所以理解起來很費事,也不容易具象化。但是我感覺我前面對于實數的連續性的理解,對于我理解高維(并且是復空間)背景下的連續,極限的概念幫助很大,因為可以很好的類比到實數的連續性上,所以學起來也沒有那么的燒腦。
卓里奇的數學分析我看了3個多月,在去年暑假結束的時候看完第一冊。目前打算用閑暇時間去讀這本書的第二冊,而且也聽說了這本書其實他的精華在于第二冊,觀點很高。可惜現在還沒看,看完了再過來更新感想。
另外我還想分享我學習概率論的經歷。概率論我本科居然沒有學過,我也不知道我們專業為什么這么安排,導致我基本上只有高中概率論的基礎,再加上之前我之前學食品某課程淺顯的接觸到了一點兒顯著性檢驗的知識(其實只會查表,但至少不陌生)。學概率論其實是有一個契機,因為按計劃我是打算看完數學分析第二冊再繼續學概率論的,因為比較簡單嘛。但是由于上學期選課選了data mining,所以課上需要用到很多概率的知識。我不希望這門課就這么混過去,所以每次作業都拖到最后一天去寫,而這之前則是惡補概率論的基礎知識。好在最后我終于補上了。概率論我大概花了1個月左右補習的。
首先還是選擇書。我經過咨詢后選擇了陳希儒版的概率論與數理統計。為什么沒有用英文版教材是因為學業壓力,沒有時間去慢慢讀英文版的。當我讀了陳希儒老師的概率論后,我發現沒有選錯書。這本書簡直太好了!統計的部分我沒有讀完,但是第一到四章以及第六章部分我都看了。作者都不是突兀的只介紹知識點,而是從實際問題入手,引出問題,我們為什么要研究這些問題,并且作者給出了很多背后的動機以及他的思考,非常幫助讀者自己印證自己的想法。而對于概率論中的每一個公理定理,老先生也是極其認真,難得的都給出了證明!這些證明也各有其動機,以及如何去直觀的理解,應用這些定理。讀這本書的時候感覺簡直是酣暢淋漓。雖然是偏應用的教材,但是這本書卻同時很數學,所有的定理仍然是一步一步的導出的,沒有什么突兀出現的概念,定理導致難以理解的。另外由于作者是中國人,讀起母語來如沐春風,非常帶感。
這本書前兩章挺好理解,但是我覺得僅僅去記憶那幾個概率分布又有些舍本逐末了。書中對很多概率分布都給了證明,我對所有的分布都試著推導了一下,獲益匪淺。比如正態分布,二維正態分布,還有伽馬分布(伽馬分布很有趣,我感覺應該可以看作階乘的延拓,不知道是否正確)等等。
為什么要推導,自己證明這些分布呢?因為我腦海中有些疑問,就是為什么我們需要這些奇怪的分布,這些分布都是怎么來的?其實還有一個實際的原因,就是我在上data mining的課程的時候,講解回歸分析時經常會用各種顯著性檢驗,有的時候滿足t分布,有的時候卻又滿足正態分布,有的時候又得用卡方檢驗。我之前完全不能夠理解。
后來我理解了這些分布的意義了,其中的關鍵就是,要知道這些分布都是在什么條件下出現的分布。這個條件很重要,有了這些條件之后,這些分布就是由這些條件再加上一些概率論中的公設推導出來的了。舉個例子,卡方分布,其條件是隨機變量X1,X2,X3...Xn相互獨立,并且滿足標準正太分布時,他們的平方和滿足自由度為n的卡方分布。注意這里是他們的平方和滿足卡方分布,這是他能應用于獨立性檢驗(皮爾森卡方鑒定)的關鍵。再比如F分布,要滿足的條件是X1,X2獨立,各自滿足自由度為m和n的卡方分布,則(X2/m)/(X1/n)滿足Fmn分布,所以可以用F檢驗。這其中的關鍵在于當條件滿足后這些變量就滿足某個分布,想要理解這個檢驗就一定需要能夠從條件推出這個分布出來。
還有一個自由度的概念。自由度很不直觀,也很難理解。書中102頁的證明能夠幫助理解自由度,但是應該有嚴格的證明,目前我還沒接觸到。我個人目前的理解是,盡管你一共有m個變量,但是這些變量之間是相關,由其中的n個變量就能推出其他m-n個變量。從向量空間的角度來看,就是盡管有m個向量,但是由于線性相關,只能張成n維的空間,即任意個一個向量都只有n個方向的自由度。
概率論這本書第三章我覺得最關鍵就是中信極限定理。之前只是證明了正態分布是一個分布函數,但是并沒有給出為什么獨立同分布的隨機變量的均值服從正態分布。中心極限定理就描述了這樣一個性質。我覺得理解這個定理的證明非常重要,要不然概率論感覺起來也像是空中樓閣一樣。但是遺憾的是這本書里沒有給出中心極限定理的證明。我現在也在嘗試找到這個證明并去理解,不過還沒有找到我能夠理解的證明。。。
以上是我這一年多學習數學的經歷,大部分是我學習過程中的心理狀態以及感想,可能過于主觀,可能寫的并不正確,還請大家見諒。
編輯?∑Gemini
來源:數學職業家
文章推薦
?數學家探索兩個幾何世界之間的鏡像鏈接
?數學天才帕吉特:他有如電影般的人生際遇
?世界上最奇怪的數學天才,被獎勵100萬卻拒領,寧愿過得像乞丐
?斯坦福大學教育學院院長:學習本身就是一門學問
?如果沒有數學,我們如何測量
?數學的真相:物理時空的數字模型還是現實本身?
總結
以上是生活随笔為你收集整理的到达什么水平才能算是学会了数学?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 2020年IEEE Fellow刚刚揭榜
- 下一篇: 看完白鹤滩水电站建造历程 感觉《流浪地球