Python传奇:30年崛起之路
導讀:一切都始于1989年的那個圣誕節,Python的誕生并不算恰逢其時,它崛起充滿了機遇巧合,也有其必然性。三十年間,Python技術不斷更迭,生態逐漸完善,加上互聯網、大數據、以及人工智能這一波波浪潮的推波助瀾,Python漸漸從小眾最終站上了現在的高度。
從歷史發展的角度出發,我們才能看清Python崛起的偶然性和必然性。本文將結合技術和產業的發展,全面透析Python的演進之路,幫助讀者理解是什么造就了如今的Python。
作者:宋天龍
來源:AI科技大本營(ID:rgznai100)
01 Python 1.0時代:起源與誕生
Guido van Rossum(下面簡稱Guido)是Python語言之父,他于1982年從阿姆斯特丹大學獲得了數學和計算機碩士雙學位,期間他接觸了很多的語言,包括Pascal,C,Fortran等。
在那個計算機資源貧乏的年代,像計算機一樣思考并編程是每個程序員必須面對的事情,這讓他非常苦惱;同時他又非常欣賞shell,shell簡單易編程的特性讓程序員更加專注于設計和邏輯本身,但shell本質上是一個功能的調用,它沒有自己的數據類型,更無法全面調用計算機功能,因此shell也不算是一門“語言”。
因此,他希望找到一種語言既可以像使用shell一樣簡單,又可以和C語言的功能相媲美。不過這種語言在那個年代并不存在。
▲Guido van Rossum,圖片作者:Doc Searls,來源:Wikipedia
1989年的圣誕節,Guido開始編寫Python語言的編譯器。Python這個名字來源于他喜歡的電視劇Monty Python’s Flying Circus,而不是表面意義上的“蟒蛇”。他希望這個新的語言,能符合他的理想:介于C和shell之間,功能全面、易學、易用又可拓展。
1991年,第一個Python編譯器誕生,這標志著Python的第一個版本正式誕生。它基于C語言,并具備了基礎的類、函數、異常處理等功能特性,同時具備可擴展性。
Python語法很多來自C,但又受到ABC語言的強烈影響。例如來源于ABC語言強制縮進的規定本身可以讓Python容易讀,但如果縮進出錯卻會影響編譯和執行。Python本身不以性能為重,但當確實需要考慮性能時,Python程序員卻可以深入底層來編寫C程序,并編譯為.so文件引入到Python中使用。
Python語言的魅力在于讓程序員可以花更多的時間用于思考程序的邏輯,而不是具體的實現細節,這一特性也得到Guido同事的歡迎。他們在反饋使用意見的同時也參與到Python的改進中來,因此最初Guido和一些同事構成了Python的核心團隊,當然,核心決策者還是Guido本人。隨后,Python的使用拓展到研究所之外,并吸引了越來越多的程序員。
但是,最初Python的使用非常小眾,因為在那個計算機資源非常有限的年代,大家都傾向于最大化榨取計算機資源并提升運算效率,而Python顯然不是為此而生。
02 Python 2.0時代:崛起
最初發布時,Python在設計層面存在一些缺陷,例如以滿足跨語言、跨平臺進行文本轉換、處理的要求的Unicode字符編碼標準在1994年才正式公布,所以一直以來Python 2及之前的版本對Unicode的支持并不完全。相信大家在使用Python 2版本處理中文時都遇到過各種問題。
2000年發布的Python 2.0標志著Python的框架基本確定。重要框架方向包括:
簡單明確。在設計Python語言時,開發者傾向于選擇沒有或者很少有歧義的語法。由于這種設計觀念的差異,Python源代碼通常被認為比Perl具備更好的可讀性,并且能夠支撐大規模的軟件開發。
面向對象。任何Python的元素都可以視為對象,包括數據類型、類、函數、實例化元素等,完全支持繼承、重載關系,這有益于增強代碼的復用性。
動態類型。任何對象的數據類型都無需提前定義,拿來即用。即使在之前已經預先定義,后期也可隨時修改。
膠水特性。Python本身被設計為可擴充的,并非所有的特性和功能都集成到語言核心。Python提供了豐富的API和工具,以便程序員能夠輕松地使用C、C++、Cython來編寫擴充模塊。例如在Google對于Google Engine使用C++編寫性能要求極高的部分,然后用Python或Java/Go調用相應的模塊。
可嵌入。你可以把Python的功能嵌入到C/C++程序中,從而實現Python功能在其他語言中的功能實現。
生態系統。Python有強大的標準庫,同時支持第三方庫和包的擴展應用,甚至可以自定義任何庫和包。Pypi(https://pypi.org/)是其第三方庫的倉庫,在這里你幾乎可以找到任何領域內的功能庫。
解釋器機制。Python支持多種解釋器,例如CPython(官方版本,基于C語言開發,也是使用最廣的Python解釋器)、IPython(基于CPython之上的一個交互式解釋器)、PyPy(一個追求執行速度的Python解釋器,采用JIT技術對Python代碼進行動態編譯)、Jython(運行在Java平臺上的Python解釋器,可以直接把Python代碼編譯成Java字節碼執行)、IronPython(和Jython類似,只不過運行在微軟.Net平臺上)。
1965年,戈登·摩爾提出了著名的摩爾定律,其內容為:當價格不變時,集成電路上可容納的元器件的數目,約每隔18-24個月便會增加一倍,性能也將提升一倍。在隨后超過半個世紀的時間里,個人計算機的發展日新月異,已經由資源不足向資源過剩轉變。這客觀上為Python的應用提供了基礎條件——只有在資源過剩的條件下,程序員才不會過度關注榨取性能。
隨著Python自身功能的完善以及生態系統的擴展,Python在Web開發、網絡爬蟲、數據分析與數據挖掘、人工智能等應用方面逐漸嶄露頭角。
1. Django和Flask引領的WEB開發模式
2004年,目前最流行的WEB框架Django誕生。2010年,另一個流行的輕量級WEB框架Flask誕生。
Django是一個WEB解決方案“全家桶”,其功能大而全,包含了幾乎所有WEB開發相關的組件和功能,它可以大大節省開發者在基礎組件、選型、適配等方面的時間和精力;而Flask只包含基本的配置,默認依賴于兩個外部庫也可以自由替換,給開發者提供最大的自主空間。
這兩類完全相反方向上的WEB開發模式,幾乎可以為所有開發者提供了很好的選型參照物:無論開發者想要一站式還是最大化自主解決方案,Python都能滿足。
此后,以豆瓣、春雨醫生、知乎、Dropbox、YouTube、CIA(美國中情局)等為代表的企業和機構都基于Python做網站開發,預示著Python應用到WEB開發領域逐漸成為一種新興趨勢。
2. 人人都能勝任的網絡爬蟲
Python自帶的標準庫中,urllib、urllib2、requests庫對于簡單網頁的抓取實現非常簡單,即使在面對海量數據抓取需求時,第三方庫Scrapy也能應對自如;再配合正則表達式庫re、網頁代碼解析BeautifulSoup、html和xml解析庫lxml、多線程庫threading等特性,使得Python在應用到網絡爬蟲任務上時,只需要很少的開發量便能迅速完成任務。基于Python簡單易學的特性,幾乎人人都能開發網絡爬蟲。
3. 比shell更好用的自動化運維工具
Python是跨語言和平臺的,幾乎所有Linux系統和MAC系統都自帶Python庫,Windows系統也可以自定義安裝。Python默認的os、sys等庫可實現與操作系統的交互和執行功能,更重要的是Python還能直接執行系統終端命令。
因此,使用Python編寫的系統運維和管理腳本在可讀性、性能、代碼重用度、擴展性幾方面都優于普通的shell腳本,在自動化運維方面應用廣泛。
4. 數據分析與科學計算三劍客
2008年發布的Numpy、scipy和2009年發布的pandas是數據分析與科學計算的三劍客。
NumPy(Numeric Python的簡稱)是Python科學計算的基礎工具包,也是Python做數據計算的關鍵庫之一,同時又是很多第三方庫的依賴庫。
Scipy(Scientific Computing Tools for Python的簡稱)是一組專門解決科學和工程計算不同場景的主題工具包,它提供的主要功能側重于數學、函數等,例如積分和微分方程求解。Pandas(Python Data Analysis Library的簡稱)是一個用于Python數據分析的庫,它的主要作用是進行數據分析和預處理。
Pandas提供用于進行結構化數據分析的二維表格型數據結構DataFrame,類似于R中的數據框,能提供類似于數據庫中的切片、切塊、聚合、選擇子集等精細化操作,為數據分析提供便捷。另外,Pandas還提供了時間序列的功能,用于金融行業的數據分析。
除此之外,很多大型公司也都在使用Python完成不同類型的其他工作,其中不乏世界知名公司,如國外的Google、Facebook、NASA 、雅虎、YouTube等,國內的網易、騰訊、搜狐、金山等。
例如谷歌在Google Groups、Gmail、Google Maps等項目中將Python用作網絡應用的后端;在Google Cloud Platform中的Google Cloud Storage本地部署環境中,gsutil也在Python 2基礎上開發和應用。
03 后Python2與Python3時代,AI讓Python大放異彩
2008年12月,Python 3發布。Python 3相對于Python 2的早期版本(主要是Python2.6之前)是一個較大的升級,它在設計的時候沒有考慮向下兼容,所以很多早期版本的Python程序無法在Python 3上運行。
為了照顧早期的版本,推出過渡版本2.6——基本使用了Python 2.x的語法和庫,同時考慮了向Python 3.0的遷移,允許使用部分Python 3.0的語法與函數。同時,Python還提供了Python 2到Python 3的Python文件轉換功能,以幫助開發者升級。
2010年7月發布了Python 2.x系列的最后一個版本,主版本號為2.7。大量Python 3的特性被反向遷移到了Python 2.7,2.7版本比2.6版本進步非常多,同時擁有大量Python 3中的特性和庫,并且照顧了原有的Python開發人群。Python2.7也是當前絕大多數Linux操作系統最新版本的默認Python版本。
從2008年開始,Python 2與Python 3是并存發展的。但在2018年3月,Guido在郵件列表上宣布Python 2.7將于2020年1月1日終止支持,這意味著之后Python 2將不再被統一維護,與之對應的是主流第三方庫也不會再提供針對Python 2版本的開發支持。Python 2的時代即將過去。
這一時期,Python繼續以其獨特魅力吸引更多的開發者加入,但真正讓Python大放異彩的卻是AI(人工智能)的爆發。
AI并不是一個新生事物,而是從20世紀50年代就開始出現,隨后經過了大概20年的黃金時期,又分別在20世紀70年代和90年代兩次進入寒冬期。從2006年開始,神經網絡、深度學習的出現,讓AI進入爆發期。
在AI領域,Python擁有很多相關庫和框架。其中最著名的是:
sklearn:一個老牌機器學習庫,其neural_network庫可用來做神經網絡訓練。
PyTorch:由Facebook于2016年發布,它基于曾經非常流行的Torch框架而來,為深度學習的普及邁出了重要一步,到目前為止它已經是人們用來做學術研究的首選方案。
TensorFlow:谷歌于2015年研發的第二代人工智能學習系統。借助谷歌的強大號召力以及在人工智能領域的技術實力,它已經成為目前企業真實生產環境中最流行的開源AI框架。更重要的是,它也是第一個(應該也是唯一一個)經過真實大規模生產環境(Google)檢驗過的框架。
在互聯網領域,Facebook和Google都是全球IT企業的標桿,具備行業領導力和風向指示意義。他們基于Python開發的AI庫(PyTorch和TensorFlow)已經成為目前最流行的AI庫,而且“到底選擇PyTorch還是Tensorflow”仍然是一個具有爭議性的話題。
在AI時代,主要應用場景包括:
計算機視覺:通過特定的圖片模式訓練,讓計算機理解圖像中的物體甚至內容。在這一領域我們熟悉的場景包括圖像識別、目標識別和跟蹤。例如人臉識別便是圖像識別的典型領域,廣泛應用到企業員工考勤、門店客戶識別、機場等公共領域反恐識別等。2011年,吳恩達創立的谷歌大腦項目,能夠在沒有任何先驗知識的情況下,僅僅通過觀看無標注視頻學習到識別高級別的概念就能知道哪個是貓。
語音識別:該過程是計算機將人類的自然語言識別并轉換為文字的過程,廣泛應用工業、家電、通信、汽車電子、醫療、家庭服務、消費電子產品等各個領域。身邊熟悉的場景例如通過語言對導航、APP、車載設備等做指令輸入,以及電信客服系統中的語音業務查詢和辦理。
自然語言理解:自然語言理解是一類任務的總稱,而并非是單一任務。它旨在讓計算機理解人類的語言所表達的表層和深層含義。目前場見的應用場景包括自動問答系統、機器翻譯、信息檢索和過濾、信息抽取等。
個性化推薦:個性化推薦是一個相對成熟的領域,但基于深度學習和神經網絡,可以將大量的復雜、抽象特征的數據預處理工作最大程度的簡化,甚至可以將海量特征經過簡單處理后便直接丟到模型中便能獲得比例理想的效果。
游戲和競技:在該領域,很多科技公司用經過訓練后的AI與人類進行對弈。早在20世紀90年代,由IBM開發的“深藍”與卡斯帕羅夫的世紀之戰已經引起了世界的轟動;在2017年AlphaGo又擊敗排名世界圍棋冠軍柯潔,再一次讓世人感受到AI的強大威力。
在不同的領域,Python都能扮演非常重要的角色,因此,在國外的各大榜單中,Python都已經成為最受歡迎的語言(或至少是之一)。不只在商業領域流行,國內很多地區和教育機構正將Python納入教材之中。
比如Python進入山東小學六年級的教材,浙江信息技術教材將放棄VB,改用Python 語言,Python列入全國計算機二級等級考試大綱等。
04 Python的未來發展
在Python發展過程中,Guido一直是核心人物,甚至被稱為“終身仁慈獨裁者”,但在2018年經歷了退出管理層風波之后,他又在2019年以五大指導委員之一的身份重回決策層。這為Python迎來了新的治理方案:指導委員會模式。
這種模式意味著Python的未來將從Guido一人決定變為5人決定,雖然比很多開源語言仍然有民主化空間(例如PHP的改進由社區投票決定),但也算是一種從專制到民主的進步。
有關Python的每個提升計劃,都是在PEP(Python Enhancement Proposal)列表中——每個版本新特性和變化都通過PEP提案經過社區決策層討論、投票決議,最終才有我們看到的功能。
目前,Python的最新穩定的主版本是3.7,Python 3.8也已經有了預覽版,大概在2023年左右Python 4便會問世。在之后的時間里,Python會如何發展?我們可以從Python軟件基金會的董事會成員、CPython的核心開發人員Nick Coghlan的信息中略知一二:
首先,Python的PEP流程和制度沒有任何變化,通過增加新模塊和功能來增強的基礎能力。隨著Python 2在2020年不再維護,社區在Python 3的資源和投入會相應增加。
其次,不同解釋器的實現和功能擴展還將繼續增強,方向包括PyPy關于JIT編譯器生成和軟件事務內存的嘗試,以及科學和數據分析社區,對面向數組編程的探索等。
再次,嵌入式應用的增強,核心是與其他虛擬機運行時(如JVM和CLR)的集成和改進,尤其是在教育領域取得的進展,可能會讓Python作為更受歡迎的嵌入式腳本語言,在更大的應用程序中運行。
最后,對于為了兼容和維持Python 2的部分功能而存在于Python 3中的原有代碼,在后續版本中應該會逐步優化甚至去掉。而對于其他更改,則會根據情況棄用、提出警告、逐步替代以及保留。
關于作者:宋天龍,深大數據技術專家,觸脈咨詢合伙人兼副總裁,前Webtrekk中國區技術和咨詢負責人(德國最大在線數據分析服務提供商)。擅長數據挖掘、建模、分析與運營,精通端到端數據價值場景設計、業務需求轉換、數據結構梳理、數據建模與學習以及數據工程交付。在電子商務、零售、銀行、保險等多個行業擁有豐富的數據項目工作經驗。
延伸閱讀《Python數據分析與數據化運營》
(第2版)
點擊上圖了解及購買
轉載請聯系微信:DoctorData
推薦語:這是一本將數據分析技術與數據使用場景深度結合的著作,從實戰角度講解了如何利用Python進行數據分析和數據化運營。本書與同類書大的不同在于,并不只有純粹的關于數據分析技術和工具的講解,而且還與數據使用場景深度結合,在業務上真正可指導落地。此外,本書作者提供微信、郵箱等,可通過實時和離線兩種方式及時為讀者在線傳道、受業、解惑。
有話要說?
Q:?你是從什么時候開始學Python的?
歡迎留言與大家分享
猜你想看?
AI魔幻行為大賞:細數機器視覺的9大應用場景
搞定這個月薪50K的AI熱門領域,看這9本書就夠了
吐血整理!140種Python標準庫、第三方庫和外部工具都有了
最近都在談的「私域流量」,究竟有沒有前途?
更多精彩?
在公眾號對話框輸入以下關鍵詞
查看更多優質內容!
PPT?|?報告?|?讀書?|?書單?|?干貨?
大數據?|?揭秘?|?Python?|?可視化
AI?|?人工智能?|?5G?|?區塊鏈
機器學習?|?深度學習?|?神經網絡
合伙人?|?1024?|?段子?|?數學?|?高考
據統計,99%的大咖都完成了這個神操作
?
覺得不錯,請把這篇文章分享給你的朋友
轉載 / 投稿請聯系:baiyu@hzbook.com
更多精彩,請在后臺點擊“歷史文章”查看
總結
以上是生活随笔為你收集整理的Python传奇:30年崛起之路的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 创建字节跳动之前,张一鸣读过哪些硬核技术
- 下一篇: TIOBE 6月编程语言排行榜:Pyth