linux中的vsprintf_Git29 年超 100 万次 commit,Linux 内核何以发展至今?
1991 年,21 歲的芬蘭大學生 Linus Torvalds 寫下第一行 Linux 內核代碼時,多半沒有想到它會成長為今天這樣的龐然大物。
當年 8 月 25 日,Torvalds 在 Minix Usenet 新聞組里發了一封帖子,稱自己正在做一個自由的操作系統,“就是個興趣愛好,不會搞得像 GNU 那么大那么專業”。
事情的發展顯然遠超他的預期,如今小到傳感器,大到超級計算機,從智能手機、手表、汽車等日常用品到航天器等設備,Linux 內核的身影已無處不在。
隨著迄今為止最大版本?Linux Kernel 5.8?于今年 8 月初的發布,Linux 內核已擁有超過 2 萬名貢獻者,歷史 commit 數超過 100 萬次,迎來一個新的里程碑。
上周恰逢 Linux 29 周年紀念日,Linux 基金會發布了一份詳盡的?Linux 內核報告,涵蓋了自 1991 年 9 月 17 日首次發布以來,到 2020 年 8 月 2 日最新版本的 Linux 內核歷史。
版本控制:從 BitKeeper 到 Git
Linux 基金會從 2008 年開始每年發布 Linux 內核報告,但此前一直難以將其發展過程完整串聯起來。
今年,借助 Daniel German 博士的?cregit?工具,他們成功追溯到了第一個版本,Linux 內核的發展時間線變得清晰。根據版本控制方式,可大致分為以下三個階段:
- pre-version control(前版本控制):1991 年 9 月 - 2002 年 2 月 4 日
- BitKeeper:2002 年 2 月 4 日 - 2005 年 4 月 15 日
- Git:2005 年 4 月 16?日至今
繁雜且自成體系的內核代碼
首個內核版本 linux-0.01.tar.Z 由 88 個文件和 10,239 行代碼組成,運行在 i386 這樣單一的硬件架構上。到了 5.8 版本,這一數據擴張為 69,325 個文件和 28,442,673 行代碼,并能夠在 30 多種主要的架構上運行。數量上的龐大僅是 Linux 內核代碼的表象,它自身更是形成了一套復雜的體系,不熟悉的人往往不知從何處下手,極有可能“牽一發而動全身”。這或許也是內核維護者難尋的原因之一。Linux 內核發布第一天起的某些代碼仍在當前版本中使用,例如?Torvalds 和大學好友?Lars Wirzenius 共同編寫的?vsprintf?例程,它也是為數不多存在至今的首次 commit 中的源代碼。今年的內核報告提到,有 2,964 個能被追溯至 1991 年的 token 如今在 5.8 版本中也能找到。5.8 版本超過一半的代碼寫于近 7 年內,但之前所有年份都對此版本有貢獻。過去的代碼不斷在后續的版本中留下痕跡。持續膨脹的內核文件量和代碼行數未見得完全是一件好事,為了使系統不變得臃腫,內核維護者需要做一些修枝剪葉的工作。Linux 內核中未使用的代碼和文件都會被視情況刪除,有一些版本還會進行大的清理,例如 2018 年的 4.17 版本,刪除了 8 個架構,凈減少代碼大約 180,000 行。不僅僅是源碼,Linux 內核維護者還會關注空白行和代碼注釋,以確保源碼的可讀性。
開發者原創證書和標簽管理
2004 年對開發者原創證書(Developer Certificate of Origin,簡稱 DCO)的標準化是 Linux 內核史上的一個關鍵變化點。DCO 的引入為開發者和用戶提供了法律保護,同時又不至于增加程序負擔。它極大地提高了跟蹤補丁進入內核的路徑的能力,加上版本控制系統向 Git 的過渡,DCO 有效地減輕了開發者做貢獻的開銷,因此變得很受歡迎,后來也被許多其他開源項目采用。隨著 DCO 的標準化使用,現在幾乎所有的 commit 都有一個 Signed-off-by 標簽。通常每個 commit 平均會有兩個該標簽,能夠反映代碼在合并之前的維護者層次結構,有助于追溯補丁進入代碼的路徑。Signed-off-by 之外,Linux 內核還增加了表示審查的標簽(Reviewed-by 和 Acked-by)。審查對內核代碼的質量來說相當重要,標簽的加入令這個過程更加清晰,有越來越多的維護者選擇使用標簽來表示已審查。在審查 git 倉庫時,Linux 基金會發現了一些比較有趣的標簽,像是 "Enithusiastically-ack'd by"、"Thanksto"、"Based-on-the-Original-screenplay-by"、"Catched-by-andrightfully-ranted-at-by" 等等。但這些標簽并沒有像上述兩類一樣被廣泛采用。行之有效的發布模式
Linux 內核的發布模式已漸趨成熟,現在基本固定為 Prepatch(或"-rc")、Mainline、Stable 和 Long Term Stable?四類版本。社區曾對發布周期進行了大量的探討和實驗,并逐漸找到了行之有效的發布模式,發布周期也幾乎完全可預測——每個發布周期由時長兩周的“合并窗口”開始,這時,新功能經適當的 review 后可被納入接下來要發布的 git 倉庫。一旦它被標記為 rc1,那么集成測試、調試和穩定化的周期就開始了。然后每周對 rc 候選版本進行標記,直到達到目標質量和穩定性。發布后,隨著下一個合并窗口的到來,這個周期又開始循環。內核的主線樹由 Linus Torvalds 維護,這棵樹引入了所有新功能。新的主線(Mainline)內核每 2 到 3 個月發布一次。但這樣的發布節奏較慢,難以滿足大多數用戶的需求。因此,從 2005 年開始,每周發行一次穩定版(Stable)內核。用戶還想要維護時間更長的版本,于是 2006 年發布的 2.6.16 版本成為第一個長期支持(LTS)版本內核。此后每年都有一個新的 LTS 內核,該內核將由內核社區維護至少 2 年(從 4.4 版本開始延長至 6 年)。Linux 內核官網公布了所有現存 LTS 版本的發行日期、EOL 日期及維護者(目前 6 個 LTS 版本都由 Greg Kroah-Hartman 和 Sasha Levin 這兩人維護)。貢獻者:長尾的力量不可忽視
不少組織都在為 Linux 內核做貢獻,貢獻者排行榜前列幾乎都被 Intel、Red Hat、IBM、SUSE、Google、Samsung、AMD、Oracle、華為和 ARM 這樣的大企業占據。從 2007 年到 2019 年,Linux 內核共接受了來自 1,730 個組織的 780,048 次 commit。排在最前面的 20 個組織占了 68% 的 commit 量。在過去十年中,每年有超過 400 個組織為 Linux 內核做出貢獻。其中相當一部分可能只有過一次 commit。從每年的 commit 比例來看,其中 1/3 貢獻來自神秘的長尾。也就是圖中最上面淺灰色 “Others”?的部分。Linux 基金會指出,企業的貢獻會根據業務需求和戰略的不同而有所變化。前 20 名貢獻者中,有些是 2007 年之后才加入,有些在此前做過很多貢獻的公司,被收購后便不再繼續參與。貢獻者的多樣性為內核發展賦予了一些彈性。除了組織貢獻者,Linux 內核社區成員也致力于增加個人貢獻者的多樣性,他們通常愿意花費自己的時間來指導新的開發者。Linux 基金會有一個 Kernel Mentorship(LKMP)項目,用來幫助新加入開源的開發者進行實驗、學習,并為開源社區做出貢獻。內核社區的共同目標:高質量、可靠性
報告的最后,Linux 基金會指出,內核社區的重點是保持一個共同的目標,即擁有一個沒有回歸的高質量操作系統,愿意根據需要創建新的流程和工具,以幫助提高效率,并繼續提升 Linux 內核的可靠性。內核測試現在也引入了一些自動化測試工具:靜態分析工具如 sparse(語義解析器)、smatch(源匹配器)和cocicheck(語義補丁,測試特定的 bug),由 0-day 和 Hulk Robot 這樣的自動測試機器人在 Linux 內核樹上運行。機器人在發現和跟蹤 bug 上起到不少作用。這些測試工具能夠幫助開發人員跟上上游內核的速率變化,并繼續改進內核版本,提升其穩定性。Linux 內核如今被應用于諸多領域,基金會認為,改進基礎設施,進行正確的安全分析,是接下來要應對的重大挑戰之一。目前 Linux 內核已擁有一個很好的基礎,它應當繼續引領創造最佳實踐,以促進整個開源軟件行業的發展。
總結
以上是生活随笔為你收集整理的linux中的vsprintf_Git29 年超 100 万次 commit,Linux 内核何以发展至今?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 杉德支付php代码实现_php实现小程序
- 下一篇: 耦合式是什么意思_高内聚 ,低耦合 到底