一切皆是映射:浅谈操作系统内核的缺页异常(Page Fault)
淺談操作系統(tǒng)內(nèi)核的缺頁異常(Page Fault)
缺頁中斷就是要訪問的頁不在主存,需要操作系統(tǒng)將其調(diào)入主存后再進行訪問。在這個時候,被內(nèi)存映射的文件實際上成了一個分頁交換文件。
頁缺失(英語:Page fault,又名硬錯誤、硬中斷、分頁錯誤、尋頁缺失、缺頁中斷、頁故障等),指的是當(dāng)軟件試圖訪問已映射在虛擬地址空間中,但是并未被加載在物理內(nèi)存中的一個分頁時,由中央處理器的內(nèi)存管理單元所發(fā)出的中斷。
簡單講,就是:內(nèi)核接住了這個異常,并處理了這個異常(Page Fault Handler)。
通常情況下,用于處理此中斷的程序是操作系統(tǒng)的一部分。如果操作系統(tǒng)判斷此次訪問是有效的,那么操作系統(tǒng)會嘗試將相關(guān)的分頁從硬盤上的虛擬內(nèi)存文件中調(diào)入內(nèi)存。而如果訪問是不被允許的,那么操作系統(tǒng)通常會結(jié)束相關(guān)的進程。
雖然其名為“頁缺失”錯誤,但實際上這并不一定是一種錯誤。而且這一機制對于利用虛擬內(nèi)存來增加程序可用內(nèi)存空間的操作系統(tǒng)(比如Microsoft Windows和各種類Unix系統(tǒng))中都是常見且有必要的。
術(shù)語約定
VA:Virtual Address 虛擬地址
PA:Physical Address 物理地址
MMU:Memory Manage Unit 內(nèi)存管理單元
TLB:Translation Lookaside Buffer 旁路快表緩存/地址變換高速緩存
PTE:Page Table Entry 分頁表項
概述
CPU通過地址總線可以訪問連接在地址總線上的所有外設(shè),包括物理內(nèi)存、IO設(shè)備等等,但從CPU發(fā)出的訪問地址并非是這些外設(shè)在地址總線上的物理地址,而是一個虛擬地址,由MMU將虛擬地址轉(zhuǎn)換成物理地址再從地址總線上發(fā)出,MMU上的這種虛擬地址和物理地址的轉(zhuǎn)換關(guān)系是需要創(chuàng)建的,并且MMU還可以設(shè)置這個物理頁是否可以進行寫操作,當(dāng)沒有創(chuàng)建一個虛擬地址到物理地址的映射,或者創(chuàng)建了這樣的映射,但那個物理頁不可寫的時候,MMU將會通知CPU產(chǎn)生了一個缺頁異常。
只有程序運行時用到了才去內(nèi)存中尋找虛擬地址對應(yīng)的頁幀,找不到才可能進行分配,這就是內(nèi)存的惰性(延時)分配機制。
對于一個運行中的進程來說,不是所有的虛擬地址在物理內(nèi)存中都有對應(yīng)的頁。虛擬地址空間根據(jù)固定大小一般是4KB進行劃分,物理內(nèi)存可以設(shè)置不同的頁面大小,通常物理頁大小和虛擬頁大小是一樣的,都是 4KB。
CPU如何獲取內(nèi)存中的數(shù)據(jù)?
CPU并不直接和物理內(nèi)存打交道,而是把地址轉(zhuǎn)換的活外包給了MMU,MMU是一種硬件電路,其速度很快,主要工作是進行內(nèi)存管理,地址轉(zhuǎn)換只是它承接的業(yè)務(wù)之一。
一起看看MMU是如何搞定地址轉(zhuǎn)換的。
一切皆是映射。(光劍)
MMU和Page Table
每個進程都會有自己的頁表Page Table,頁表存儲了進程中虛擬地址到物理地址的映射關(guān)系,所以就相當(dāng)于一張地圖,MMU收到CPU的虛擬地址之后開始查詢頁表,確定是否存在映射以及讀寫權(quán)限是否正常,如圖:
對于4GB的虛擬地址且大小為4KB頁,一級頁表將有2^20個表項,頁表占有連續(xù)內(nèi)存并且存儲空間大,多級頁表可以有效降低頁表的存儲空間以及內(nèi)存連續(xù)性要求,但是多級頁表同時也帶來了查詢效率問題。
我們以2級頁表為例,MMU要先進行兩次頁表查詢確定物理地址,在確認了權(quán)限等問題后,MMU再將這個物理地址發(fā)送到總線,內(nèi)存收到之后開始讀取對應(yīng)地址的數(shù)據(jù)并返回。
MMU在2級頁表的情況下進行了2次檢索和1次讀寫,那么當(dāng)頁表變?yōu)镹級時,就變成了N次檢索+1次讀寫。
可見,頁表級數(shù)越多查詢的步驟越多,對于CPU來說等待時間越長,效率越低,這個問題還需要優(yōu)化才行。
本段小結(jié) 敲黑板 劃重點1.頁表存在于進程的內(nèi)存之中,MMU收到虛擬地址之后查詢Page Table來獲取物理地址。2.單級頁表對連續(xù)內(nèi)存要求高,于是引入了多級頁表,但是多級頁表也是一把雙刃劍,在減少連續(xù)存儲要求且減少存儲空間的同時降低了查詢效率。
CPU覺得MMU干活雖然賣力氣,但是效率有點低。有沒有提升效率的辦法呢?
計算機科學(xué)中的所有問題,都可以通過添加一個中間層來解決。
我們知道 CPU 用的數(shù)據(jù)經(jīng)常是一小搓,但是每次MMU都還要重復(fù)之前的步驟來檢索,害,就知道埋頭干活了,也得講究方式方法呀!
找到瓶頸之后,MMU引入了新武器,江湖人稱快表的TLB(其實,就是緩存),別看TLB容量小,但是正式上崗之后干活還真是不含糊。
當(dāng)CPU給MMU傳新虛擬地址之后,MMU先去問TLB那邊有沒有,如果有就直接拿到物理地址發(fā)到總線給內(nèi)存,齊活。
TLB容量比較小,難免發(fā)生Cache Miss,這時候MMU還有保底的老武器頁表 Page Table,在頁表中找到之后MMU除了把地址發(fā)到總線傳給內(nèi)存,還把這條映射關(guān)系給到TLB,讓它記錄一下刷新緩存。
TLB容量不滿的時候就直接把新記錄存儲了,當(dāng)滿了的時候就開啟了淘汰大法把舊記錄清除掉,來保存新記錄,彷佛完美解決了問題。
TLB的容量畢竟有限,為此必須依靠Page Table一起完成TLB Miss情況的查詢,并且更新到TLB建立新映射關(guān)系。
缺頁異常Page Fault大揭秘
設(shè)想,CPU給MMU的虛擬地址,在TLB和 Page Table都沒有找到對應(yīng)的物理頁幀,該怎么辦呢?
沒錯,這就是缺頁異常Page Fault,它是一個由硬件中斷觸發(fā)的可以由軟件邏輯糾正的錯誤。
假如目標內(nèi)存頁在物理內(nèi)存中沒有對應(yīng)的頁幀或者存在但無對應(yīng)權(quán)限,CPU 就無法獲取數(shù)據(jù),這種情況下CPU就會報告一個缺頁錯誤。
由于CPU沒有數(shù)據(jù)就無法進行計算,CPU罷工了用戶進程也就出現(xiàn)了缺頁中斷,進程會從用戶態(tài)切換到內(nèi)核態(tài),并將缺頁中斷交給內(nèi)核的 Page Fault Handler 處理。
缺頁異常并不可怕,只要CPU要的虛擬地址經(jīng)過MMU的一番尋址之后沒有找到或者找到后無權(quán)限,就會出現(xiàn)缺頁異常,因此觸發(fā)異常后的處理流程將是重點內(nèi)容。
缺頁錯誤的分類處理
缺頁中斷會交給PageFaultHandler處理,其根據(jù)缺頁中斷的不同類型會進行不同的處理:
- Hard Page Fault 也被稱為Major Page Fault,翻譯為硬缺頁錯誤/主要缺頁錯誤,這時物理內(nèi)存中沒有對應(yīng)的頁幀,需要CPU打開磁盤設(shè)備讀取到物理內(nèi)存中,再讓MMU建立VA和PA的映射。
- Soft Page Fault 也被稱為Minor Page Fault,翻譯為軟缺頁錯誤/次要缺頁錯誤,這時物理內(nèi)存中是存在對應(yīng)頁幀的,只不過可能是其他進程調(diào)入的,發(fā)出缺頁異常的進程不知道而已,此時MMU只需要建立映射即可,無需從磁盤讀取寫入內(nèi)存,一般出現(xiàn)在多進程共享內(nèi)存區(qū)域。
- Invalid Page Fault 翻譯為無效缺頁錯誤,比如進程訪問的內(nèi)存地址越界訪問,又比如對空指針解引用內(nèi)核就會報segment fault錯誤中斷進程直接掛掉。
總結(jié)
以上是生活随笔為你收集整理的一切皆是映射:浅谈操作系统内核的缺页异常(Page Fault)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 简单易懂使用DDOS攻击
- 下一篇: mysql错误代码1064_如何解决my