保护模式中断
保護模式下Intel 80x86 CPU 硬件中斷過程
?
大學學操作系統原理的時候,感覺進程和文件似乎是介紹最多的兩塊內容,但慢慢發現,要想理解清楚操作系統的工作機制,如果按知識學習的先后順序排,中斷應當是比較靠前的才對,只有理解了中斷的機制,才有可能真正理解進程,文件系統,設備等等其他的概念。
中斷實際上為OS里很多概念的具體實現提供了一個基本的保證,比如進程的調度、設備的訪問、用戶態和內核態的切換,各種異常的處理等等都需要中斷的參與,甚至連對臨界資源的安全訪問也需要中斷的支持,這足以說明中斷是可以作為一個了解操作系統工作原理和具體機制的入口點的,而不僅僅只是作為相關書籍里獨立的一個章節來理解。
?????? 由于中斷的機制和實現是和硬件密切相關的,這里只總結一下Intel 80x86系列CPU的中斷在硬件層面上處理過程。
?
1. 中斷和異常的概念區別
????? ?Intel的官方文檔[1]里將中斷和異常理解為兩種中斷當前程序執行的不同機制。這是中斷和異常的共同點。不同點在于:
?? ??? 中斷(interrupt)是異步的事件,典型的比如由I/O設備觸發;
?異常(exception)是同步的事件,典型的比如處理器執行某條指令時發現出錯了等等。
????? ?中斷又可以分為可屏蔽中斷和非可屏蔽中斷,異常又分為故障、陷阱和異常中止3種,它們的具體區別很多書籍和官方文檔都解釋的比較清楚這里不再贅述。
關于它們的區別有兩點是需要注意的:
1)平常所說的屏蔽中斷是不包括異常的,即異常不會因為CPU的IF位被清(關中斷,指令:cli)而受影響,比如缺頁異常,即使關了中斷也會觸發CPU的處理。
2)通常說的int 80h這種系統調用使用的中斷方式實際上硬件上是理解為異常處理的,因此也不會被屏蔽掉,這也很好理解,int 80h這種中斷方式是程序里主動觸發的,對于CPU來說屬于同步事件,因此也就屬于異常的范疇。
?
2. 中斷(異常)處理過程
?????? 需要明確的一點是CPU對于中斷和異常的具體處理機制本質上是完全一致的,即:
當CPU收到中斷或者異常的信號時,它會暫停執行當前的程序或任務,通過一定的機制跳轉到負責處理這個信號的相關處理程序中,在完成對這個信號的處理后再跳回到剛才被打斷的程序或任務中。這里只描述保護模式下的處理過程,搞清楚了保護模式下的處理過程(更復雜),實模式下的處理機制也就容易理解了。
?
具體的處理過程如下:
0)中斷響應的事前準備:
系統要想能夠應對各種不同的中斷信號,總的來看就是需要知道每種信號應該由哪個中斷服務程序負責以及這些中斷服務程序具體是如何工作的。系統只有事前對這兩件事都知道得很清楚,才能正確地響應各種中斷信號和異常。
[a] 系統將所有的中斷信號統一進行了編號(一共256個:0~255),這個號稱為中斷向量,具體哪個中斷向量表示哪種中斷有的是規定好的,也有的是在給定范圍內自行設定的。 ?
中斷向量和中斷服務程序的對應關系主要是由IDT(中斷向量表)負責。操作系統在IDT中設置好各種中斷向量對應的中斷描述符(一共有三類中斷門描述符:任務門、中斷門和陷阱門),留待CPU查詢使用。而IDT本身的位置是由idtr保存的,當然這個地址也是由OS填充的。
下面的示意圖顯示了IDT的基本結構和IDTR是如何指示IDT的位置和長度的:
?
?
?
[b] 中斷服務程序具體負責處理中斷(異常)的代碼是由軟件,也就是操作系統實現的,這部分代碼屬于操作系統內核代碼。也就是說從CPU檢測中斷信號到加載中斷服務程序以及從中斷服務程序中恢復執行被暫停的程序,這個流程基本上是硬件確定下來的,而具體的中斷向量和服務程序的對應關系設置和中斷服務程序的內容是由操作系統確定的。
?
1)CPU檢查是否有中斷/異常信號
?????? CPU在執行完當前程序的每一條指令后,都會去確認在執行剛才的指令過程中中斷控制器(如:8259A)是否發送中斷請求過來,如果有那么CPU就會在相應的時鐘脈沖到來時從總線上讀取中斷請求對應的中斷向量[2]。
對于異常和系統調用那樣的軟中斷,因為中斷向量是直接給出的,所以和通過IRQ(中斷請求)線發送的硬件中斷請求不同,不會再專門去取其對應的中斷向量。
?
2)根據中斷向量到IDT表中取得處理這個向量的中斷程序的段選擇符
?????? CPU根據得到的中斷向量到IDT表里找到該向量對應的中斷描述符,中斷描述符里保存著中斷服務程序的段選擇符。
?
3)根據取得的段選擇符到GDT中找相應的段描述符
?????? CPU使用IDT查到的中斷服務程序的段選擇符從GDT中取得相應的段描述符,段描述符里保存了中斷服務程序的段基址和屬性信息,此時CPU就得到了中斷服務程序的起始地址。
?????? 這里,CPU會根據當前cs寄存器里的CPL和GDT的段描述符的DPL,以確保中斷服務程序是高于當前程序的,如果這次中斷是編程異常(如:int 80h系統調用),那么還要檢查CPL和IDT表中中斷描述符的DPL,以保證當前程序有權限使用中斷服務程序,這可以避免用戶應用程序訪問特殊的陷阱門和中斷門[3]。
如下圖顯示了從中斷向量到GDT中相應中斷服務程序起始位置的定位方式:
?
?
?
4)CPU根據特權級的判斷設定即將運行的中斷服務程序要使用的棧的地址
?????? CPU會根據CPL和中斷服務程序段描述符的DPL信息確認是否發生了特權級的轉換,比如當前程序正運行在用戶態,而中斷程序是運行在內核態的,則意味著發生了特權級的轉換,這時CPU會從當前程序的TSS信息(該信息在內存中的首地址存在TR寄存器中)里取得該程序的內核棧地址,即包括ss和esp的值,并立即將系統當前使用的棧切換成新的棧。這個棧就是即將運行的中斷服務程序要使用的棧。緊接著就將當前程序使用的ss,esp壓到新棧中保存起來。
?
6)保護當前程序的現場
?????? CPU開始利用棧保護被暫停執行的程序的現場:依次壓入當前程序使用的eflags,cs,eip,errorCode(如果是有錯誤碼的異常)信息。
官方文檔[1]給出的棧變化的示意圖如下:
?
?
?
7)跳轉到中斷服務程序的第一條指令開始執行
?????? CPU利用中斷服務程序的段描述符將其第一條指令的地址加載到cs和eip寄存器中,開始執行中斷服務程序。這意味著先前的程序被暫停執行,中斷服務程序正式開始工作。
?
8)中斷服務程序處理完畢,恢復執行先前中斷的程序
?????? 在每個中斷服務程序的最后,必須有中斷完成返回先前程序的指令,這就是iret(或iretd)。程序執行這條返回指令時,會從棧里彈出先前保存的被暫停程序的現場信息,即eflags,cs,eip重新開始執行。如果存在特權級轉換還會彈出ss和esp,這樣也意味著棧也被切換回原先使用的棧了。
這里有個地方需要注意:如果此次處理的是帶有錯誤碼(errorCode)的異常,CPU在恢復先前程序的現場時,并不會彈出errorCode,也就是說CPU似乎忘記了曾經壓過一個errorCode入棧,因此要求相關的中斷服務程序在調用iret返回之前需要主動彈出errorCode。
?
?
?
參考書目:
[1] Intel 64 and IA-32 Architectures Software Developers Manual Volume 1 Basic Architecture
[2] 《微型計算機接口技術及應用》,華中科技大學出版社,劉樂善 主編
[3] 《深入理解Linux內核》,第三版,中國電力出版社
前面講到了實模式下用int 15h得到內存信息,然后在保護模式下把它們顯示出來。保護模式下中斷機制發生了很大的變化,原來的中斷向量表被IDT(Interrupt Descriptor Table,中斷描述符表)代替,實模式下能用的BIOS中斷在保護模式下已經不能用了。IDT可以將每一個中斷向量和一個描述符對應起來。IDT中的描述符可以是中斷門描述符、陷阱門描述符、任務門描述符。盡管IDT在形式上與實模式下的向量表非常不同,但它也是一種向量表。
中斷門和陷阱門的作用機理幾乎一樣,只不過使用調用門時用call指令,而在這里我們使用int指令。
每一種中斷(異常)都會對應一個中斷向量號,而這個向量號通過IDT就與相應的中斷處理程序對應起來。保護模式的中斷和異常見下表:
?
| 向量號 | 助記符 | 描述 | 類型 | 出錯碼 | 源 |
| 0 | #DE | 除法錯 | Fault | 無 | DIV和IDIV指令 |
| 1 | #DB | 調試異常 | Fault/Trap | 無 | 任何代碼和數據的訪問 |
| 2 | — | 非屏蔽中斷 | Interrupt | 無 | 非屏蔽外部中斷 |
| 3 | #BP | 調試斷點 | Trap | 無 | 指令INT 3 |
| 4 | #OF | 溢出 | Trap | 無 | 指令INTO |
| 5 | #BR | 越界 | Fault | 無 | 指令BOUND |
| 6 | #UD | 無效(未定義)操作碼 | Fault | 無 | 指令UD2或無效指令 |
| 7 | #NM | 設備不可用(無數學協處理器) | Fault | 無 | 浮點或WAIT/FWAIT指令 |
| 8 | #DF | 雙重錯誤 | Abort | 有(0) | 所有能產生異常或NMI或INTR 的指令 |
| 9 | ? | 協處理器段越界(保留) | Fault | 無 | 浮點指令(386后不再處理此 異常) |
| 10 | #TS | 無效TSS | Fault | 有 | 任務切換或訪問TSS時 |
| 11 | #NP | 段不存在 | Fault | 有 | 加載段寄存器或訪問系統段時 |
| 12 | #SS | 堆棧段錯誤 | Fault | 有 | 堆棧操作或加載SS時 |
| 13 | #GP | 常規保護錯誤 | Fault | 有 | 內存或其他保護檢驗 |
| 14 | #PF | 頁錯誤 | Fault | 有 | 內存訪問 |
| 15 | — | Intel保留,未使用 | ? | ? | ? |
| 16 | #MF | x87FPU浮點錯(數學錯) | Fault | 無 | x87FPU浮點指令或WAIT/FWAIT指令 |
| 17 | #AC | 對齊檢驗 | Fault | 有(0) | 內存中的數據訪問(486開始支持) |
| 18 | #MC | Machine Check | Abort | 無 | 錯誤碼(若有的話)和源依賴于 具體模式(奔騰CPU開始支持) |
| 19 | #XF | SIMD浮點異常 | Fault | 無 | SSE和SSE2浮點指令(奔騰三 開始支持) |
| 20~31 | — | Inter保留,未使用 | ? | ? | ? |
| 32~255 | — | 用戶定義中斷 | Interrupt | ? | 外部中斷或int n指令 |
對于異常的三種類型解釋如下:
?
Fault(錯誤)——可被更正的異常,更正后程序可繼續執行。當一個fault發生時,處理器會把產生fault的指令之前的狀態保存起來。異常處理程序的返回地址將會是產生fault的指令,而不是其后的那條指令。
Trap(陷阱)——一種在發生trap的指令執行后立即被報告的異常,它也允許程序或任務不失連續性地繼續執行。異常處理程序的返回地址將會是產生trap的指令之后的那條指令。
About(終止)——不總是報告精確異常發生位置,它不允許程序或任務繼續執行,而是用來報告嚴重錯誤。
中斷產生的原因有兩種:
外部中斷(即由硬件產生的)——需要建立硬件中斷與向量號之間的對應關系。分為可屏蔽中斷和不可屏蔽中斷兩種。不可屏蔽中斷由CPU的NMI引腳接收,可屏蔽中斷則由CPU的INTR引腳接收。可屏蔽中斷與CPU的關系是通過對可編程中斷控制器8259A(可以認為是中斷機制中所有外圍設備的一個代理,這個代理不但可以根據優先級在同時發生中斷的設備中選擇應該處理的請求,而且可以通過對其寄存器的設置來屏蔽或打開相應的中斷)建立起來的。
內部中斷(由int n產生)——類似于調用門的使用,n即為向量號。
設置8259A:
有兩片級聯的8259A與CPU相連,每個8259A有8根中斷信號線,兩片級聯公可以掛接15個不同的外設。對8259A進行設置,可以使這些外設發出的中斷請求與中斷向量對應起來。在BIOS初始化它的時候,IRQ0~IRQ7被設置為對應向量號08h~0Fh,但保護模式下這些向量號已被占用,所以需要重新設置。8259A是可編程中斷控制器,對它的設置可通過向相應端口寫入特定的ICW(Initialization Command Word)來實現。主8259A對應的端口地址是20h和21h,從8259A對應的端口地址是A0h和A1h。初始化過程(不能顛倒順序):往端口20h或A0h寫入ICW1->往端口21h或A1h寫入ICW2->往端口21h或A1h寫入ICW3->往端口21h或A1h寫入ICW4(注:2、3、4的寫入的端口相同)。
還有一個東西叫做OCW(Operation Control Word),共有OCW1、OCW2、OCW3共三個,用于屏蔽或打開外部中斷(向21h或A1h寫入OCW1即可,實際上OCW1被寫入了中斷屏蔽寄存器IMR中,當一個中斷到達,IMR會判斷此中斷是否應被丟棄)或發送EOI給8259A以通知它中斷處理結束。
對于EOA,每一次中斷處理結束,需要發送一個EOI給8259A,以便繼續接受中斷。發送EOI通過向20h或A0h端口寫OCW2實現。
可屏蔽中斷與NMI的區別在于是否受到IF位的影響,而8259A的中斷屏蔽寄存器(IMR)也影響著中斷是否會被響應。所以外部可屏蔽中斷受IF位(需為1)和IMR位(需為0)的影響。
實際應用中,中斷的產生大多帶有特權級變換,規則與用call指令調用一個調用門的規則完全一樣。如果中斷或異常發生時沒有特權級變換,則eflags、cs、eip、將依次被壓入堆棧,如果有出錯碼,則出錯碼最后被壓棧。如果有特權級變換,ss和esp被壓入內層堆棧,然后是eflags、cs、eip、出錯碼(若有的話)。總之不管怎樣,中斷或異常發生時,堆棧都會發生變化。
從中斷或異常返回時必須使用指令iretd,與ret的區別就在于它同時改變eflags的值。需要注意的是,只有當CPL為0時,eflags中的IOPL域才會改變,而且只有當CPL小于等于IOPL時,IF才會改變。還要注意的是,iretd執行的時候Error Code不會被自動從堆棧中彈出,所以執行它之前要先將它從棧中清除掉。
還有一點,中斷門和陷阱門有一個小區別。由中斷門向量引起的中斷會復位IF,因為可以避免其他中斷干擾當前中斷的處理,隨后的iret指令會從堆棧上回復IF的原值;而通過陷阱門產生的中斷不會改變IF。
下面的內容是保護模式下的I/O,內容很少~
I/O敏感指令:in、ins、out、outs、cli、sti,它們只有在CPL小于等于IOPL時才能執行,如果低特權級的指令試圖訪問這些I/O敏感指令將會導致常規保護錯誤(#GP)。
可以改變IOPL的指令只有popf和iretd,但只有運行在ring0的程序才能將其改變,低特權級的無法改變,但也不會產生異常(會維持原樣)。指令popf也可用來改變IF(就像執行了cli和sti)。但在這種情況下,popf也變成了I/O敏感指令,只有CPL小于等于IOPL時,popf才能改變IF,否則保持原樣(不會產生異常)。
I/O位圖基址是一個以TSS的地址為基址的偏移,指向的便是I/O許可位圖。它的每一位表示一個字節的端口地址是否可用(0為可用,1為不可用)。由于每個任務都可以有單獨的TSS,所以每個任務可以有它單獨的I/O許可位圖。I/O許可位圖必須以0FFh結尾。如果I/O位圖基址大于或等于TSS段界限,則表示沒有I/O許可位圖,如果CPL小于等于IOPL,則所有I/O指令都會引起異常。I/O許可位圖的使用使得即便在同一特權級下不同的任務也可以有不同的I/O訪問權限。
?
《新程序員》:云原生和全面數字化實踐50位技術專家共同創作,文字、視頻、音頻交互閱讀
總結
- 上一篇: 使用 Bochs 调试操作系统
- 下一篇: org 07c00h的原因