main函数解析(一)——Linux-0.11 学习笔记(五)
main()函數解析(一)——Linux-0.11 學習筆記(五)
經過了前面的各種鋪墊,終于來到了main函數。這篇博客的任務是把init/main.c講清楚。由于牽扯到很多的函數調用,要想一次就說明白是很難的,所以我們把目標定得低一點,把脈絡理清楚就行。
1. 宏定義_syscall0
文件開頭的頭文件包含等就不多說了。對于C語言比較熟悉的朋友,我想第一個攔路虎就是“GCC內嵌匯編”。
static inline _syscall0(int,fork) static inline _syscall0(int,pause) static inline _syscall1(int,setup,void *,BIOS) static inline _syscall0(int,sync)原理都是類似的,說清楚一個,其他的也就迎刃而解了。
static inline _syscall0(int,fork)_syscall0()是在文件unistd.h中定義,它以內嵌匯編的形式調用 Linux 的系統調用中斷 int 0x80。
系統調用(通常稱為syscalls)是 Linux內核與上層應用程序進行交互通信的唯一接口。用戶程序通過直接或間接(通過庫函數)調用中斷int 0x80(在eax寄存器中指定系統調用功能號),即可使用內核資源,包括系統硬件資源。
_syscall0()其實是一個宏,這個宏定義在include/unistd.h 文件第 133 行:
#define _syscall0(type,name) \ type name(void) \ { \ long __res; \ __asm__ volatile ("int $0x80" \ : "=a" (__res) \: "0" (__NR_##name)); \ if (__res >= 0) \return (type) __res; \ errno = -__res; \ return -1; \ }第5行:匯編語句,表示系統調用,0x80號中斷;
第6行:輸出部分,把eax的值傳給變量__res;
第7行:輸入部分,把__NR_name的值賦給eax,即指明系統調用功能號;
第8~9行: 如果返回值>=0,則直接返回該值;
第10~11行: 否則置出錯號errno(全局變量),并返回-1。
順便提一下,內嵌匯編語法如下。對此不熟悉的朋友可以專門找資料學習。
__asm__(匯編語句模板: 輸出部分: 輸入部分: 破壞描述部分)根據_syscall0()的宏定義,我們把static inline _syscall0(int,fork)展開,得到:
static inline int fork(void) { long __res; __asm__ volatile ("int $0x80" : "=a" (__res) : "0" (2)); if (__res >= 0) return (int) __res; errno = -__res; return -1; }
實際上展開結果就是上面一行。
可以手工展開,也可以用命令展開。用命令展開的方法是:
首先進入到 Linux-0.11 源碼路徑下,比如~/oslab/linux-0.11,然后輸入命令:
gcc -E init/main.c -o main.i -I./include
如果你還沒有實驗環境,那趕緊弄一個吧,方法是 Linux 0.11 實驗環境搭建或者Linux 0.11 實驗環境搭建與調試
以上的展開結果實在是太長了,分行寫如下:
static inline int fork(void) {long __res;__asm__ volatile ("int $0x80" : "=a" (__res) : "0" (2)); if (__res >= 0)return (int) __res; errno = -__res;return -1; }第6行:括號里的“2”是因為在文件unistd.h中有#define __NR_fork 2
gcc會把上述“函數”體中的語句直接插入到調用fork()語句的代碼處,因此執行fork()不會引起函數調用。另外,宏名稱字符串syscall0中最后的0 表示無參數,1表示帶1個參數。如果系統調用帶有1個參數,那么就應該使用宏_syscall1()。
2. setup.s讀取的參數
/** This is set up by the setup-routine at boot-time*/ #define EXT_MEM_K (*(unsigned short *)0x90002) #define DRIVE_INFO (*(struct drive_info *)0x90080) #define ORIG_ROOT_DEV (*(unsigned short *)0x901FC)以上三行,右側的地址其實是setup.s運行時,讀取了一些參數,并保存到了相應位置。忘了的同學可以參考我的博文 bootsect.s 分析—— Linux-0.11 學習筆記(一)
EXT_MEM_K (0x9002):系統從 1MB 開始的擴展內存大小,以KB為單位;
DRIVE_INFO (0x90080) :硬盤參數表,包括第1個和第2個硬盤,共32字節;
ORIG_ROOT_DEV :根文件系統所在的設備號3.
3. 讀取CMOS實時時鐘信息
#define CMOS_READ(addr) ({ \ outb_p(0x80|addr,0x70); \ // 把 (0x80|addr) 寫入端口0x70 inb_p(0x71); \ // 讀端口0x71 })要想搞清楚上面的代碼,就先要弄清楚outb_p和inb_p。outb_p和inb_p都是宏,在文件\include\asm\io.h中定義。
3.1 outb_p(value,port)
#define outb_p(value,port) \__asm__ ("outb %%al,%%dx\n" \"\tjmp 1f\n" \"1:\tjmp 1f\n" \"1:"::"a" (value),"d" (port))注意:第4行和第5行的“1”是標號。
第2行:把al的值寫入端口dx;
第3行:跳轉到1處,即下一句;這樣寫是為了延時;
第4行:同第3行;
第5行:port作為端口號,傳給edx; 把eax的值傳給value;
所以, outb_p(value,port)表示把value寫入端口port.
3.2 inb_p(port)
#define inb_p(port) ({ \unsigned char _v; \__asm__ volatile ("inb %%dx,%%al\n" \"\tjmp 1f\n" \"1:\tjmp 1f\n" \"1:":"=a" (_v):"d" (port)); \_v; \})第3行:讀端口dx到al;
第4~5行:跳轉到1處,即下一句;為了延時;
第6行:port作為端口號,傳給edx; 把eax的值傳給_v;
第7行:_v的值作為整個表達式的返回值。
所以, inb_p(port)表示讀取端口port的值。
3.3 outb(value,port)和inb(port)
#define outb(value,port) \ __asm__ ("outb %%al,%%dx"::"a" (value),"d" (port))#define inb(port) ({ \ unsigned char _v; \ __asm__ volatile ("inb %%dx,%%al":"=a" (_v):"d" (port)); \ _v; \ })既然都分析到這里了,那就把這兩個宏也說了吧。這兩個宏和上面的差不多,只不過不帶延遲。
3.4 CMOS與RTC
PC 機的 CMOS 內存是由電池供電的 64 或 128 字節內存塊,通常是系統實時鐘芯片RTC (Real Time Chip) 的一部分。有些機器還有更大的內存容量。該 64 字節的CMOS原先在IBM PC-XT機器上用于保存時鐘和日期信息,存放的格式是BCD碼。由于這些信息僅用去 14 字節,因此剩余的字節就可用來存放一些系統配置數據。
CMOS的地址空間在基本地址空間之外,因此其中不包括可執行代碼。要訪問它需要通過端口 0x70、 0x71 進行。0x70 是地址端口,0x71 是數據端口。為了讀取指定偏移位置的字節,必須首先使用out指令向地址端口 0x70 發送指定字節的偏移位置值,然后使用in指令從數據端口 0x71 讀取指定的字節信息。同樣,對于寫操作也需要首先向地址端口 0x70 發送指定字節的偏移值,然后把數據寫到數據端口 0x71 中去。
outb_p(0x80|addr,0x70);把欲讀取的字節地址(addr)與0x80進行或操作是沒有必要的。因為那時的CMOS內存容量還沒有超過128(=111_1111b)字節,因此不需要把b7設為1。之所以會有這樣的操作是因為當時Linus手頭缺乏有關CMOS方面的資料,CMOS中時鐘和日期的偏移地址都是他逐步實驗出來的,也許在他的實驗中將偏移地址與0x80進行或操作(并且還修改了其他地方)后正好取得了所有正確的結果,因此他的代碼中也就有了這步不必要的操作。不過從1.0版本之后,該操作就被去除了。
下表是 CMOS 內存信息的一張簡表。
CMOS 64 字節信息簡表
3.5 time_init函數
static void time_init(void){struct tm time;do {time.tm_sec = CMOS_READ(0); // 秒time.tm_min = CMOS_READ(2); // 分time.tm_hour = CMOS_READ(4); // 時time.tm_mday = CMOS_READ(7); // 日time.tm_mon = CMOS_READ(8); // 月time.tm_year = CMOS_READ(9); // 年(since 1900)} while (time.tm_sec != CMOS_READ(0));BCD_TO_BIN(time.tm_sec);BCD_TO_BIN(time.tm_min);BCD_TO_BIN(time.tm_hour);BCD_TO_BIN(time.tm_mday);BCD_TO_BIN(time.tm_mon);BCD_TO_BIN(time.tm_year);time.tm_mon--;startup_time = kernel_mktime(&time);}結合上面的表格,6~11行非常好懂。
第12行:while (time.tm_sec != CMOS_READ(0));為什么有這個do-while循環呢?
CMOS的訪問速度很慢。為了減小時間誤差,在讀取了所有數值后,若此時CMOS中秒值發生了變化,那么就重新讀取所有值。這樣內核就能把與CMOS時間誤差控制在1秒之內。
注意,讀取的值是BCD(Binary Coded Decimal)碼格式。
BCD碼:是一種十進制數字編碼的形式。在這種編碼下,每個十進制數字用一串單獨的二進制比特來存儲與表示。常見的有以4位表示1個十進制數字,稱為壓縮的BCD碼(compressed or packed);或者以8位表示1個十進制數字,稱為未壓縮的BCD碼(uncompressed or zoned)。
比如當前時間是10:35:20,那么讀出的二進制數是:
0001_0000b:0011_0101b:0010_0000b
#define BCD_TO_BIN(val) ((val)=((val)&15) + ((val)>>4)*10)// (val)&15 即 (val)&0xF, 得到個位數;// (val)>>4)*10 把十位上的數字乘以10;這個宏的作用是把BCD格式的值轉換成二進制(或者說十進制,總之存到PC里都是二進制)
time.tm_mon--;startup_time = kernel_mktime(&time);第2行:調用函數kernel_mktime(),計算從 1970 年 1 月 1 日 0 時起到現在經過的秒數,作為開機時間,保存到全局變量startup_time 中。更具體的分析可以參考我的博文 kernel_mktime() 詳解
4. main函數
void main(void) /* This really IS void, no error here. */ { /* The startup routine assumes (well, ...) this */ /** Interrupts are still disabled. Do necessary setups, then* enable them*/ROOT_DEV = ORIG_ROOT_DEV; //0x21Cdrive_info = DRIVE_INFO;memory_end = (1<<20) + (EXT_MEM_K<<10); //EXT_MEM_K = 0x3c00, memory_end = 0x100_0000memory_end &= 0xfffff000; //0x100_0000 = 16Mif (memory_end > 16*1024*1024)memory_end = 16*1024*1024;if (memory_end > 12*1024*1024) buffer_memory_end = 4*1024*1024; //buffer_memory_end = 4M else if (memory_end > 6*1024*1024)buffer_memory_end = 2*1024*1024;elsebuffer_memory_end = 1*1024*1024;main_memory_start = buffer_memory_end; //4M #ifdef RAMDISK_SIZE //=1025main_memory_start += rd_init(main_memory_start, RAMDISK_SIZE*1024); #endifmem_init(main_memory_start,memory_end);trap_init();blk_dev_init();chr_dev_init();tty_init();time_init();sched_init();buffer_init(buffer_memory_end);hd_init();floppy_init();sti();move_to_user_mode();if (!fork()) { /* we count on this going ok */init();} /** NOTE!! For any other task 'pause()' would mean we have to get a* signal to awaken, but task0 is the sole exception (see 'schedule()')* as task 0 gets activated at every idle moment (when no other tasks* can run). For task0 'pause()' just means we go check if some other* task can run, and if not we return here.*/for(;;) pause(); }4.1 根設備號
ROOT_DEV = ORIG_ROOT_DEV;在 fs/super.c 中,定義了 int ROOT_DEV = 0;
本文件內有宏定義
#define ORIG_ROOT_DEV (*(unsigned short *)0x901FC)
ROOT_DEV = ORIG_ROOT_DEV;這條語句執行后(依據我的實驗環境),ROOT_DEV = 0x21C
在bootsect.s中,有
mov %cs:root_dev+0, %axcmp $0, %axjne root_definedmov %cs:sectors+0, %bxmov $0x0208, %ax # /dev/ps0 - 1.2Mbcmp $15, %bxje root_definedmov $0x021c, %ax # /dev/PS0 - 1.44Mb, excute here when debugcmp $18, %bxje root_defined undef_root:jmp undef_root root_defined:mov %ax, %cs:root_dev+0....org 508 root_dev:.word ROOT_DEV !這里存放根文件系統所在設備號(init/main.c中會用)設備號 = 主設備號*256 + 次設備號(也即 dev_no = (major << 8) + minor )
在 Linux 中軟驅的主設備號是 2,次設備號 = type*4 + nr,其中 nr 為 0-3 分別對應軟驅 A、B、C 或 D; type 是軟驅的類型(2 表示1.2 MB 或 7 表示 1.44 MB 等)。
0x21C = 2<<8 + (7*4+0),所以根設備是 1.44M 的 A 驅動器。
4.2 計算主內存起始位置
memory_end = (1<<20) + (EXT_MEM_K<<10); //EXT_MEM_K = 0x3c00, memory_end = 0x100_0000memory_end &= 0xfffff000; //0x100_0000 = 16Mif (memory_end > 16*1024*1024) //如果內存超過16M,則按16M計memory_end = 16*1024*1024;if (memory_end > 12*1024*1024) //如果內存超過12M,則設置緩沖區末端=4Mbuffer_memory_end = 4*1024*1024; //buffer_memory_end = 4M else if (memory_end > 6*1024*1024)//如果內存超過6M,則設置緩沖區末端=2Mbuffer_memory_end = 2*1024*1024;elsebuffer_memory_end = 1*1024*1024;//否則設置緩沖區末端=1Mmain_memory_start = buffer_memory_end; //主內存起始位置=緩沖區末端注意,代碼注釋部分的值是我通過實驗測試出來的,你的實驗環境不一定是這個值。
第1行:計算出內存大小
第2行:忽略不到4KB的內存數
在我的環境中,通過單步調試,代碼執行第6行,也就是說緩沖區末端(buffer_memory_end)在4M處,也就是主內存的起始位置(main_memory_start)。
4.3 虛擬盤
#ifdef RAMDISK_SIZE // 如果定義了虛擬盤main_memory_start += rd_init(main_memory_start, RAMDISK_SIZE*1024); #endif當 linux/Makefile文件中設置的RAMDISK值不為零時,表示系統會創建 RAM 虛擬盤設備。 在這種情況下,就會執行第2行,即主內存區的起始地址后移,也就是說主內存區頭部還要劃去一部分,供虛擬盤存放數據。
根據單步調試的結果,main_memory_start = 4194304(4M),RAMDISK_SIZE = 1025
如圖所示,內核程序占據在物理內存的開始部分,接下來是供硬盤或軟盤等塊設備使用的高速緩沖區部分(其中要扣除顯卡內存和 ROM BIOS 所占用的內存,它們的地址范圍是640KB~1MB)。
關于高速緩沖區:當一個進程需要讀取塊設備中的數據時,系統會首先把數據讀到高速緩沖區中;當有數據需要寫到塊設備上時,系統也是先將數據放到高速緩沖區中,然后由塊設備驅動程序寫到相應的設備上。
內存的最后部分是供所有程序可以隨時申請和使用的主內存區。內核程序在使用主內存區時,也同樣先要向內核內存管理模塊提出申請,在申請成功后方能使用。
對于含有 RAM 虛擬盤的系統,主內存區頭部還要劃去一部分,供虛擬盤存放數據。
long rd_init(long mem_start, int length) {int i;char *cp;blk_dev[MAJOR_NR/*=1*/].request_fn = DEVICE_REQUEST;rd_start = (char *) mem_start;rd_length = length;cp = rd_start;for (i=0; i < length; i++)*cp++ = '\0';return(length); }第6行:MAJOR_NR的值是1。
blk_dev是一個數組,其成員類型是struct blk_dev_struct
struct blk_dev_struct blk_dev[NR_BLK_DEV] = {{ NULL, NULL }, /* no_dev */{ NULL, NULL }, /* dev mem */{ NULL, NULL }, /* dev fd */{ NULL, NULL }, /* dev hd */{ NULL, NULL }, /* dev ttyx */{ NULL, NULL }, /* dev tty */{ NULL, NULL } /* dev lp */ };struct blk_dev_struct的定義是
struct blk_dev_struct {void (*request_fn)(void);struct request * current_request; };可以看出,2個成員都是指針,request_fn指向函數,current_request指向struct request.
回到函數rd_init:
blk_dev[MAJOR_NR/*=1*/].request_fn = DEVICE_REQUEST;
DEVICE_REQUEST實際上是設備請求函數do_rd_request
因為#define DEVICE_REQUEST do_rd_request
void do_rd_request(void) {int len;char *addr;INIT_REQUEST;addr = rd_start + (CURRENT->sector << 9);len = CURRENT->nr_sectors << 9;if ((MINOR(CURRENT->dev) != 1) || (addr+len > rd_start+rd_length)) {end_request(0);goto repeat;}if (CURRENT-> cmd == WRITE) {(void) memcpy(addr,CURRENT->buffer,len);} else if (CURRENT->cmd == READ) {(void) memcpy(CURRENT->buffer, addr,len);} elsepanic("unknown ramdisk-command");end_request(1);goto repeat; }此函數的代碼,我們先不深入,以后用到再說。我們關注的是rd_init函數的以下幾行:
rd_start = (char *) mem_start;rd_length = length;cp = rd_start; // cp是 char * 類型for (i=0; i < length; i++)*cp++ = '\0'; //以上3行, 盤區清零return(length);rd_start和rd_length都是全局變量,定義在文件kernel\blk_drv\ramdisk.c中:
char *rd_start; //虛擬盤的起始地址 int rd_length = 0; //虛擬盤空間大小,以B為單位4.4 mem_init函數
該函數對1MB以上內存區域以頁面為單位進行管理前的初始化設置工作。
一個頁面長度為4KB字節。該函數把1MB以上所有物理內存劃分成一個個頁面,并使用一個頁面映射字節數組mem_map[] 來管理這些頁面。對于具有 16MB 內存容量的機器,該數組共有3840( (16M-1M)/4K=3840 )項 ,即可管理3840個物理頁面。
每當一個物理內存頁面被占用時就把 mem_map[]中對應的的字節值增1 ;若釋放一個物理頁面,就把對應字節值減 1。 若字節值為0 , 則表示對應頁面空閑; 若字節值 >=1,則表示對應頁面被占用或被不同程序共享占用。
在該版本內核中,最多能管理16MB的物理內存,大于16MB的內存將棄掉不用。對于具有16MB內存的PC機系統,在沒有設置虛擬盤 RAMDISK 的情況下start_mem通常是4MB,end_mem是 16MB。因此主內存區范圍是4MB~16MB,共有3072個物理頁面可供分配。如果設置了 RAMDISK,那么start_mem會大于4MB,比如我的實驗環境是5243904(=5121K)即RAMDISK占用了1025K(=5121K-4096K).
void mem_init(long start_mem, long end_mem) {int i;HIGH_MEMORY = end_mem;// 參數start_mem是可用作頁面分配的主內存區起始地址//(已去除RAMDISK所占內存空間)。 // end_mem是實際物理內存最大地址。//地址范圍start_mem到end_mem是主內存區。 for (i=0 ; i<PAGING_PAGES ; i++) //PAGING_PAGES = 3840mem_map[i] = USED;i = MAP_NR(start_mem); // i=主內存區起始位置處頁面號end_mem -= start_mem; // 首尾相減,算出主內存區的大小end_mem >>= 12; // 主內存區的總頁面數while (end_mem-->0)mem_map[i++]=0; // 以上2行, 主內存區頁面對應字節值清零 }第11~12行: 首先將 1MB 到 16MB 范圍內所有內存頁面設置為已占用狀態,即各項字節值全部設置成 USED(100)
PAGING_PAGES 被定義為(PAGING_MEM0RY>>12),即(15*1024*1024)>>12=3840
#define LOW_MEM 0x100000 #define PAGING_MEMORY (15*1024*1024) #define PAGING_PAGES (PAGING_MEMORY>>12) #define MAP_NR(addr) (((addr)-LOW_MEM)>>12) #define USED 100第13行:MAP_NR(start_mem) 即是(start_mem-0x100000)>>12,計算出主內存區起始位置處頁面號。
4.5 trap_init函數
void trap_init(void) {int i;set_trap_gate(0,÷_error);set_trap_gate(1,&debug);set_trap_gate(2,&nmi);set_system_gate(3,&int3); /* int3-5 can be called from all */set_system_gate(4,&overflow);set_system_gate(5,&bounds);......}以上代碼主要是安裝陷阱門。我們拿第5行作為例子,具體分析一下。
4.5.1 set_trap_gate(n,addr)
set_trap_gate(n,addr)其實是_set_gate(&idt[n],15,0,addr),也就是下面7~15行的內嵌匯編代碼。
#define set_trap_gate(n,addr) \_set_gate(&idt[n],15,0,addr)...#define _set_gate(gate_addr,type,dpl,addr) \ __asm__ ("movw %%dx,%%ax\n\t" \"movw %0,%%dx\n\t" \"movl %%eax,%1\n\t" \"movl %%edx,%2" \: \: "i" ((short) (0x8000+(dpl<<13)+(type<<8))), \"o" (*((char *) (gate_addr))), \"o" (*(4+(char *) (gate_addr))), \"d" ((char *) (addr)),"a" (0x00080000))d: 表示 edx
a: 表示 eax
i: 允許一個立即整形操作數,包括其值僅在匯編時確定的符號常量。
o: 允許一個內存操作數,但只有當地址是可偏移的。即該地址加上一個小的偏移量,結果是一個有效的內存地址。
以上內嵌匯編代碼沒有輸出部分,僅有輸入部分。
上圖是陷阱門的格式,上面是高4字節(代碼中用 edx 表示),下面是低4字節(代碼中用 eax 表示)。注意:過程入口點偏移值不是物理地址,而是線性地址。
第15行:
"d" ((char *) (addr))表示用 addr 加載edx;此時,偏移值的[31:16]就位。
addr 是異常處理函數入口點的地址。因為內核代碼段的線性基址是0,所以偏移值等于函數的線性地址,又因為內核在之前的分頁中采用了恒等映射機制——線性地址等于物理地址,所以偏移值等于函數的物理地址。
"a" (0x00080000) :表示用 0x0008_0000 加載 eax;此時,段選擇符就位。
段選擇子(符)的值是0x08,為什么是這個值呢?因為在進入main函數之前,已經設置好了GDT,0x08是代碼段的選擇子。忘了的話可以參考我的博文head.s——第三節。
第7行的"movw %%dx,%%ax\n\t"表示用 dx 加載 ax;此時,偏移值的[15:0]就位,eax也就位。
第8行的"movw %0,%%dx\n\t",表示用(0x8000+(dpl<<13)+(type<<8))加載 dx,
這里的 8 表示 P=1; 此時,edx 就位。
根據_set_gate(&idt[n],15,0,addr)的參數可知type=15(表示陷阱門), dpl=0。(0x8000+(dpl<<13)+(type<<8))拼出了陷阱門的第4~5字節(edx的低字)。
第9行"movl %%eax,%1\n\t"表示把 eax 的值賦給*((char *) (gate_addr)),就是賦給idt[n]的前4字節。
第10行"movl %%edx,%2" 表示把edx的值賦給*(4+(char *)(gate_addr)),就是賦給idt[n]的后4字節。這8字節拼起來就是完整的idt[n].
4.5.2 idt數組
idt是中斷描述符表(其實是數組),一共有 256 個表項,一個表項占8字節。
%1對應第13行的(*((char *) (gate_addr)))
gate_addr就是第2行的&idt[n],那么idt是什么呢?在文件include\linux\head.h中有:
typedef struct desc_struct {unsigned long a,b; } desc_table[256];extern desc_table idt,gdt;1~3行:為struct desc_struct [256]取了一個別名——desc_table,也就是說desc_table的類型是“struct desc_struct類型的數組”。
第6行,注意extern關鍵字,聲明(而不是定義)了 idt 和 gdt,它們的類型都是desc_table,即“struct desc_struct類型的數組”。所以,&idt[n]是數組idt第n個元素的地址。
可能有人要問, idt 和 gdt的定義在哪里呢?
它們是在匯編代碼boot/head.s中定義的。
在本文件末尾有:
另外本文件開頭有
.globl idt,gdt,pg_dir,tmp_floppy_area.globl xxx表示把符號xxx聲明為全局變量/標號,以供其他源文件訪問。
4.5.3 _set_gate(gate_addr,type,dpl,addr)總結
#define _set_gate(gate_addr,type,dpl,addr) \ __asm__ ("movw %%dx,%%ax\n\t" \ //將偏移地址低字與選擇符組合成描述符低4字節(eax)"movw %0,%%dx\n\t" \ //將類型標志與偏移地址高字組合成描述符高4字節(edx)"movl %%eax,%1\n\t" \ //分別設置門描述符的低4字節和高4字節"movl %%edx,%2" \ : \: "i" ((short) (0x8000+(dpl<<13)+(type<<8))), \"o" (*((char *) (gate_addr))), \"o" (*(4+(char *) (gate_addr))), \"d" ((char *) (addr)),"a" (0x00080000))_set_gate(gate_addr,type,dpl,addr)此宏用于設置門描述符。
根據參數中的中斷或異常處理過程地址 addr 、門描述符類型 type 和特權級信息 dpl ,設置位于地址 gate_addr 處的門描述符。(注意:下面的“偏移”是相對于內核代碼或數據段來說的。)
gate_addr:描述符存儲地址;
type:描述符類型;
dpl:描述符特權級;
addr:偏移地址。
%0:由dpl,type組合成的類型值;
%1:描述符低 4 字節的存儲地址;
%2:描述符高 4 字節的存儲地址;
%3:edx(程序偏移地址addr);
%4: eax(高字中含有段選擇符0x8) 。
4.5.4 set_system_gate(n,addr)
#define set_system_gate(n,addr) \_set_gate(&idt[n],15,3,addr)這個宏和set_trap_gate(n,addr)的區別僅有一點:前者的dpl=3,后者的dpl=0;
分析到這里, trap_init函數的大意已經明了。
void trap_init(void) {int i;set_trap_gate(0,÷_error);set_trap_gate(1,&debug);set_trap_gate(2,&nmi);set_system_gate(3,&int3); /* int3-5 can be called from all */set_system_gate(4,&overflow);set_system_gate(5,&bounds);set_trap_gate(6,&invalid_op);set_trap_gate(7,&device_not_available);set_trap_gate(8,&double_fault);set_trap_gate(9,&coprocessor_segment_overrun);set_trap_gate(10,&invalid_TSS);set_trap_gate(11,&segment_not_present);set_trap_gate(12,&stack_segment);set_trap_gate(13,&general_protection);set_trap_gate(14,&page_fault);set_trap_gate(15,&reserved);set_trap_gate(16,&coprocessor_error);for (i=17;i<48;i++)set_trap_gate(i,&reserved);set_trap_gate(45,&irq13); // 設置協處理器中斷0x2d(=45)的陷阱門描述符outb_p(inb_p(0x21)&0xfb,0x21); // 允許8259A主芯片的IRQ2中斷請求outb(inb_p(0xA1)&0xdf,0xA1);set_trap_gate(39,¶llel_interrupt); //設置并行口1的中斷0x27(=39)陷阱門描述符 }5~2行:設置IDT的描述符。其中斷點陷阱中斷int3、溢出中斷overflow、邊界出錯中斷bounds可以由任何程序產生。
22~23行:把int 17 ~ int 48的陷阱門先設置為reserved,以后各個硬件初始化時會重新設置自己的陷阱門。
注意:set_trap_gate的第二個參數是中斷處理函數的入口點,它們的代碼在文件linux/kernel/asm.s或者linux/kernel/system_call.s中。
第25行:outb_p(inb_p(0x21)&0xfb,0x21);
0x21是 8259A 主片命令字OCW1的端口地址,用于對其中斷屏蔽寄存器 IMR 進行讀/寫操作。
inb_p(0x21)&0xfb讀出 IMR 的值,然后與0xfb(=1111_1011b),即清零D2位,也就是允許主片的 IRQ2 中斷請求。
注意:Linux-0.11 系統把主片的 ICW2 設置為 0x20,表示主片中斷請求0~7級對應的中斷號是 0x20~0x27;把從片的 ICW2 設置成 0x28,表示從片中斷請求8~15級對應的中斷號是 0x28~0x2f。
第26行:outb(inb_p(0xA1)&0xdf,0xA1);
0xA1是 8259A 從片命令字OCW1的端口地址。原理同上,inb_p(0xA1)&0xdf讀出從片 IMR 的值,然后與0xdf(=1101_1111),即清零D5位,由上圖可知,允許從片 IRQ13 協處理器中斷。
關于8259A的編程,可以參考我的博文: 詳解8259A
囿于篇幅,對main()函數的分析先到這里,剩下的內容下次再說。謝謝您的閱讀!
—【未完待續】—
參考資料
《Linux內核完全剖析》(趙炯,機械工業出版社,2006)
總結
以上是生活随笔為你收集整理的main函数解析(一)——Linux-0.11 学习笔记(五)的全部內容,希望文章能夠幫你解決所遇到的問題。