elf64
- ELF頭部結構定義為:
 
typedef struct {
??? unsigned char e_ident[EI_NIDENT];
??? Elf32_Half? e_type;
??? Elf32_Half? e_machine;
??? Elf32_Word? e_version;
??? Elf32_Addr? e_entry;
??? Elf32_Off?? e_phoff;
??? Elf32_Off?? e_shoff;
??? Elf32_Word? e_flags;
??? Elf32_Half? e_ehsize;
??? Elf32_Half? e_phentsize;
??? Elf32_Half? e_phnum;
??? Elf32_Half? e_shentsize;
??? Elf32_Half? e_shnum;
??? Elf32_Half? e_shstrndx;
} Elf32_Ehdr;
?
typedef struct elf64_hdr {內核
? unsigned char????????e_ident[EI_NIDENT];????????16字節/* ELF "magic number" */
? Elf64_Half e_type;
? Elf64_Half e_machine;
? Elf64_Word e_version;
? Elf64_Addr e_entry;????????????????/* Entry point virtual address */
? Elf64_Off e_phoff;????????????????/* Program header table file offset */
? Elf64_Off e_shoff;????????????????/* Section header table file offset */
? Elf64_Word e_flags;
? Elf64_Half e_ehsize;
? Elf64_Half e_phentsize;
? Elf64_Half e_phnum;
? Elf64_Half e_shentsize;
? Elf64_Half e_shnum;
? Elf64_Half e_shstrndx;
} Elf64_Ehdr;
?
?
?
?????????Section頭部結構定義為:
typedef struct {
??? Elf32_Word? sh_name;
??? Elf32_Word? sh_type;
??? Elf32_Word? sh_flags;
??? Elf32_Addr? sh_addr;
??? Elf32_Off?? sh_offset;
??? Elf32_Word? sh_size;
??? Elf32_Word? sh_link;
??? Elf32_Word? sh_info;
??? Elf32_Word? sh_addralign;
??? Elf32_Word? sh_entsize;
} Elf32_Shdr;
typedef struct {
??? Elf32_Addr r_offset;
??? Elf32_Word r_info;
} Elf32_Rel;
?
?
?
?
- ELF符號表Section .symtab的表項結構定義為:
 
typedef struct {
??? Elf32_Word st_name;
??? Elf32_Addr st_value;
??? Elf32_Word st_size;
??? unsigned char st_info;
??? unsigned char st_other;
??? Elf32_Half st_shndx;
} Elf32_sym;
BSS段:BSS段(bss segment)通常是指用來存放程序中未初始化的全局變量的一塊內存區域。
BSS是英文Block Started by Symbol的簡稱。BSS段屬于靜態內存分配。
?
bss段(未手動初始化的數據)并不給該段的數據分配空間,只是記錄數據所需空間的大小。
data(已手動初始化的數據)段則為數據分配空間,數據保存在目標文件中。
?
來自 <http://www.cppblog.com/prayer/archive/2009/08/17/93594.html>
在于思考
博客園首頁新隨筆訂閱 管理
隨筆 - 132? 文章 - 33? 評論 - 138
地址空間分布
?
最近看了本書,突然對于地址空間有些疑惑。在深入理解linux內核中把地址分為三類:邏輯地址(匯編語言中操作數地址或指令的地址,對于80x86的cup,邏輯地址是段+段內偏移地址)、線性地址(也叫虛擬地址)和物理地址。但在Stott Maxwell的《Linux Core Kernel Commentrary》中確是這樣分的:邏輯地址(也叫虛擬地址)、線性地址和物理地址。按照386 CPU總設計師 John Crowford的解釋,虛擬地址是保護模式下段和段內偏移量組成的地址,而邏輯地址就是代碼段內偏移量,或稱進程的邏輯地址。其實對于linux來說,這三種說法都沒錯,由于linux下并不主張將程序分段,而是主張分頁,所以即使是在80x86的體系結構下,段的基地址也是0。因此邏輯地址、線性地址、虛擬地址在linux中其實是相同的。所以對于linux下的elf可執行文件來說,代碼段的起始地址0x08048000既是邏輯地址,也是線性地址也是虛擬地址。
?
1 x86的物理地址空間布局:
?
?
?
?
?
物理地址空間的頂部以下一段空間,被PCI設備的I/O內存映射占據,它們的大小和布局由PCI規范所決定。640K~1M這段地址空間被BIOS和VGA適配器所占據。
?
Linux系統在初始化時,會根據實際的物理內存的大小,為每個物理頁面創建一個page對象,所有的page對象構成一個mem_map數組。
?
進一步,針對不同的用途,Linux內核將所有的物理頁面劃分到3類內存管理區中,如圖,分別為ZONE_DMA,ZONE_NORMAL,ZONE_HIGHMEM。
?
ZONE_DMA的范圍是0~16M,該區域的物理頁面專門供I/O設備的DMA使用。之所以需要單獨管理DMA的物理頁面,是因為DMA使用物理地址訪問內存,不經過MMU,并且需要連續的緩沖區,所以為了能夠提供物理上連續的緩沖區,必須從物理地址空間專門劃分一段區域用于DMA。
?
ZONE_NORMAL的范圍是16M~896M,該區域的物理頁面是內核能夠直接使用的。
?
ZONE_HIGHMEM的范圍是896M~結束,該區域即為高端內存,內核不能直接使用。
?
2 linux虛擬地址內核空間分布
?
?
?
在kernel image下面有16M的內核空間用于DMA操作。位于內核空間高端的128M地址主要由3部分組成,分別為vmalloc area,持久化內核映射區,臨時內核映射區。
?
由于ZONE_NORMAL和內核線性空間存在直接映射關系,所以內核會將頻繁使用的數據如kernel代碼、GDT、IDT、PGD、mem_map數組等放在ZONE_NORMAL里。而將用戶數據、頁表(PT)等不常用數據放在ZONE_ HIGHMEM里,只在要訪問這些數據時才建立映射關系(kmap())。比如,當內核要訪問I/O設備存儲空間時,就使用ioremap()將位于物理地址高端的mmio區內存映射到內核空間的vmalloc area中,在使用完之后便斷開映射關系。 上面描述默認都是32位的機器,對于64位的機器,PAGE_OFFSET為0x0xffff880000000000,用戶地址空間范圍:0x0000000000000000 - 0x00007fffffffffff,內核代碼地址空間:0xffffffff80000000 - 0xffffffffa0000000。
?
3 linux虛擬地址用戶空間分布
?
?
?
用戶進程的代碼區一般從虛擬地址空間的0x08048000開始,這是為了便于檢查空指針。代碼區之上便是數據區,未初始化數據區,堆區,棧區,以及參數、全局環境變量。
?
4 linux虛擬地址與物理地址映射的關系
?
?
Linux將4G的線性地址空間分為2部分,0~3G為user space,3G~4G為kernel space。
?
由于開啟了分頁機制,內核想要訪問物理地址空間的話,必須先建立映射關系,然后通過虛擬地址來訪問。為了能夠訪問所有的物理地址空間,就要將全部物理地址空間映射到1G的內核線性空間中,這顯然不可能。于是,內核將0~896M的物理地址空間一對一映射到自己的線性地址空間中,這樣它便可以隨時訪問ZONE_DMA和ZONE_NORMAL里的物理頁面;此時內核剩下的128M線性地址空間不足以完全映射所有的ZONE_HIGHMEM,Linux采取了動態映射的方法,即按需的將ZONE_HIGHMEM里的物理頁面映射到kernel space的最后128M線性地址空間里,使用完之后釋放映射關系,以供其它物理頁面映射。雖然這樣存在效率的問題,但是內核畢竟可以正常的訪問所有的物理地址空間了。
?
5 linux中可執行程序與虛擬地址空間的映射關系
?
虛擬內存區域(VMA,Virtual Memory Area)是Linux中進程虛擬地址空間中的一個段,在Windows里面叫虛擬段。當操作系統創建線程后,會在進程相應的數據結構中設置一個.text段的VMA,它在虛擬空間中的地址為0x08048000~0x08049000,它對應ELF文件中的偏移為0的.text。可以查看操作系統為運行的進程維護的信息:
?
?
?
?
?
從上面的圖可以看出,虛擬空間地址為0x08048000~0x08049000的VMA映射為elf文件中的一個段(segment),并且是按整頁進行映射的。
?
由于linux下的ELF可執行文件會有很多個段(section),所以如果把每個section都映射為一個VMA,那么沒有一個頁大小的段(section)也會被映射為一個頁的VMA,這樣就浪費了物理空間,由于不足會用0補充。故elf有一個裝載的段(segment),與前面的段(section)不同,前面的段(section)主要用于鏈接,而段(segment)主要用于裝載進內存。
?
?
?
?
?
可以看出段(segment)02包含了很多的段(section),那鏈接器怎樣將段(section)合并到一個段(segment)中的呢?可以通過段(section)的權限來合并,如以代碼段為代表的權限為可讀可執行權限;以數據段和BSS段為代表的權限為可讀可寫的段;以只讀數據為代表的權限為只讀權限。
?
ELF與Linux進程虛擬空間映射關系如下圖所示:
?
?
?
?
?
即使把多個段(section)合并到幾個段(segment),每個段(segment)還是又很能產生較大的頁內碎片,怎樣解決這個問題呢?Unix巧妙的通過各個段(segment)接壤部分共享一個物理頁來解決這個問題。
?
參考:http://www.cnblogs.com/zszmhd/archive/2012/08/29/2661461.html、深入理解linux內核、Linux Core Kernel Commentrary、程序員的自我修養。
?
分類: linux內核
總結
                            
                        - 上一篇: html文件无法找到,html文件无法打
 - 下一篇: 一行行的代码解密马尔可夫链