當(dāng)前位置：首頁 > 运维知识 > linux >内容正文

linux

Linux C 语言内联汇编

發(fā)布時(shí)間：2023/12/31 linux 24 豆豆

生活随笔收集整理的這篇文章主要介紹了 Linux C 语言内联汇编小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

Linux C 語言內(nèi)聯(lián)匯編

Linux 匯編語法格式

絕大多數(shù) Linux 程序員以前只接觸過 DOS/Windows 下的匯編語言,這些匯編代碼都是 Intel 風(fēng)格（即386 匯編語言）的。但在 Unix 和 Linux 系統(tǒng)中,更多采用的還是 AT&T 格式,兩者在語法格式上有著很大的不同:

1. 前綴——寄存器名/立即操作數(shù)

在 Intel 匯編的語法中，寄存器和和立即數(shù)都沒有前綴。
在 AT&T 匯編格式中,寄存器名要加上'%'作為前綴;立即操作數(shù)要加上 '$'前綴；

AT&T 格式Intel 格式

movl %eax $1

mov eax 1

2. 后綴——十六進(jìn)制/二進(jìn)制

在 Intel 的語法中，十六進(jìn)制和二進(jìn)制立即數(shù)后綴分別冠以“h”和“b”，而在 AT&T 中，十六進(jìn)制立即數(shù)前冠以“0x”；

AT&T 格式Intel 格式

int $0x80

int 80h

3. 源操作數(shù)和目標(biāo)操作數(shù)的位置

AT&T 和 Intel 格式中的源操作數(shù)和目標(biāo)操作數(shù)的位置正好相反。在 Intel 匯編格式中,目標(biāo)操作數(shù)在源操作數(shù)的左邊;而在 AT&T 匯編格式中,目標(biāo)操作數(shù)在源操作數(shù)的右邊。

AT&T 格式Intel 格式

addl $1, %eax

add eax, 1

4. 操作數(shù)的字長修飾符

在 AT&T 匯編格式中,操作數(shù)的字長由操作符的最后一個(gè)字母決定,后綴'b'、'w'、'l'分別表示操作數(shù)為字節(jié)(byte,8 bits)、字(word,16 bits)和長字(long,32 bits);而在 Intel 匯編格式中,操作數(shù)的字長是用 "byte ptr" 和 "word ptr"等前綴來表示的。

AT&T 格式Intel 格式

movb %bl,%al	mov al,bl
movw %bx,%ax	mov ax,bx
movl %ebx,%eax	mov eax,ebx
movl (%ebx),%eax	mov eax, dword ptr [ebx]

5. 跳轉(zhuǎn)指令

在 AT&T 匯編格式中,絕對轉(zhuǎn)移和調(diào)用指令(jump/call)的操作數(shù)前要加上'$'作為前綴,而在 Intel 格式中則不需要。遠(yuǎn)程轉(zhuǎn)移指令和遠(yuǎn)程子調(diào)用指令的操作碼,在 AT&T 匯編格式中為 "ljump" 和 "lcall",而在 Intel 匯編格式中則為"jmp far" 和"call far".

AT&T 格式Intel 格式

ljump section,offset	jmp far section:offset
lcall section,offset	call far section:offset

6. 與跳轉(zhuǎn)指令相應(yīng)的遠(yuǎn)程返回指令

AT&T 格式Intel 格式

lret $stack_adjust

ret far stack_adjust

7. 內(nèi)存操作數(shù)

內(nèi)存操作數(shù)也有所不同。在 Intel 的語法中，基寄存器用“［］”括起來，而在 AT&T 中，用“（）”括起來。

AT&T 格式Intel 格式

movl 5(%ebx),%eax	mov eax,[ebx+5]
disp(base, index, scale)	[base + index*scale + disp]

由于 Linux 工作在保護(hù)模式下,用的是 32 位線性地址,所以在計(jì)算地址時(shí)不用考慮段基址和偏移量,而是采用如下的地址計(jì)算方法:
disp + base + index * scale

8. 間接尋址方式

與 Intel 的語法比較，AT&T 間接尋址方式可能更晦澀難懂一些。Intel 的指令格式是segreg:[base+index*scale+disp]，而 AT&T 的格式是%segreg:disp(base,index,scale)。其中index/scale/disp/segreg全部是可選的，完全可以簡化掉。如果沒有指定 scale 而指定了index，則 scale 的缺省值為 1。segreg 段寄存器依賴于指令以及應(yīng)用程序是運(yùn)行在實(shí)模式還是保護(hù)模式下，在實(shí)模式下，它依賴于指令，而在保護(hù)模式下，segreg 是多余的。在AT&T 中，當(dāng)立即數(shù)用在 scale/disp 中時(shí)，不應(yīng)當(dāng)在其前冠以“$”前綴。

AT&T 格式Intel 格式

disp(base, index, scale)	[base + index*scale + disp]
mov eax,[ebx+20h]	movl0x20(%ebx),%eax
add eax,[ebx+ecx*2h	addl (%ebx,%ecx,0x2),%eax
lea eax,[ebx+ecx]	leal (%ebx,%ecx),%eax
sub eax,[ebx+ecx*4h-20h]	subl -0x20(%ebx,%ecx,0x4),%eax

9. 一些內(nèi)存操作數(shù)的例子

AT&T 格式Intel 格式

movl -4(%ebp), %eax	mov eax, [ebp - 4]
movl array(, %eax, 4), %eax	mov eax, [eax*4 + array]
movw array(%ebx, %eax, 4), %cx	mov cx, [ebx + 4*eax + array]
movb $4, %fs:(%eax)	mov fs:eax, 4

AT&T 匯編語言的相關(guān)知識

在 Linux 源代碼中，以.S 為擴(kuò)展名的文件是“純”匯編語言的文件。這里，我們結(jié)合具體的例子再介紹一些 AT&T 匯編語言的相關(guān)知識。

1. AT&T 中的Section段

在 AT&T 的語法中，一個(gè)段由.section 關(guān)鍵詞來標(biāo)識，當(dāng)你編寫匯編語言程序時(shí)，至少需要有以下三種段：

.section .data：這種段包含程序已初始化的數(shù)據(jù)，也就是說，包含具有初值的那些變量，例如：

hello : .string "Hello world!\n"hello_len : .long 13

.section .bss：這個(gè)段包含程序還未初始化的數(shù)據(jù)，也就是說，包含沒有初值的那些變量。當(dāng)操作系統(tǒng)裝入這個(gè)程序時(shí)將把這些變量都置為 0，例如：

name : .fill 30 # 用來請求用戶輸入名字name_len : .long 0 # 名字的長度 (尚未定義)

當(dāng)這個(gè)程序被裝入時(shí)，name 和 name_len 都被置為 0。如果你在.bss 節(jié)不小心給一個(gè)變量賦了初值，這個(gè)值也會丟失，并且變量的值仍為 0。

使用.bss 比使用.data 的優(yōu)勢在于，.bss 段不占用磁盤的空間。在磁盤上，一個(gè)長整數(shù)就足以存放.bss 段。當(dāng)程序被裝入到內(nèi)存時(shí)，操作系統(tǒng)也只分配給這個(gè)段 4 個(gè)字段的內(nèi)存大小。

注意：編譯程序把.data 和.bss 在 4 字節(jié)上對齊（align），例如，.data 總共有 34 字節(jié)，那么編譯程序把它對其在 36 字節(jié)上，也就是說，實(shí)際給它 36 字節(jié)的空間。

.section .text ：這個(gè)段包含程序的代碼，它是只讀段，而.data 和.bss 是讀／寫節(jié)。

2．匯編程序指令（Assembler Directive）

上面介紹的.section 就是匯編程序指令的一種，GNU 匯編程序提供了很多這樣的指令（directiv），這種指令都是以句點(diǎn)（.）為開頭，后跟指令名（小寫字母），在此，我們只介紹在內(nèi)核源代碼中出現(xiàn)的幾個(gè)指令（以 arch/i386/kernel/head.S 中的代碼為例）。

(1) .ascii “string”…

.ascii 表示零個(gè)或多個(gè)（用逗號隔開）字符串，并把每個(gè)字符串（結(jié)尾不自動加“0“字節(jié)）中的字符放在連續(xù)的地址單元。還有一個(gè)與.ascii 類似的.asciz，z 代表“0“，即每個(gè)字符串結(jié)尾自動加一個(gè)”\0“，例如：

int_msg:.asciz "Unknown interrupt\n"

(2) .byte 表達(dá)式

.byte 表示零或多個(gè)表達(dá)式（用逗號隔開），每個(gè)表達(dá)式被放在下一個(gè)字節(jié)單元。

(3) .fill 表達(dá)式

形式：.fill repeat , size , value
其中，repeat、size 和 value 都是常量表達(dá)式。

Fill 的含義是反復(fù)拷貝 size 個(gè)字節(jié)。
Repeat 可以大于等于 0。size 也可以大于等于 0，但不能超過 8，如果超過 8，也只取 8。把repeat 個(gè)字節(jié)以 8 個(gè)為一組，每組的最高 4 個(gè)字節(jié)內(nèi)容為 0，最低 4 字節(jié)內(nèi)容置為 value。 Size 和 value 為可選項(xiàng)。如果第二個(gè)逗號和 value 值不存在，則假定 value 為 0。如果第一個(gè)逗號和 size 不存在，則假定 size 為 1。

例如，在 Linux 初始化的過程中，對全局描述符表 GDT 進(jìn)行設(shè)置的最后一句為：

.fill NR_CPUS*4, 8, 0 /* space for TSS's and LDT's */

因?yàn)槊總€(gè)描述符正好占 8 個(gè)字節(jié)，因此，.fill 給每個(gè) CPU 留有存放 4 個(gè)描述符的位置。

(4) .globl symbol

.globl 使得連接程序（ld）能夠看到 symbl。如果你的局部程序中定義了 symbl，那么，與這個(gè)局部程序連接的其他局部程序也能存取 symbl，例如：

.globl SYMBOL_NAME(idt).globl SYMBOL_NAME(gdt)

定義 idt 和 gdt 為全局符號。

(5) .quad bignums

.quad 表示零個(gè)或多個(gè) bignums（用逗號分隔），對于每個(gè) bignum，其缺省值是 8 字節(jié)整數(shù)。如果 bignum 超過 8 字節(jié)，則打印一個(gè)警告信息；并只取 bignum 最低 8 字節(jié)。

例如，對全局描述符表的填充就用到這個(gè)指令：

.quad 0x00cf9a000000ffff /* 0x10 kernel 4GB code at 0x00000000 */ .quad 0x00cf92000000ffff /* 0x18 kernel 4GB data at 0x00000000 */ .quad 0x00cffa000000ffff /* 0x23 user 4GB code at 0x00000000 */ .quad 0x00cff2000000ffff /* 0x2b user 4GB data at 0x00000000 */

(6) .rept count

把.rept 指令與.endr 指令之間的行重復(fù) count 次，例如

.rept 3 .long 0.endr # 相當(dāng)于.long 0.long 0.long 0

(7) .space size , fill

這個(gè)指令保留 size 個(gè)字節(jié)的空間，每個(gè)字節(jié)的值為 fill。size 和 fill 都是常量表達(dá)式。
如果逗號和 fill 被省略，則假定 fill 為 0，例如在 arch/i386/bootl/setup.S 中有一句：

.space 1024

表示保留 1024 字節(jié)的空間，并且每個(gè)字節(jié)的值為 0。

(8) .word expressions

這個(gè)表達(dá)式表示任意一節(jié)中的一個(gè)或多個(gè)表達(dá)式（用逗號分開），表達(dá)式的值占兩個(gè)字節(jié)，例如：

gdt_descr:.word GDT_ENTRIES*8-1

表示變量 gdt_descr 的置為 GDT_ENTRIES*8-1

(9) .long expressions

這與.word 類似

(10) .org new-lc , fill

把當(dāng)前段的位置計(jì)數(shù)器提前到 new-lc（new location counter）。new-lc 或者是一個(gè)常量表達(dá)式，或者是一個(gè)與當(dāng)前子段處于同一段的表達(dá)式。也就是說，你不能用.org 橫跨段：如果 new-lc 是個(gè)錯(cuò)誤的值，則.org 被忽略。.org 只能增加位置計(jì)數(shù)器的值，或者讓其保持不變；但絕不能用.org 來讓位置計(jì)數(shù)器倒退。
注意，位置計(jì)數(shù)器的起始值是相對于一個(gè)段的開始的，而不是子段的開始。當(dāng)位置計(jì)數(shù)器被提升后，中間位置的字節(jié)被填充值 fill（這也是一個(gè)常量表達(dá)式）。如果逗號和fill 都省略，則 fill 的缺省值為 0。例如：

.org 0x2000ENTRY(pg0)

表示把位置計(jì)數(shù)器置為 0x2000，這個(gè)位置存放的就是臨時(shí)頁表 pg0。

Hello World

真不知道打破這個(gè)傳統(tǒng)會帶來什么樣的后果,但既然所有程序設(shè)計(jì)語言的第一個(gè)例子都是在屏幕上打印一個(gè)字符串 “Hello World!”,那我們也以這種方式來開始介紹 Linux 下的匯編語言程序設(shè)計(jì)。

在 Linux 操作系統(tǒng)中,你有很多辦法可以實(shí)現(xiàn)在屏幕上顯示一個(gè)字符串,但最簡潔的方式是使用 Linux 內(nèi)核提供的系統(tǒng)調(diào)用。使用這種方法最大的好處是可以直接和操作系統(tǒng)的內(nèi)核進(jìn)行通訊,不需要鏈接諸如 libc 這樣的函數(shù)庫,也不需要使用 ELF 解釋器,因而代碼尺寸小且執(zhí)行速度快。

Linux 是一個(gè)運(yùn)行在保護(hù)模式下的 32 位操作系統(tǒng),采用flat memory模式,目前最常用到的是 ELF 格式的二進(jìn)制代碼。一個(gè) ELF 格式的可執(zhí)行程序通常劃分為如下幾個(gè)部分:.text、.data 和 .bss,其中 .text 是只讀的代碼區(qū),.data 是可讀可寫的數(shù)據(jù)區(qū),而 .bss 則是可讀可寫且沒有初始化的數(shù)據(jù)區(qū)。代碼區(qū)和數(shù)據(jù)區(qū)在 ELF 中統(tǒng)稱為 section,根據(jù)實(shí)際需要你可以使用其它標(biāo)準(zhǔn)的 section,也可以添加自定義 section,但一個(gè) ELF 可執(zhí)行程序至少應(yīng)該有一個(gè) .text 部分。

下面給出我們的第一個(gè)匯編程序,用的是 AT&T 匯編語言格式.

例 1. hello word —— AT&T 格式

# hello.s# 數(shù)據(jù)段聲明 .datamsg : .string "Hello, world!\n" # 要輸出的字符串# 字串長度len = . - msg# 代碼段聲明 .text# 指定入口函數(shù).global _start# 在屏幕上顯示一個(gè)字符串 _start:movl $len, %edx # 參數(shù)三:字符串長度movl $msg, %ecx # 參數(shù)二:要顯示的字符串movl $1, %ebx # 參數(shù)一:文件描述符(stdout)movl $4, %eax # 系統(tǒng)調(diào)用號(sys_write)int $0x80 # 調(diào)用內(nèi)核功能# 退出程序movl $0,%ebx # 參數(shù)一:退出代碼movl $1,%eax # 系統(tǒng)調(diào)用號(sys_exit)int $0x80 # 調(diào)用內(nèi)核功能

初次接觸到 AT&T 格式的匯編代碼時(shí),很多程序員都認(rèn)為太晦澀難懂了,沒有關(guān)系,在 Linux 平臺上你同樣可以使用 Intel 格式來編寫匯編程序:

例 2. hello word —— Intel 格式

; hello.asm ; 數(shù)據(jù)段聲明 section .data ; 要輸出的字符串msg db "Hello, world!", 0xA ; 字串長度len equ $ - msgsection .text ; 代碼段聲明global _start ; 指定入口函數(shù)_start:; 在屏幕上顯示一個(gè)字符串mov edx, len ; 參數(shù)三:字符串長度mov ecx, msg ; 參數(shù)二:要顯示的字符串mov ebx, 1 ; 參數(shù)一:文件描述符(stdout)mov eax, 4 ; 系統(tǒng)調(diào)用號(sys_write)int 0x80 ; 調(diào)用內(nèi)核功能; 退出程序mov ebx, 0 ; 參數(shù)一:退出代碼mov eax, 1 ; 系統(tǒng)調(diào)用號(sys_exit)int 0x80 ; 調(diào)用內(nèi)核功能

上面兩個(gè)匯編程序采用的語法雖然完全不同,但功能卻都是調(diào)用 Linux 內(nèi)核提供的 sys_write 來顯示一個(gè)字符串,然后再調(diào)用 sys_exit退出程序。在 Linux 內(nèi)核源文件include/asm-i386/unistd.h中,可以找到所有系統(tǒng)調(diào)用的定義。

Linux 匯編工具

Linux 平臺下的匯編工具雖然種類很多,但同 DOS/Windows 一樣,最基本的仍然是匯編器、連接器和調(diào)試器。

1. 匯編器

匯編器(assembler)的作用是將用匯編語言編寫的源程序轉(zhuǎn)換成二進(jìn)制形式的目標(biāo)代碼。Linux 平臺的標(biāo)準(zhǔn)匯編器是GAS,它是 GCC所依賴的后臺匯編工具,通常包含在 binutils 軟件包中。GAS 使用標(biāo)準(zhǔn)的 AT&T 匯編語法,可以用來匯編用 AT&T 格式編寫的程序:

$ as -o hello.o hello.s

Linux 平臺上另一個(gè)經(jīng)常用到的匯編器是NASM,它提供了很好的宏指令功能,并能夠支持相當(dāng)多的目標(biāo)代碼格式,包括 bin、a.out、coff、elf、rdf等。NASM 采用的是人工編寫的語法分析器,因而執(zhí)行速度要比 GAS 快很多,更重要的是它使用的是 Intel 匯編語法,可以用來編譯用 Intel 語法格式編寫的匯編程序:

$ nasm -f elf hello.asm

2.鏈接器

由匯編器產(chǎn)生的目標(biāo)代碼是不能直接在計(jì)算機(jī)上運(yùn)行的,它必須經(jīng)過鏈接器的處理才能生成可執(zhí)行代碼。鏈接器通常用來將多個(gè)目標(biāo)代碼連接成一個(gè)可執(zhí)行代碼,這樣可以先將整個(gè)程序分成幾個(gè)模塊來單獨(dú)開發(fā),然后才將它們組合(鏈接)成一個(gè)應(yīng)用程序。 Linux 使用 ld作為標(biāo)準(zhǔn)的鏈接程序,它同樣也包含在 binutils 軟件包中。匯編程序在成功通過GAS 或 NASM的編譯并生成目標(biāo)代碼后,就可以使
用 ld 將其鏈接成可執(zhí)行程序了:

$ ld -s -o hello hello.o

3.調(diào)試器

有人說程序不是編出來而是調(diào)出來的,足見調(diào)試在軟件開發(fā)中的重要作用,在用匯編語言編寫程序時(shí)尤其如此。Linux 下調(diào)試匯編代碼既可以用 GDB、DDD 這類通用的調(diào)試器,也可以使用專門用來調(diào)試匯編代碼的 ALD(Assembly Language Debugger)。

從調(diào)試的角度來看,使用 GAS 的好處是可以在生成的目標(biāo)代碼中包含符號表(symbol table),這樣就可以使用 GDB 和 DDD 來進(jìn)行源碼級的調(diào)試了。要在生成的可執(zhí)行程序中包含符號表,可以采用下面的方式進(jìn)行編譯和鏈接:

$ as --gstabs -o hello.o hello.s $ ld -o hello hello.o

執(zhí)行 as 命令時(shí)帶上參數(shù)--gstabs可以告訴匯編器在生成的目標(biāo)代碼中加上符號表,同時(shí)需要注意的是,在用 ld 命令進(jìn)行鏈接時(shí)不要加上 -s 參數(shù),否則目標(biāo)代碼中的符號表在鏈接時(shí)將被刪去。

在 GDB 和 DDD 中調(diào)試匯編代碼和調(diào)試 C 語言代碼是一樣的,你可以通過設(shè)置斷點(diǎn)來中斷程序的運(yùn)行,查看變量和寄存器的當(dāng)前值,并可以對代碼進(jìn)行單步跟蹤。

系統(tǒng)調(diào)用

即便是最簡單的匯編程序,也難免要用到諸如輸入、輸出以及退出等操作,而要進(jìn)行這些操作則需要調(diào)用操作系統(tǒng)所提供的服務(wù),也就是系統(tǒng)調(diào)用。除非你的程序只完成加減乘除等數(shù)學(xué)運(yùn)算,否則將很難避免使用系統(tǒng)調(diào)用,事實(shí)上除了系統(tǒng)調(diào)用不同之外,各種操作系統(tǒng)的匯編編程往往都是很類似的。

在 Linux 平臺下有兩種方式來使用系統(tǒng)調(diào)用:利用封裝后的 C 庫(libc)或者通過匯編直接調(diào)用。其中通過匯編語言來直接調(diào)用系統(tǒng)調(diào)用,是最高效地使用 Linux 內(nèi)核服務(wù)的方法,因?yàn)樽罱K生成的程序不需要與任何庫進(jìn)行鏈接,而是直接和內(nèi)核通信。

和 DOS 一樣,Linux 下的系統(tǒng)調(diào)用也是通過中斷(int 0x80)來實(shí)現(xiàn)的。在執(zhí)行 int 80 指令時(shí),寄存器eax中存放的是系統(tǒng)調(diào)用的功能號,而傳給系統(tǒng)調(diào)用的參數(shù)則必須按順序放到寄存器 ebx,ecx,edx,esi,edi中,當(dāng)系統(tǒng)調(diào)用完成之后,返回值可以在寄存器eax中獲得。

所有的系統(tǒng)調(diào)用功能號都可以在文件 /usr/include/bits/syscall.h 中找到,為了便于使用,它們是用SYS_<name>這樣的宏來定義的,如 SYS_write、SYS_exit 等。例如,經(jīng)常用到的 write 函數(shù)是如下定義的:

ssize_t write(int fd, const void *buf, size_t count);

該函數(shù)的功能最終是通過 SYS_write 這一系統(tǒng)調(diào)用來實(shí)現(xiàn)的。根據(jù)上面的約定,參數(shù) fd、buf 和 count分別存在寄存器 ebx、ecx 和edx 中,而系統(tǒng)調(diào)用號 SYS_write 則放在寄存器eax中,當(dāng)int 0x80指令執(zhí)行完畢后,返回值可以從寄存器eax中獲得。

或許你已經(jīng)發(fā)現(xiàn),在進(jìn)行系統(tǒng)調(diào)用時(shí)至多只有 5 個(gè)寄存器能夠用來保存參數(shù),難道所有系統(tǒng)調(diào)用的參數(shù)個(gè)數(shù)都不超過 5 嗎?當(dāng)然不是,例如 mmap 函數(shù)就有 6 個(gè)參數(shù),這些參數(shù)最后都需要傳遞給系統(tǒng)調(diào)用 SYS_mmap:

void * mmap(void *start, size_t length, int prot , int flags, int fd, off_t offset);

當(dāng)一個(gè)系統(tǒng)調(diào)用所需的參數(shù)個(gè)數(shù)大于 5 時(shí),執(zhí)行 int 0x80 指令時(shí)仍需將系統(tǒng)調(diào)用功能號保存在寄存器 eax 中,所不同的只是全部參數(shù)應(yīng)該依次放在一塊連續(xù)的內(nèi)存區(qū)域里,同時(shí)在寄存器ebx 中保存指向該內(nèi)存區(qū)域的指針。系統(tǒng)調(diào)用完成之后,返回值仍將保存在寄存器eax 中。

由于只是需要一塊連續(xù)的內(nèi)存區(qū)域來保存系統(tǒng)調(diào)用的參數(shù),因此完全可以像普通的函數(shù)調(diào)用一樣使用棧(stack)來傳遞系統(tǒng)調(diào)用所需的參數(shù)。但要注意一點(diǎn),Linux 采用的是 C 語言的調(diào)用模式,這就意味著所有參數(shù)必須以相反的順序進(jìn)棧,即最后一個(gè)參數(shù)先入棧,而第一個(gè)參數(shù)則最后入棧。如果采用棧來傳遞系統(tǒng)調(diào)用所需的參數(shù),在執(zhí)行 int 0x80 指令時(shí)還應(yīng)該將棧指針的當(dāng)前值復(fù)制到寄存器 ebx 中。

處理命令行參數(shù)

在 Linux 操作系統(tǒng)中,當(dāng)一個(gè)可執(zhí)行程序通過命令行啟動時(shí),其所需的參數(shù)將被保存到棧中:首先是argc,然后是指向各個(gè)命令行參數(shù)的指針數(shù)組 argv,最后是指向環(huán)境變量的指針數(shù)據(jù) envp。

在編寫匯編語言程序時(shí),很多時(shí)候需要對這些參數(shù)進(jìn)行處理,下面的代碼示范了如何在匯編代碼中進(jìn)行命令行參數(shù)的處理:

例 1. 處理命令行參數(shù)

# args.s .text.globl _start_start:popl %ecx # argcpopl %ecx # argvtest %ecx, %ecx vnext:# 空指針表明結(jié)束jz exitmovl %ecx, %ebxxorl %edx, %edxstrlen:movb (%ebx), %al inc %edx inc %ebx test %al, %al jnz strlen movb $10, -1(%ebx) movl $4, %eax # 系統(tǒng)調(diào)用號(sys_write)movl $1, %ebx # 文件描述符(stdout)int $0x80 jmp vnext movl $1,%eax xorl %ebx, %ebx int $0x80 exit:# 系統(tǒng)調(diào)用號(sys_exit)# 退出代碼ret

GCC 內(nèi)聯(lián)匯編

用匯編編寫的程序雖然運(yùn)行速度快,但開發(fā)速度非常慢,效率也很低。如果只是想對關(guān)鍵代碼段進(jìn)行優(yōu)化,或許更好的辦法是將匯編指令嵌入到 C 語言程序中,從而充分利用高級語言和匯編語言各自的特點(diǎn)。但一般來講,在 C 代碼中嵌入?yún)R編語句要比"純粹"的匯編語言代碼復(fù)雜得多,因?yàn)樾枰鉀Q如何分配寄存器,以及如何與 C 代碼中的變量相結(jié)合等問題。GCC 提供了很好的內(nèi)聯(lián)匯編支持,最基本的格式是:

__asm__("asm statements");

例如:
asm(“nop”);

如果需要同時(shí)執(zhí)行多條匯編語句,則應(yīng)該用”\n\t”將各個(gè)語句分隔開,例如:
asm( “pushl %%eax \n\t”
“movl $0, %%eax \n\t”
“popl %eax”);

通常嵌入到 C 代碼中的匯編語句很難做到與其它部分沒有任何關(guān)系,因此更多時(shí)候需要用到完整的內(nèi)聯(lián)匯編格式:

__asm__("asm statements" : outputs : inputs : registers-modified);

插入到 C 代碼中的匯編語句是以”:”分隔的四個(gè)部分,其中第一部分就是匯編代碼本身,通常稱為指令部,其格式和在匯編語言中使用的格式基本相同。指令部分是必須的,而其它部分則可以根據(jù)實(shí)際情況而省略。

在將匯編語句嵌入到 C 代碼中時(shí),操作數(shù)如何與 C 代碼中的變量相結(jié)合是個(gè)很大的問題。GCC 采用如下方法來解決這個(gè)問題:程序員提供具體的指令,而對寄存器的使用則只需給出”樣板”和約束條件就可以了,具體如何將寄存器與變量結(jié)合起來完全由 GCC 和 GAS 來負(fù)責(zé)。

在 GCC 內(nèi)聯(lián)匯編語句的指令部中,加上前綴'%'的數(shù)字(如%0,%1)表示的就是需要使用寄存器的”樣板”操作數(shù)。指令部中使用了幾個(gè)樣板操作數(shù),就表明有幾個(gè)變量需要與寄存器相結(jié)合,這樣 GCC 和 GAS 在編譯和匯編時(shí)會根據(jù)后面給定的約束條件進(jìn)行恰當(dāng)?shù)奶幚怼?/p>

由于樣板操作數(shù)也使用’%’作為前綴,因此在涉及到具體的寄存器時(shí),寄存器名前面應(yīng)該加上兩個(gè)'%',以免產(chǎn)生混淆。

緊跟在指令部后面的是輸出部(輸出部的意思是變量的值會被改變，即可以作為左值)是規(guī)定輸出變量如何與樣板操作數(shù)進(jìn)行結(jié)合的條件,每個(gè)條件稱為一個(gè)”約束”,必要時(shí)可以包含多個(gè)約束,相互之間用逗號分隔開就可以了。每個(gè)輸出約束都以'='號開始,然后緊跟一個(gè)對操作數(shù)類型進(jìn)行說明的字后,最后是如何與變量相結(jié)合的約束。凡是與輸出部中說明的操作數(shù)相結(jié)合的寄存器或操作數(shù)本身,在執(zhí)行完嵌入的匯編代碼后均不保留執(zhí)行之前的內(nèi)容,這是 GCC在調(diào)度寄存器時(shí)所使用的依據(jù)。

輸出部后面是輸入部,輸入約束的格式和輸出約束相似,但不帶'='號。如果一個(gè)輸入約束要求使用寄存器,則 GCC 在預(yù)處理時(shí)就會為之分配一個(gè)寄存器,并插入必要的指令將操作數(shù)裝入該寄存器。與輸入部中說明的操作數(shù)結(jié)合的寄存器或操作數(shù)本身,在執(zhí)行完嵌入的匯編代碼后也不保留執(zhí)行之前的內(nèi)容。

有時(shí)在進(jìn)行某些操作時(shí),除了要用到進(jìn)行數(shù)據(jù)輸入和輸出的寄存器外,還要使用多個(gè)寄存器來保存中間計(jì)算結(jié)果,這樣就難免會破壞原有寄存器的內(nèi)容。

在 GCC 內(nèi)聯(lián)匯編格式中的最后一個(gè)部分中,可以對將產(chǎn)生副作用的寄存器進(jìn)行說明,以便 GCC 能夠采用相應(yīng)的措施。內(nèi)聯(lián)匯編語句的最后一個(gè)部分告訴 GCC 它將改變該寄存器中的值,GCC 在處理時(shí)不應(yīng)使用該寄存器來存儲任何其它的值。

下面是一個(gè)內(nèi)聯(lián)匯編的簡單例子:

例1: 內(nèi)聯(lián)匯編

#include <stdio.h>/* inline.c */ int main() {int a = 10, b = 0;__asm__ __volatile__("movl %1, %%eax; \n\t""movl %%eax, %0 \n\t;":"=r"(b) /* 輸出 */ :"r"(a) /* 輸入 */:"%eax"); /* 不受影響的寄存器 */printf("Result: %d, %d\n", a, b); }

上面的程序完成將變量 a 的值賦予變量 b,有幾點(diǎn)需要說明:
- 變量 b 是輸出操作數(shù),通過%0 來引用,而變量 a 是輸入操作數(shù),通過%1 來引用。
- 輸入操作數(shù)和輸出操作數(shù)都使用 r 進(jìn)行約束,表示將變量 a 和變量 b 存儲在寄存器中。輸入約束和輸出約束的不同點(diǎn)在于輸出約束多一個(gè)約束修飾符’=’。
- 在內(nèi)聯(lián)匯編語句中使用寄存器 eax 時(shí),寄存器名前應(yīng)該加兩個(gè)’%’,即%%eax。內(nèi)聯(lián)匯編中使用%0、%1 等來標(biāo)識變量,任何只帶一個(gè)’%’的標(biāo)識符都看成是操作數(shù),而不是寄存器。
- 內(nèi)聯(lián)匯編語句的最后一個(gè)部分告訴 GCC 它將改變寄存器 eax 中的值,GCC 在處理時(shí)不應(yīng)使用該寄存器來存儲任何其它的值。
- 由于變量 b 被指定成輸出操作數(shù),當(dāng)內(nèi)聯(lián)匯編語句執(zhí)行完畢后,它所保存的值將被更新。

在內(nèi)聯(lián)匯編中用到的操作數(shù)從輸出部的第一個(gè)約束開始編號,序號從 0 開始,每個(gè)約束記數(shù)一次,指令部要引用這些操作數(shù)時(shí),只需在序號前加上’%’作為前綴就可以了。需要注意的是,內(nèi)聯(lián)匯編語句的指令部在引用一個(gè)操作數(shù)時(shí)總是將其作為 32 位的長字使用,但實(shí)際情況可能需要的是字或字節(jié),因此應(yīng)該在約束中指明正確的限定符:

限定符意義

“m”、”v”、”o”	內(nèi)存單元
“r”	任何寄存器
“q”	寄存器 eax、ebx、ecx、edx 之一
“i”、”h”	直接操作數(shù)
“E”和”F”	浮點(diǎn)數(shù)
“g”	任意
“a”、”b”、”c”、”d”	分別表示寄存器 eax、ebx、ecx 和 edx
“S”和”D”	寄存器 esi、edi
“I”	常數(shù)(0 至 31)

例2: 輸出/輸入部分

在輸入部分定義的變量，是不可以被改變的，即不能放在等號的左邊，有點(diǎn)const變量的意思；
而在輸出部分定義的變量，是要放在等號的左邊的；

/* inline.c */ int main() {int a = 10, b = 0, c = 12;__asm__ __volatile__("movl %1, %%eax; \n\t" /* b += c;*/"movl %2, %0; \n\t" /* b = c */"addl %2, %0; \n\t" /* b += c; */"movl %0, %2; \n\t" /* error: c = b */:"=r"(b) /* 輸出 */ :"r"(a), "r"(c)/* 輸入 */:"%eax"); /* 不受影響的寄存器 */printf("Result: %d, %d, %d\n", a, b, c); }

例3: 預(yù)留不受計(jì)算影響的寄存器

在 GCC 內(nèi)聯(lián)匯編格式中的最后一個(gè)部分中,可以對將產(chǎn)生副作用的寄存器進(jìn)行說明,以便 GCC 能夠采用相應(yīng)的措施。內(nèi)聯(lián)匯編語句的最后一個(gè)部分告訴GCC用戶程序?qū)@式地改變該寄存器中的值,GCC 在處理時(shí)不應(yīng)使用該寄存器來存儲任何其它的值。

/* inline.c */ int main() {int a = 10, b = 0, c = 12;__asm__ __volatile__("movl %1, %%eax; \n\t" /* b += c;*/"movl %2, %0; \n\t" /*b = c*/"addl %2, %0; \n\t" /* b += c;*/"addl %%eax, %0; \n\t" /* b += c;*/:"=r"(b) /* 輸出 */ :"r"(a), "r"(c)/* 輸入 */:"%eax"); /* 不受影響的寄存器 */printf("Result: %d, %d, %d\n", a, b, c); }

例4: 復(fù)雜應(yīng)用

在 Linux 內(nèi)核代碼中，有關(guān)字符串操作的函數(shù)都是通過嵌入式匯編完成的，因?yàn)閮?nèi)核及用戶程序?qū)ψ址瘮?shù)的調(diào)用非常頻繁，因此，用匯編代碼實(shí)現(xiàn)主要是為了提高效率（當(dāng)然是以犧牲可讀性和可維護(hù)性為代價(jià)的）。在此，我們僅列舉一個(gè)字符串比較函數(shù)strcmp，其代碼在 arch/i386／string.h 中。

static inline int strcmp(const char * cs,const char * ct) {int d0, d1;register int __res;__asm__ __volatile__("1:\tlodsb\n\t""scasb\n\t""jne 2f\n\t""testb %%al,%%al\n\t""jne 1b\n\t""xorl %%eax,%%eax\n\t""jmp 3f\n""2:\tsbbl %%eax,%%eax\n\t""orb $1,%%al\n""3:":"=a" (__res), "=&S" (d0), "=&D" (d1):"1" (cs),"2" (ct));return __res; }

其中的“\n”是換行符，“\t”是 tab 符，在每條命令的結(jié)束加這兩個(gè)符號，是為了讓 gcc 把嵌入式匯編代碼翻譯成一般的匯編代碼時(shí)能夠保證換行和留有一定的空格。例如，上面的嵌入式匯編會被翻譯成：

1：
lodsb //裝入串操作數(shù),即從[esi]傳送到 al 寄存器，然后 esi 指向串中下一個(gè)元素
scasb //掃描串操作數(shù)，即從 al 中減去 es:[edi]，不保留結(jié)果，只改變標(biāo)志

jne2f //如果兩個(gè)字符不相等，則轉(zhuǎn)到標(biāo)號 2

testb %al %al
jne 1b

xorl %eax %eax
jmp 3f

2:
sbbl %eax %eax
orb $1 %al

3:
這段代碼看起來非常熟悉，讀起來也不困難。其中1f 表示往前（forword）找到第一個(gè)標(biāo)號為 1 的那一行，相應(yīng)地，1b 表示往后找。其中嵌入式匯編代碼中輸出和輸入部分的結(jié)合情況為：

返回值__res，放在 al 寄存器中，與%0 相結(jié)合；
局部變量 d0，與％1 相結(jié)合，也與輸入部分的 cs 參數(shù)相對應(yīng)，也存放在寄存器ESI 中，即 ESI 中存放源字符串的起始地址。
局部變量 d1，與％2 相結(jié)合，也與輸入部分的 ct 參數(shù)相對應(yīng)，也存放在寄存器 EDI 中，即 EDI 中存放目的字符串的起始地址。

通過對這段代碼的分析我們應(yīng)當(dāng)體會到，萬變不利其本，嵌入式匯編與一般匯編的區(qū)別僅僅是形式，本質(zhì)依然不變。因此，全面掌握 Intel 386 匯編指令乃突破閱讀底層代碼之根本。

小結(jié)

Linux 操作系統(tǒng)是用 C 語言編寫的,匯編只在必要的時(shí)候才被人們想到,但它卻是減少代碼尺寸和優(yōu)化代碼性能的一種非常重要的手段,特別是在與硬件直接交互的時(shí)候,匯編可以說是最佳的選擇。Linux 提供了非常優(yōu)秀的工具來支持匯編程序的開發(fā),使用 GCC 的內(nèi)聯(lián)匯編能夠充分地發(fā)揮 C 語言和匯編語言各自的優(yōu)點(diǎn)。

可能出現(xiàn)的問題

1. Error: invalid instruction suffix for `popl’

程序中有一條命令為：popl %eax
使用 as 編譯時(shí)出現(xiàn)錯(cuò)誤：Error: invalid instruction suffix for `popl’

原因：
64 位系統(tǒng)和 32 位系統(tǒng)的差別引起的

解決方法：
在代碼開頭添加 .code32 即可

參考資料

Linux 匯編語法和簡單實(shí)例 http://blog.csdn.net/darennet/article/details/41091133
Linux 中的匯編語言 http://blog.csdn.net/hairetz/article/details/17511567

總結(jié)

以上是生活随笔為你收集整理的Linux C 语言内联汇编的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇：计算机自带的画图软件工具介绍,电脑自带画
下一篇： iWebOffice2015入门（一）

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

linux

Linux C 语言内联汇编

Linux C 語言內(nèi)聯(lián)匯編

Linux 匯編語法格式

1. 前綴——寄存器名/立即操作數(shù)

2. 后綴——十六進(jìn)制/二進(jìn)制

3. 源操作數(shù)和目標(biāo)操作數(shù)的位置

4. 操作數(shù)的字長修飾符

5. 跳轉(zhuǎn)指令

6. 與跳轉(zhuǎn)指令相應(yīng)的遠(yuǎn)程返回指令

7. 內(nèi)存操作數(shù)

8. 間接尋址方式

9. 一些內(nèi)存操作數(shù)的例子

AT&T 匯編語言的相關(guān)知識

1. AT&T 中的Section段

2．匯編程序指令（Assembler Directive）

(1) .ascii “string”…

(2) .byte 表達(dá)式

(3) .fill 表達(dá)式

(4) .globl symbol

(5) .quad bignums

(6) .rept count

(7) .space size , fill

(8) .word expressions

(9) .long expressions

(10) .org new-lc , fill

Hello World

例 1. hello word —— AT&T 格式

例 2. hello word —— Intel 格式

Linux 匯編工具

1. 匯編器

2.鏈接器

3.調(diào)試器

系統(tǒng)調(diào)用

處理命令行參數(shù)

例 1. 處理命令行參數(shù)

GCC 內(nèi)聯(lián)匯編

例1: 內(nèi)聯(lián)匯編

例2: 輸出/輸入部分

例3: 預(yù)留不受計(jì)算影響的寄存器

例4: 復(fù)雜應(yīng)用

小結(jié)

可能出現(xiàn)的問題

1. Error: invalid instruction suffix for `popl’

參考資料

總結(jié)