C语言ASM汇编内嵌语法【转】
生活随笔
收集整理的這篇文章主要介紹了
C语言ASM汇编内嵌语法【转】
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
轉自:http://www.cnblogs.com/latifrons/archive/2009/09/17/1568198.html GCC 支持在C/C++代碼中嵌入匯編代碼,這些匯編代碼被稱作GCC Inline ASM——GCC內聯匯編。這是一個非常有用的功能,有利于我們將一些C/C++語法無法表達的指令直接潛入C/C++代碼中,另外也允許我們直接寫 C/C++代碼中使用匯編編寫簡潔高效的代碼。
1.基本內聯匯編
GCC中基本的內聯匯編非常易懂,我們先來看兩個簡單的例子:
__asm__("movl %esp,%eax"); // 看起來很熟悉吧!
或者是
__asm__("
movl?1,1,0x80
");
或
__asm__(
"movl?1,1,0x80" \
);
基本內聯匯編的格式是
__asm__ __volatile__("Instruction List");
1、__asm__
__asm__是GCC關鍵字asm的宏定義:
#define __asm__ asm
__asm__或asm用來聲明一個內聯匯編表達式,所以任何一個內聯匯編表達式都是以它開頭的,是必不可少的。
2、Instruction List
Instruction List是匯編指令序列。它可以是空的,比如:__asm__ __volatile__(""); 或__asm__ ("");都是完全合法的內聯匯編表達式,只不過這兩條語句沒有什么意義。但并非所有Instruction List為空的內聯匯編表達式都是沒有意義的,比如:__asm__ ("":::"memory"); 就非常有意義,它向GCC聲明:“我對內存作了改動”,GCC在編譯的時候,會將此因素考慮進去。
我們看一看下面這個例子:
cat?example1.c??int?main(int?__argc,?char*?__argv[])??{??int*?__p?=?(int*)__argc;???(*__p)?=?9999;???//__asm__("":::"memory");???if((*__p)?==?9999)??return?5;???return?(*__p);??}??在?這段代碼中,那條內聯匯編是被注釋掉的。在這條內聯匯編之前,內存指針__p所指向的內存被賦值為9999,隨即在內聯匯編之后,一條if語句判斷__p?所指向的內存與9999是否相等。很明顯,它們是相等的。GCC在優化編譯的時候能夠很聰明的發現這一點。我們使用下面的命令行對其進行編譯:cat?example1.c??int?main(int?__argc,?char*?__argv[])??{??int*?__p?=?(int*)__argc;???(*__p)?=?9999;???//__asm__("":::"memory");???if((*__p)?==?9999)??return?5;???return?(*__p);??}??在?這段代碼中,那條內聯匯編是被注釋掉的。在這條內聯匯編之前,內存指針__p所指向的內存被賦值為9999,隨即在內聯匯編之后,一條if語句判斷__p?所指向的內存與9999是否相等。很明顯,它們是相等的。GCC在優化編譯的時候能夠很聰明的發現這一點。我們使用下面的命令行對其進行編譯:gcc -O -S example1.c
選項-O表示優化編譯,我們還可以指定優化等級,比如-O2表示優化等級為2;選項-S表示將C/C++源文件編譯為匯編文件,文件名和C/C++文件一樣,只不過擴展名由.c變為.s。
我們來查看一下被放在example1.s中的編譯結果,我們這里僅僅列出了使用gcc 2.96在redhat 7.3上編譯后的相關函數部分匯編代碼。為了保持清晰性,無關的其它代碼未被列出。
catexample1.smain:pushlcatexample1.smain:pushl9999, (%eax) # (*__p) = 9999?
movl?5,5,?gcc -O -S example1.c
catexample1.smain:pushlcatexample1.smain:pushl9999, (%eax) # (*__p) = 9999
#APP?
# __asm__("":::"memory")
#NO_APP
cmpl?9999,(9999,(5, %eax # true, return 5?
jmp .L2?
.p2align 2?
.L3:?
movl (%eax), %eax?
.L2:?
popl %ebp?
ret
由于內聯匯編語句__asm__("":::"memory")向GCC聲明,在此內聯匯編語句出現的位置內存內容可能了改變,所以GCC在編譯時就不能像剛才那樣處理。這次,GCC老老實實的將if語句生成了匯編代碼。
可能有人會質疑:為什么要使用__asm__("":::"memory")向GCC聲明內存發生了變化?明明“Instruction List”是空的,沒有任何對內存的操作,這樣做只會增加GCC生成匯編代碼的數量。
確 實,那條內聯匯編語句沒有對內存作任何操作,事實上它確實什么都沒有做。但影響內存內容的不僅僅是你當前正在運行的程序。比如,如果你現在正在操作的內存 是一塊內存映射,映射的內容是外圍I/O設備寄存器。那么操作這塊內存的就不僅僅是當前的程序,I/O設備也會去操作這塊內存。既然兩者都會去操作同一塊 內存,那么任何一方在任何時候都不能對這塊內存的內容想當然。所以當你使用高級語言C/C++寫這類程序的時候,你必須讓編譯器也能夠明白這一點,畢竟高 級語言最終要被編譯為匯編代碼。
你可能已經注意到了,這次輸出的匯編結果中,有兩個符號:#APP和#NO_APP,GCC將內聯匯編語 句中"Instruction List"所列出的指令放在#APP和#NO_APP之間,由于__asm__("":::"memory")中“Instruction List”為空,所以#APP和#NO_APP中間也沒有任何內容。但我們以后的例子會更加清楚的表現這一點。
關于為什么內聯匯編__asm__("":::"memory")是一條聲明內存改變的語句,我們后面會詳細討論。
剛才我們花了大量的內容來討論"Instruction List"為空是的情況,但在實際的編程中,"Instruction List"絕大多數情況下都不是空的。它可以有1條或任意多條匯編指令。
當 在"Instruction List"中有多條指令的時候,你可以在一對引號中列出全部指令,也可以將一條或幾條指令放在一對引號中,所有指令放在多對引號中。如果是前者,你可以將 每一條指令放在一行,如果要將多條指令放在一行,則必須用分號(;)或換行符(\n,大多數情況下\n后還要跟一個\t,其中\n是為了換行,\t是為了 空出一個tab寬度的空格)將它們分開。比如:
__asm__("movl %eax, %ebx?
sti?
popl %edi?
subl %ecx, %ebx");?
__asm__("movl %eax, %ebx; sti?
popl %edi; subl %ecx, %ebx");
__asm__("movl %eax, %ebx; sti\n\t popl %edi
subl %ecx, %ebx");
都是合法的寫法。如果你將指令放在多對引號中,則除了最后一對引號之外,前面的所有引號里的最后一條指令之后都要有一個分號(;)或(\n)或(\n\t)。比如:
__asm__("movl %eax, %ebx?
sti\n"?
"popl %edi;"?
"subl %ecx, %ebx");?
__asm__("movl %eax, %ebx; sti\n\t"?
"popl %edi; subl %ecx, %ebx");
__asm__("movl %eax, %ebx; sti\n\t popl %edi\n"
"subl %ecx, %ebx");
__asm__("movl %eax, %ebx; sti\n\t popl %edi;" "subl %ecx, %ebx");
都是合法的。
上述原則可以歸結為:
任意兩個指令間要么被分號(;)分開,要么被放在兩行;?
放在兩行的方法既可以從通過\n的方法來實現,也可以真正的放在兩行;?
可以使用1對或多對引號,每1對引號里可以放任一多條指令,所有的指令都要被放到引號中。
在基本內聯匯編中,“Instruction List”的書寫的格式和你直接在匯編文件中寫非內聯匯編沒有什么不同,你可以在其中定義Label,定義對齊(.align n ),定義段(.section name )。例如:
__asm__(".align 2\n\t"?
"movl %eax, %ebx\n\t"?
"test %ebx, %ecx\n\t"?
"jne error\n\t"?
"sti\n\t"?
"error: popl %edi\n\t"?
"subl %ecx, %ebx");
上面例子的格式是Linux內聯代碼常用的格式,非常整齊。也建議大家都使用這種格式來寫內聯匯編代碼。
3、__volatile__
__volatile__是GCC關鍵字volatile的宏定義:
#define __volatile__ volatile
__volatile__ 或volatile是可選的,你可以用它也可以不用它。如果你用了它,則是向GCC聲明“不要動我所寫的Instruction List,我需要原封不動的保留每一條指令”,否則當你使用了優化選項(-O)進行編譯時,GCC將會根據自己的判斷決定是否將這個內聯匯編表達式中的指 令優化掉。
那么GCC判斷的原則是什么?我不知道(如果有哪位朋友清楚的話,請告訴我)。我試驗了一下,發現一條內聯匯編語句如果是基本 內聯匯編的話(即只有“Instruction List”,沒有Input/Output/Clobber的內聯匯編,我們后面將會討論這一點),無論你是否使用__volatile__來修飾, GCC 2.96在優化編譯時,都會原封不動的保留內聯匯編中的“Instruction List”。但或許我的試驗的例子并不充分,所以這一點并不能夠得到保證。
為了保險起見,如果你不想讓GCC的優化影響你的內聯匯編代碼,你最好在前面都加上__volatile__,而不要依賴于編譯器的原則,因為即使你非常了解當前編譯器的優化原則,你也無法保證這種原則將來不會發生變化。而__volatile__的含義卻是恒定的。
2、帶有C/C++表達式的內聯匯編
GCC允許你通過C/C++表達式指定內聯匯編中"Instrcuction List"中指令的輸入和輸出,你甚至可以不關心到底使用哪個寄存器被使用,完全靠GCC來安排和指定。這一點可以讓程序員避免去考慮有限的寄存器的使用,也可以提高目標代碼的效率。
我們先來看幾個例子:
__asm__ (" " : : : "memory" ); // 前面提到的
__asm__ ("mov %%eax, %%ebx" : "=b"(rv) : "a"(foo) : "eax", "ebx");
__asm__ __volatile__("lidt %0": "=m" (idt_descr));
__asm__("subl %2,%0\n\t"
"sbbl %3,%1"
: "=a" (endlow), "=d" (endhigh)
: "g" (startlow), "g" (starthigh), "0" (endlow), "1" (endhigh));
怎么樣,有點印象了吧,是不是也有點暈?沒關系,下面討論完之后你就不會再暈了。(當然,也有可能更暈^_^)。討論開始——
帶有C/C++表達式的內聯匯編格式為:
__asm__ __volatile__("Instruction List" : Output : Input : Clobber/Modify);
從中我們可以看出它和基本內聯匯編的不同之處在于:它多了3個部分(Input,Output,Clobber/Modify)。在括號中的4個部分通過冒號(:)分開。
這4個部分都不是必須的,任何一個部分都可以為空,其規則為:
如 果Clobber/Modify為空,則其前面的冒號(:)必須省略。比如__asm__("mov %%eax, %%ebx" : "=b"(foo) : "a"(inp) : )就是非法的寫法;而__asm__("mov %%eax, %%ebx" : "=b"(foo) : "a"(inp) )則是正確的。?
如果Instruction List為空,則Input,Output,Clobber/Modify可以不為空,也可以為空。比如__asm__ ( " " : : : "memory" );和__asm__(" " : : );都是合法的寫法。?
如 果Output,Input,Clobber/Modify都為空,Output,Input之前的冒號(:)既可以省略,也可以不省略。如果都省略,則 此匯編退化為一個基本內聯匯編,否則,仍然是一個帶有C/C++表達式的內聯匯編,此時"Instruction List"中的寄存器寫法要遵守相關規定,比如寄存器前必須使用兩個百分號(%%),而不是像基本匯編格式一樣在寄存器前只使用一個百分號(%)。比如 __asm__( " mov %%eax, %%ebx" : : );__asm__( " mov %%eax, %%ebx" : )和__asm__( " mov %eax, %ebx" )都是正確的寫法,而__asm__( " mov %eax, %ebx" : : );__asm__( " mov %eax, %ebx" : )和__asm__( " mov %%eax, %%ebx" )都是錯誤的寫法。?
如果Input,Clobber/Modify為空,但Output不為空,Input前的冒號(:)既可以省略,也可以不省略。比如 __asm__( " mov %%eax, %%ebx" : "=b"(foo) : );__asm__( " mov %%eax, %%ebx" : "=b"(foo) )都是正確的。?
如果后面的部分不為空,而前面的部分為空,則前面的冒號(:)都必須保留,否則無法說 明不為空的部分究竟是第幾部分。比如, Clobber/Modify,Output為空,而Input不為空,則Clobber/Modify前的冒號必須省略(前面的規則),而Output 前的冒號必須為保留。如果Clobber/Modify不為空,而Input和Output都為空,則Input和Output前的冒號都必須保留。比如 __asm__( " mov %%eax, %%ebx" : : "a"(foo) )和__asm__( " mov %%eax, %%ebx" : : : "ebx" )。
從上面的規則可以看到另外一個事實,區分一個內聯匯編是基本格式的還是帶有C/C++表達式格式的,其規則在于在"Instruction List"后是否有冒號(:)的存在,如果沒有則是基本格式的,否則,則是帶有C/C++表達式格式的。
兩種格式對寄存器語法的要求不同:基本格式要求寄存器前只能使用一個百分號(%),這一點和非內聯匯編相同;而帶有C/C++表達式格式則要求寄存器前必須使用兩個百分號(%%),其原因我們會在后面討論。
1. Output
Output用來指定當前內聯匯編語句的輸出。我們看一看這個例子:
__asm__("movl %%cr0, %0": "=a" (cr0));
這 個內聯匯編語句的輸出部分為"=r"(cr0),它是一個“操作表達式”,指定了一個輸出操作。我們可以很清楚得看到這個輸出操作由兩部分組成:括號括住 的部分(cr0)和引號引住的部分"=a"。這兩部分都是每一個輸出操作必不可少的。括號括住的部分是一個C/C++表達式,用來保存內聯匯編的一個輸出 值,其操作就等于C/C++的相等賦值cr0 = output_value,因此,括號中的輸出表達式只能是C/C++的左值表達式,也就是說它只能是一個可以合法的放在C/C++賦值操作中等號(=) 左邊的表達式。那么右值output_value從何而來呢?
答案是引號中的內容,被稱作“操作約束”(Operation Constraint),在這個例子中操作約束為"=a",它包含兩個約束:等號(=)和字母a,其中等號(=)說明括號中左值表達式cr0是一個 Write-Only的,只能夠被作為當前內聯匯編的輸入,而不能作為輸入。而字母a是寄存器EAX / AX / AL的簡寫,說明cr0的值要從eax寄存器中獲取,也就是說cr0 = eax,最終這一點被轉化成匯編指令就是movl %eax, address_of_cr0。現在你應該清楚了吧,操作約束中會給出:到底從哪個寄存器傳遞值給cr0。
另外,需要特別說明的是,很多 文檔都聲明,所有輸出操作的操作約束必須包含一個等號(=),但GCC的文檔中卻很清楚的聲明,并非如此。因為等號(=)約束說明當前的表達式是一個 Write-Only的,但另外還有一個符號——加號(+)用來說明當前表達式是一個Read-Write的,如果一個操作約束中沒有給出這兩個符號中的 任何一個,則說明當前表達式是Read-Only的。因為對于輸出操作來說,肯定是必須是可寫的,而等號(=)和加號(+)都表示可寫,只不過加號(+) 同時也表示是可讀的。所以對于一個輸出操作來說,其操作約束只需要有等號(=)或加號(+)中的任意一個就可以了。
二者的區別是:等號(=)表示當前操作表達式指定了一個純粹的輸出操作,而加號(+)則表示當前操作表達式不僅僅只是一個輸出操作還是一個輸入操作。但無論是等號(=)約束還是加號(+)約束所約束的操作表達式都只能放在Output域中,而不能被用在Input域中。
另外,有些文檔聲明:盡管GCC文檔中提供了加號(+)約束,但在實際的編譯中通不過;我不知道老版本會怎么樣,我在GCC 2.96中對加號(+)約束的使用非常正常。
我們通過一個例子看一下,在一個輸出操作中使用等號(=)約束和加號(+)約束的不同。
cat?example2.c??int?main(int?__argc,?char*?__argv[])??{??int?cr0?=?5;???__asm__?__volatile__("movl?%%cr0,?%0":"=a"?(cr0));???return?0;??}cat?example2.c??int?main(int?__argc,?char*?__argv[])??{??int?cr0?=?5;???__asm__?__volatile__("movl?%%cr0,?%0":"=a"?(cr0));???return?0;??}?gcc -S example2.c
catexample2.smain:pushlcatexample2.smain:pushl4, %esp?
movl?5,?4(5,?4(0, %eax?
leave?
ret?
這個例子是使用等號(=)約束的情況,變量cr0被放在內存-4(%ebp)的位置,所以指令mov %eax, -4(%ebp)即表示將%eax的內容輸出到變量cr0中。
下面是使用加號(+)約束的情況:
cat?example3.c??int?main(int?__argc,?char*?__argv[])??{??int?cr0?=?5;???__asm__?__volatile__("movl?%%cr0,?%0"?:?"+a"?(cr0));???return?0;??}cat?example3.c??int?main(int?__argc,?char*?__argv[])??{??int?cr0?=?5;???__asm__?__volatile__("movl?%%cr0,?%0"?:?"+a"?(cr0));???return?0;??}?gcc -S example3.c
catexample3.smain:pushlcatexample3.smain:pushl4, %esp?
movl?5,?4(5,?4(0, %eax
leave
ret
從編譯的結果可以看出,當使用加號(+)約束的時候,cr0不僅作為輸出,還作為輸入,所使用寄存器都是寄存器約束(字母a,表示使用eax寄存器)指定的。關于寄存器約束我們后面討論。
在Output域中可以有多個輸出操作表達式,多個操作表達式中間必須用逗號(,)分開。例如:
__asm__(?
"movl %%eax, %0 \n\t"?
"pushl %%ebx \n\t"?
"popl %1 \n\t"?
"movl %1, %2"?
: "+a"(cr0), "=b"(cr1), "=c"(cr2));
2、Input
Input域的內容用來指定當前內聯匯編語句的輸入。我們看一看這個例子:
__asm__("movl %0, %%db7" : : "a" (cpu->db7));
例中Input域的內容為一個表達式"a"[cpu->db7),被稱作“輸入表達式”,用來表示一個對當前內聯匯編的輸入。
像輸出表達式一樣,一個輸入表達式也分為兩部分:帶括號的部分(cpu->db7)和帶引號的部分"a"。這兩部分對于一個內聯匯編輸入表達式來說也是必不可少的。
括 號中的表達式cpu->db7是一個C/C++語言的表達式,它不必是一個左值表達式,也就是說它不僅可以是放在C/C++賦值操作左邊的表達式, 還可以是放在C/C++賦值操作右邊的表達式。所以它可以是一個變量,一個數字,還可以是一個復雜的表達式(比如a+b/c*d)。比如上例可以改為: __asm__("movl %0, %%db7" : : "a" (foo)),__asm__("movl %0, %%db7" : : "a" (0x1000))或__asm__("movl %0, %%db7" : : "a" (va*vb/vc))。
引號號中的 部分是約束部分,和輸出表達式約束不同的是,它不允許指定加號(+)約束和等號(=)約束,也就是說它只能是默認的Read-Only的。約束中必須指定 一個寄存器約束,例中的字母a表示當前輸入變量cpu->db7要通過寄存器eax輸入到當前內聯匯編中。
我們看一個例子:
cat?example4.c??int?main(int?__argc,?char*?__argv[])??{??int?cr0?=?5;???__asm__?__volatile__("movl?%0,?%%cr0"::"a"?(cr0));???return?0;??}cat?example4.c??int?main(int?__argc,?char*?__argv[])??{??int?cr0?=?5;???__asm__?__volatile__("movl?%0,?%%cr0"::"a"?(cr0));???return?0;??}?gcc -S example4.c
catexample4.smain:pushlcatexample4.smain:pushl4, %esp?
movl?5,?4(5,?4(0, %eax?
leave?
ret?
我們從編譯出的匯編代碼可以看到,在"Instruction List"之前,GCC按照我們的輸入約束"a",將變量cr0的內容裝入了eax寄存器。
3. Operation Constraint
每一個Input和Output表達式都必須指定自己的操作約束Operation Constraint,我們這里來討論在80386平臺上所可能使用的操作約束。
1、寄存器約束
當你當前的輸入或輸入需要借助一個寄存器時,你需要為其指定一個寄存器約束。你可以直接指定一個寄存器的名字,比如:
__asm__ __volatile__("movl %0, %%cr0"::"eax" (cr0));
也可以指定一個縮寫,比如:
__asm__ __volatile__("movl %0, %%cr0"::"a" (cr0));
如果你指定一個縮寫,比如字母a,則GCC將會根據當前操作表達式中C/C++表達式的寬度決定使用%eax,還是%ax或%al。比如:
unsigned short __shrt;
__asm__ ("mov %0,%%bx" : : "a"(__shrt));
由于變量__shrt是16-bit short類型,則編譯出來的匯編代碼中,則會讓此變量使用%ex寄存器。編譯結果為:
movw -2(%ebp), %ax # %ax = __shrt
#APP
movl %ax, %bx
#NO_APP
無論是Input,還是Output操作表達式約束,都可以使用寄存器約束。
下表中列出了常用的寄存器約束的縮寫。
約束 Input/Output 意義?
r I,O 表示使用一個通用寄存器,由GCC在%eax/%ax/%al, %ebx/%bx/%bl, %ecx/%cx/%cl, %edx/%dx/%dl中選取一個GCC認為合適的。?
q I,O 表示使用一個通用寄存器,和r的意義相同。?
a I,O 表示使用%eax / %ax / %al?
b I,O 表示使用%ebx / %bx / %bl?
c I,O 表示使用%ecx / %cx / %cl?
d I,O 表示使用%edx / %dx / %dl?
D I,O 表示使用%edi / %di?
S I,O 表示使用%esi / %si?
f I,O 表示使用浮點寄存器?
t I,O 表示使用第一個浮點寄存器?
u I,O 表示使用第二個浮點寄存器?
2、內存約束?
如果一個Input/Output操作表達式的C/C++表達式表現為一個內存地址,不想借助于任何寄存器,則可以使用內存約束。比如:
__asm__ ("lidt %0" : "=m"(__idt_addr)); 或 __asm__ ("lidt %0" : :"m"(__idt_addr));
我們看一下它們分別被放在一個C源文件中,然后被GCC編譯后的結果:
cat?example5.c??//?本例中,變量sh被作為一個內存輸入??int?main(int?__argc,?char*?__argv[])??{??char*?sh?=?(char*)&__argc;???__asm__?__volatile__("lidt?%0"?:?:?"m"?(sh));???return?0;??}cat?example5.c??//?本例中,變量sh被作為一個內存輸入??int?main(int?__argc,?char*?__argv[])??{??char*?sh?=?(char*)&__argc;???__asm__?__volatile__("lidt?%0"?:?:?"m"?(sh));???return?0;??}?gcc -S example5.c
catexample5.smain:pushlcatexample5.smain:pushl4, %esp?
leal 8(%ebp), %eax?
movl %eax, -4(%ebp) # sh = (char*) &__argc
#APP?
lidt -4(%ebp)?
#NO_APP?
movl?0,0,?cat example6.c
// 本例中,變量sh被作為一個內存輸出
int main(int __argc, char* __argv[])?
{?
char* sh = (char*)&__argc;?
__asm__ __volatile__("lidt %0" : "=m" (sh));?
return 0;?
}?
gcc?Sexample6.cgcc?Sexample6.c?cat example6.s
main:
pushl %ebp
movl %esp, %ebp
subl?4,4,0, %eax
leave
ret
首先,你會注意到,在這兩個例子中,變量sh沒有借助任何寄存器,而是直接參與了指令lidt的操作。
其次,通過仔細觀察,你會發現一個驚人的事實,兩個例子編譯出來的匯編代碼是一樣的!雖然,一個例子中變量sh作為輸入,而另一個例子中變量sh作為輸出。這是怎么回事?
原來,使用內存方式進行輸入輸出時,由于不借助寄存器,所以GCC不會按照你的聲明對其作任何的輸入輸出處理。GCC只會直接拿來用,究竟對這個C/C++表達式而言是輸入還是輸出,完全依賴與你寫在"Instruction List"中的指令對其操作的指令。
由 于上例中,對其操作的指令為lidt,lidt指令的操作數是一個輸入型的操作數,所以事實上對變量sh的操作是一個輸入操作,即使你把它放在 Output域也不會改變這一點。所以,對此例而言,完全符合語意的寫法應該是將sh放在Input域,盡管放在Output域也會有正確的執行結果。
所 以,對于內存約束類型的操作表達式而言,放在Input域還是放在Output域,對編譯結果是沒有任何影響的,因為本來我們將一個操作表達式放在 Input域或放在Output域是希望GCC能為我們自動通過寄存器將表達式的值輸入或輸出。既然對于內存約束類型的操作表達式來說,GCC不會自動為 它做任何事情,那么放在哪兒也就無所謂了。但從程序員的角度而言,為了增強代碼的可讀性,最好能夠把它放在符合實際情況的地方。
約束 Input/Output 意義?
m I,O 表示使用系統所支持的任何一種內存方式,不需要借助寄存器?
3、立即數約束
如果一個Input/Output操作表達式的C/C++表達式是一個數字常數,不想借助于任何寄存器,則可以使用立即數約束。
由于立即數在C/C++中只能作為右值,所以對于使用立即數約束的表達式而言,只能放在Input域。
比如:__asm__ __volatile__("movl %0, %%eax" : : "i" (100) );?
立即數約束很簡單,也很容易理解,我們在這里就不再贅述。
約束 Input/Output 意義?
i I 表示輸入表達式是一個立即數(整數),不需要借助任何寄存器?
F I 表示輸入表達式是一個立即數(浮點數),不需要借助任何寄存器?
4、通用約束
約束 Input/Output 意義?
g I,O 表示可以使用通用寄存器,內存,立即數等任何一種處理方式。?
0,1,2,3,4,5,6,7,8,9 I 表示和第n個操作表達式使用相同的寄存器/內存。?
通 用約束g是一個非常靈活的約束,當程序員認為一個C/C++表達式在實際的操作中,究竟使用寄存器方式,還是使用內存方式或立即數方式并無所謂時,或者程 序員想實現一個靈活的模板,讓GCC可以根據不同的C/C++表達式生成不同的訪問方式時,就可以使用通用約束g。比如:
#define JUST_MOV(foo) __asm__ ("movl %0, %%eax" : : "g"(foo))
JUST_MOV(100)和JUST_MOV(var)則會讓編譯器產生不同的代碼。
int main(int __argc, char* __argv[])?
{?
JUST_MOV(100);?
return 0;?
}?
編譯后生成的代碼為:
main:?
pushl %ebp?
movl %esp, %ebp?
#APP?
movl?100,100,0, %eax?
popl %ebp?
ret
很明顯這是立即數方式。而下一個例子:
int main(int __argc, char* __argv[])?
{?
JUST_MOV(__argc);?
return 0;?
}?
經編譯后生成的代碼為:
main:?
pushl %ebp?
movl %esp, %ebp?
#APP?
movl 8(%ebp), %eax?
#NO_APP?
movl?0,0,12, %esp?
movl?8,?4(8,?4(4, -8(%ebp)?
movl?3,?12(3,?12(0, %eax?
leave?
ret?
為 了避免這種情況,我們必須向GCC聲明這一點,要求GCC為所有的Input操作表達式指定別的寄存器,方法就是在Output操作表達式"=a" (__out)的操作約束中加入&約束,由于GCC規定等號(=)約束必須放在第一個,所以我們寫作"=&a"(__out)。?
下面是我們將&約束加入之后編譯的結果:
main:?
pushl %ebp?
movl %esp, %ebp?
subl?12,12,8, -4(%ebp)?
movl?4,?8(4,?8(3, -12(%ebp)?
movl -4(%ebp), %edx #__in1使用寄存器%edx
movl -8(%ebp), %eax?
movl %eax, %ecx # __in2使用寄存器%ecx
#APP?
popl %eax?
movl %edx, %esi?
movl %ecx, %edi?
#NO_APP?
movl %eax, %eax?
movl %eax, -12(%ebp) #__out使用寄存器%eax
movl?0,0,?cat example7.c
int main(int __argc, char* __argv[])?
{?
int in = 8;?
__asm__ ("addl %0, %%ebx"?
: /* no output */?
: "a" (in) : "bx");?
return 0;?
}
gcc?O?Sexample7.cgcc?O?Sexample7.c?cat example7.s
main:
pushl %ebp
movl %esp, %ebp
pushl %ebx # %ebx內容被保存?
movl?8,8,0, %eax
movl (%esp), %ebx # %ebx內容被恢復
leave
ret
下面這個例子的C源碼與上一個例子除了沒有聲明%ebx寄存器發生了改變之外,其它都相同。
cat?example8.c??int?main(int?__argc,?char*?__argv[])??{??int?in?=?8;???__asm__?("addl?%0,?%%ebx"??:?/*?no?output?*/??:?"a"?(in)?);???return?0;??}cat?example8.c??int?main(int?__argc,?char*?__argv[])??{??int?in?=?8;???__asm__?("addl?%0,?%%ebx"??:?/*?no?output?*/??:?"a"?(in)?);???return?0;??}?gcc -O -S example8.c
catexample8.smain:pushlcatexample8.smain:pushl8, %eax?
#APP?
addl %eax, %ebx?
#NO_APP?
movl $0, %eax?
popl %ebp?
ret
仔細對比一下example7.s和example8.s,你就會明白在Clobber/Modify域聲明一個寄存器的意義。
另 外需要注意的是,如果你在Clobber/Modify域聲明了一個寄存器,那么這個寄存器將不能再被用做當前內聯匯編語句的Input/Output操 作表達式的寄存器約束,如果Input/Output操作表達式的寄存器約束被指定為"r"或"g",GCC也不會選擇已經被聲明在 Clobber/Modify中的寄存器。比如:
__asm__ ("movl %0, %%ebx" : : "a"(__foo) : "ax", "bx");
此例中,由于Output操作表達式"a"(__foo)的寄存器約束已經指定了%eax寄存器,那么再在Clobber/Modify域中指定"ax"就是非法的。編譯時,GCC會給出編譯錯誤。
除 了寄存器的內容會被改變,內存的內容也可以被修改。如果一個內聯匯編語句"Instruction List"中的指令對內存進行了修改,或者在此內聯匯編出現的地方內存內容可能發生改變,而被改變的內存地址你沒有在其Output操作表達式使用"m" 約束,這種情況下你需要使用在Clobber/Modify域使用字符串"memory"向GCC聲明:“在這里,內存發生了,或可能發生了改變”。例 如:
void * memset(void * s, char c, size_t count)
{
__asm__("cld\n\t"
"rep\n\t"
"stosb"
: /* no output */
: "a" (c),"D" (s),"c" (count)
: "cx","di","memory");
return s;
}
此 例實現了標準函數庫memset,其內聯匯編中的stosb對內存進行了改動,而其被修改的內存地址s被指定裝入%edi,沒有任何Output操作表達 式使用了"m"約束,以指定內存地址s處的內容發生了改變。所以在其Clobber/Modify域使用"memory"向GCC聲明:內存內容發生了變 動。
如果一個內聯匯編語句的Clobber/Modify域存在"memory",那么GCC會保證在此內聯匯編之前,如果某個內存的內 容被裝入了寄存器,那么在這個內聯匯編之后,如果需要使用這個內存處的內容,就會直接到這個內存處重新讀取,而不是使用被存放在寄存器中的拷貝。因為這個 時候寄存器中的拷貝已經很可能和內存處的內容不一致了。
這只是使用"memory"時,GCC會保證做到的一點,但這并不是全部。因為使用"memory"是向GCC聲明內存發生了變化,而內存發生變化帶來的影響并不止這一點。比如我們在前面講到的例子:
int main(int __argc, char* __argv[])?
{?
int* __p = (int*)__argc;?
(*__p) = 9999;?
__asm__("":::"memory");?
if((*__p) == 9999)?
return 5;?
return (*__p);?
}
本 例中,如果沒有那條內聯匯編語句,那個if語句的判斷條件就完全是一句廢話。GCC在優化時會意識到這一點,而直接只生成return 5的匯編代碼,而不會再生成if語句的相關代碼,而不會生成return (*__p)的相關代碼。但你加上了這條內聯匯編語句,它除了聲明內存變化之外,什么都沒有做。但GCC此時就不能簡單的認為它不需要判斷都知道 (*__p)一定與9999相等,它只有老老實實生成這條if語句的匯編代碼,一起相關的兩個return語句相關代碼。
當一個內聯匯編 指令中包含影響eflags寄存器中的條件標志(也就是那些Jxx等跳轉指令要參考的標志位,比如,進位標志,0標志等),那么需要在 Clobber/Modify域中使用"cc"來聲明這一點。這些指令包括adc, div,popfl,btr,bts等等,另外,當包含call指令時,由于你不知道你所call的函數是否會修改條件標志,為了穩妥起見,最好也使用 "cc"。
我很少在相關資料中看到有關"cc"的確切用法,只有一份文檔提到了它,但還不是i386平臺的,只是說"cc"是處理器平臺 相關的,并非所有的平臺都支持它,但即使在不支持它的平臺上,使用它也不會造成編譯錯誤。我做了一些實驗,但發現使用"cc"和不使用"cc"所生成的代 碼沒有任何不同。但Linux 2.4的相關代碼中用到了它。如果誰知道在i386平臺上"cc"的細節,請和我聯系。
另外,還可以在 Clobber/Modify域指定數字0到9,以聲明第n個Input/Output操作表達式所使用的寄存器發生了變化,但正如我們在前面所提到的, 如果你為某個Input/Output操作表達式指定了寄存器,或使用"g","r"等約束讓GCC為其選擇寄存器,GCC已經知道哪個寄存器內容發生了 變化,所以這么做沒有什么意義;我也作了相關的試驗,沒有發現使用它會對GCC生成的匯編代碼有任何影響,至少在i386平臺上是這樣。Linux 2.4的所有i386平臺相關內聯匯編代碼中都沒有使用這一點,但S390平臺相關代碼中有用到,但由于我對S390匯編沒有任何概念,所以,也不知道這 么做的意義何在。
本文轉自張昺華-sky博客園博客,原文鏈接:http://www.cnblogs.com/sky-heaven/p/5283240.html,如需轉載請自行聯系原作者
新人創作打卡挑戰賽發博客就能抽獎!定制產品紅包拿不停!
1.基本內聯匯編
GCC中基本的內聯匯編非常易懂,我們先來看兩個簡單的例子:
__asm__("movl %esp,%eax"); // 看起來很熟悉吧!
或者是
__asm__("
movl?1,1,0x80
");
或
__asm__(
"movl?1,1,0x80" \
);
基本內聯匯編的格式是
__asm__ __volatile__("Instruction List");
1、__asm__
__asm__是GCC關鍵字asm的宏定義:
#define __asm__ asm
__asm__或asm用來聲明一個內聯匯編表達式,所以任何一個內聯匯編表達式都是以它開頭的,是必不可少的。
2、Instruction List
Instruction List是匯編指令序列。它可以是空的,比如:__asm__ __volatile__(""); 或__asm__ ("");都是完全合法的內聯匯編表達式,只不過這兩條語句沒有什么意義。但并非所有Instruction List為空的內聯匯編表達式都是沒有意義的,比如:__asm__ ("":::"memory"); 就非常有意義,它向GCC聲明:“我對內存作了改動”,GCC在編譯的時候,會將此因素考慮進去。
我們看一看下面這個例子:
cat?example1.c??int?main(int?__argc,?char*?__argv[])??{??int*?__p?=?(int*)__argc;???(*__p)?=?9999;???//__asm__("":::"memory");???if((*__p)?==?9999)??return?5;???return?(*__p);??}??在?這段代碼中,那條內聯匯編是被注釋掉的。在這條內聯匯編之前,內存指針__p所指向的內存被賦值為9999,隨即在內聯匯編之后,一條if語句判斷__p?所指向的內存與9999是否相等。很明顯,它們是相等的。GCC在優化編譯的時候能夠很聰明的發現這一點。我們使用下面的命令行對其進行編譯:cat?example1.c??int?main(int?__argc,?char*?__argv[])??{??int*?__p?=?(int*)__argc;???(*__p)?=?9999;???//__asm__("":::"memory");???if((*__p)?==?9999)??return?5;???return?(*__p);??}??在?這段代碼中,那條內聯匯編是被注釋掉的。在這條內聯匯編之前,內存指針__p所指向的內存被賦值為9999,隨即在內聯匯編之后,一條if語句判斷__p?所指向的內存與9999是否相等。很明顯,它們是相等的。GCC在優化編譯的時候能夠很聰明的發現這一點。我們使用下面的命令行對其進行編譯:gcc -O -S example1.c
選項-O表示優化編譯,我們還可以指定優化等級,比如-O2表示優化等級為2;選項-S表示將C/C++源文件編譯為匯編文件,文件名和C/C++文件一樣,只不過擴展名由.c變為.s。
我們來查看一下被放在example1.s中的編譯結果,我們這里僅僅列出了使用gcc 2.96在redhat 7.3上編譯后的相關函數部分匯編代碼。為了保持清晰性,無關的其它代碼未被列出。
catexample1.smain:pushlcatexample1.smain:pushl9999, (%eax) # (*__p) = 9999?
movl?5,5,?gcc -O -S example1.c
catexample1.smain:pushlcatexample1.smain:pushl9999, (%eax) # (*__p) = 9999
#APP?
# __asm__("":::"memory")
#NO_APP
cmpl?9999,(9999,(5, %eax # true, return 5?
jmp .L2?
.p2align 2?
.L3:?
movl (%eax), %eax?
.L2:?
popl %ebp?
ret
由于內聯匯編語句__asm__("":::"memory")向GCC聲明,在此內聯匯編語句出現的位置內存內容可能了改變,所以GCC在編譯時就不能像剛才那樣處理。這次,GCC老老實實的將if語句生成了匯編代碼。
可能有人會質疑:為什么要使用__asm__("":::"memory")向GCC聲明內存發生了變化?明明“Instruction List”是空的,沒有任何對內存的操作,這樣做只會增加GCC生成匯編代碼的數量。
確 實,那條內聯匯編語句沒有對內存作任何操作,事實上它確實什么都沒有做。但影響內存內容的不僅僅是你當前正在運行的程序。比如,如果你現在正在操作的內存 是一塊內存映射,映射的內容是外圍I/O設備寄存器。那么操作這塊內存的就不僅僅是當前的程序,I/O設備也會去操作這塊內存。既然兩者都會去操作同一塊 內存,那么任何一方在任何時候都不能對這塊內存的內容想當然。所以當你使用高級語言C/C++寫這類程序的時候,你必須讓編譯器也能夠明白這一點,畢竟高 級語言最終要被編譯為匯編代碼。
你可能已經注意到了,這次輸出的匯編結果中,有兩個符號:#APP和#NO_APP,GCC將內聯匯編語 句中"Instruction List"所列出的指令放在#APP和#NO_APP之間,由于__asm__("":::"memory")中“Instruction List”為空,所以#APP和#NO_APP中間也沒有任何內容。但我們以后的例子會更加清楚的表現這一點。
關于為什么內聯匯編__asm__("":::"memory")是一條聲明內存改變的語句,我們后面會詳細討論。
剛才我們花了大量的內容來討論"Instruction List"為空是的情況,但在實際的編程中,"Instruction List"絕大多數情況下都不是空的。它可以有1條或任意多條匯編指令。
當 在"Instruction List"中有多條指令的時候,你可以在一對引號中列出全部指令,也可以將一條或幾條指令放在一對引號中,所有指令放在多對引號中。如果是前者,你可以將 每一條指令放在一行,如果要將多條指令放在一行,則必須用分號(;)或換行符(\n,大多數情況下\n后還要跟一個\t,其中\n是為了換行,\t是為了 空出一個tab寬度的空格)將它們分開。比如:
__asm__("movl %eax, %ebx?
sti?
popl %edi?
subl %ecx, %ebx");?
__asm__("movl %eax, %ebx; sti?
popl %edi; subl %ecx, %ebx");
__asm__("movl %eax, %ebx; sti\n\t popl %edi
subl %ecx, %ebx");
都是合法的寫法。如果你將指令放在多對引號中,則除了最后一對引號之外,前面的所有引號里的最后一條指令之后都要有一個分號(;)或(\n)或(\n\t)。比如:
__asm__("movl %eax, %ebx?
sti\n"?
"popl %edi;"?
"subl %ecx, %ebx");?
__asm__("movl %eax, %ebx; sti\n\t"?
"popl %edi; subl %ecx, %ebx");
__asm__("movl %eax, %ebx; sti\n\t popl %edi\n"
"subl %ecx, %ebx");
__asm__("movl %eax, %ebx; sti\n\t popl %edi;" "subl %ecx, %ebx");
都是合法的。
上述原則可以歸結為:
任意兩個指令間要么被分號(;)分開,要么被放在兩行;?
放在兩行的方法既可以從通過\n的方法來實現,也可以真正的放在兩行;?
可以使用1對或多對引號,每1對引號里可以放任一多條指令,所有的指令都要被放到引號中。
在基本內聯匯編中,“Instruction List”的書寫的格式和你直接在匯編文件中寫非內聯匯編沒有什么不同,你可以在其中定義Label,定義對齊(.align n ),定義段(.section name )。例如:
__asm__(".align 2\n\t"?
"movl %eax, %ebx\n\t"?
"test %ebx, %ecx\n\t"?
"jne error\n\t"?
"sti\n\t"?
"error: popl %edi\n\t"?
"subl %ecx, %ebx");
上面例子的格式是Linux內聯代碼常用的格式,非常整齊。也建議大家都使用這種格式來寫內聯匯編代碼。
3、__volatile__
__volatile__是GCC關鍵字volatile的宏定義:
#define __volatile__ volatile
__volatile__ 或volatile是可選的,你可以用它也可以不用它。如果你用了它,則是向GCC聲明“不要動我所寫的Instruction List,我需要原封不動的保留每一條指令”,否則當你使用了優化選項(-O)進行編譯時,GCC將會根據自己的判斷決定是否將這個內聯匯編表達式中的指 令優化掉。
那么GCC判斷的原則是什么?我不知道(如果有哪位朋友清楚的話,請告訴我)。我試驗了一下,發現一條內聯匯編語句如果是基本 內聯匯編的話(即只有“Instruction List”,沒有Input/Output/Clobber的內聯匯編,我們后面將會討論這一點),無論你是否使用__volatile__來修飾, GCC 2.96在優化編譯時,都會原封不動的保留內聯匯編中的“Instruction List”。但或許我的試驗的例子并不充分,所以這一點并不能夠得到保證。
為了保險起見,如果你不想讓GCC的優化影響你的內聯匯編代碼,你最好在前面都加上__volatile__,而不要依賴于編譯器的原則,因為即使你非常了解當前編譯器的優化原則,你也無法保證這種原則將來不會發生變化。而__volatile__的含義卻是恒定的。
2、帶有C/C++表達式的內聯匯編
GCC允許你通過C/C++表達式指定內聯匯編中"Instrcuction List"中指令的輸入和輸出,你甚至可以不關心到底使用哪個寄存器被使用,完全靠GCC來安排和指定。這一點可以讓程序員避免去考慮有限的寄存器的使用,也可以提高目標代碼的效率。
我們先來看幾個例子:
__asm__ (" " : : : "memory" ); // 前面提到的
__asm__ ("mov %%eax, %%ebx" : "=b"(rv) : "a"(foo) : "eax", "ebx");
__asm__ __volatile__("lidt %0": "=m" (idt_descr));
__asm__("subl %2,%0\n\t"
"sbbl %3,%1"
: "=a" (endlow), "=d" (endhigh)
: "g" (startlow), "g" (starthigh), "0" (endlow), "1" (endhigh));
怎么樣,有點印象了吧,是不是也有點暈?沒關系,下面討論完之后你就不會再暈了。(當然,也有可能更暈^_^)。討論開始——
帶有C/C++表達式的內聯匯編格式為:
__asm__ __volatile__("Instruction List" : Output : Input : Clobber/Modify);
從中我們可以看出它和基本內聯匯編的不同之處在于:它多了3個部分(Input,Output,Clobber/Modify)。在括號中的4個部分通過冒號(:)分開。
這4個部分都不是必須的,任何一個部分都可以為空,其規則為:
如 果Clobber/Modify為空,則其前面的冒號(:)必須省略。比如__asm__("mov %%eax, %%ebx" : "=b"(foo) : "a"(inp) : )就是非法的寫法;而__asm__("mov %%eax, %%ebx" : "=b"(foo) : "a"(inp) )則是正確的。?
如果Instruction List為空,則Input,Output,Clobber/Modify可以不為空,也可以為空。比如__asm__ ( " " : : : "memory" );和__asm__(" " : : );都是合法的寫法。?
如 果Output,Input,Clobber/Modify都為空,Output,Input之前的冒號(:)既可以省略,也可以不省略。如果都省略,則 此匯編退化為一個基本內聯匯編,否則,仍然是一個帶有C/C++表達式的內聯匯編,此時"Instruction List"中的寄存器寫法要遵守相關規定,比如寄存器前必須使用兩個百分號(%%),而不是像基本匯編格式一樣在寄存器前只使用一個百分號(%)。比如 __asm__( " mov %%eax, %%ebx" : : );__asm__( " mov %%eax, %%ebx" : )和__asm__( " mov %eax, %ebx" )都是正確的寫法,而__asm__( " mov %eax, %ebx" : : );__asm__( " mov %eax, %ebx" : )和__asm__( " mov %%eax, %%ebx" )都是錯誤的寫法。?
如果Input,Clobber/Modify為空,但Output不為空,Input前的冒號(:)既可以省略,也可以不省略。比如 __asm__( " mov %%eax, %%ebx" : "=b"(foo) : );__asm__( " mov %%eax, %%ebx" : "=b"(foo) )都是正確的。?
如果后面的部分不為空,而前面的部分為空,則前面的冒號(:)都必須保留,否則無法說 明不為空的部分究竟是第幾部分。比如, Clobber/Modify,Output為空,而Input不為空,則Clobber/Modify前的冒號必須省略(前面的規則),而Output 前的冒號必須為保留。如果Clobber/Modify不為空,而Input和Output都為空,則Input和Output前的冒號都必須保留。比如 __asm__( " mov %%eax, %%ebx" : : "a"(foo) )和__asm__( " mov %%eax, %%ebx" : : : "ebx" )。
從上面的規則可以看到另外一個事實,區分一個內聯匯編是基本格式的還是帶有C/C++表達式格式的,其規則在于在"Instruction List"后是否有冒號(:)的存在,如果沒有則是基本格式的,否則,則是帶有C/C++表達式格式的。
兩種格式對寄存器語法的要求不同:基本格式要求寄存器前只能使用一個百分號(%),這一點和非內聯匯編相同;而帶有C/C++表達式格式則要求寄存器前必須使用兩個百分號(%%),其原因我們會在后面討論。
1. Output
Output用來指定當前內聯匯編語句的輸出。我們看一看這個例子:
__asm__("movl %%cr0, %0": "=a" (cr0));
這 個內聯匯編語句的輸出部分為"=r"(cr0),它是一個“操作表達式”,指定了一個輸出操作。我們可以很清楚得看到這個輸出操作由兩部分組成:括號括住 的部分(cr0)和引號引住的部分"=a"。這兩部分都是每一個輸出操作必不可少的。括號括住的部分是一個C/C++表達式,用來保存內聯匯編的一個輸出 值,其操作就等于C/C++的相等賦值cr0 = output_value,因此,括號中的輸出表達式只能是C/C++的左值表達式,也就是說它只能是一個可以合法的放在C/C++賦值操作中等號(=) 左邊的表達式。那么右值output_value從何而來呢?
答案是引號中的內容,被稱作“操作約束”(Operation Constraint),在這個例子中操作約束為"=a",它包含兩個約束:等號(=)和字母a,其中等號(=)說明括號中左值表達式cr0是一個 Write-Only的,只能夠被作為當前內聯匯編的輸入,而不能作為輸入。而字母a是寄存器EAX / AX / AL的簡寫,說明cr0的值要從eax寄存器中獲取,也就是說cr0 = eax,最終這一點被轉化成匯編指令就是movl %eax, address_of_cr0。現在你應該清楚了吧,操作約束中會給出:到底從哪個寄存器傳遞值給cr0。
另外,需要特別說明的是,很多 文檔都聲明,所有輸出操作的操作約束必須包含一個等號(=),但GCC的文檔中卻很清楚的聲明,并非如此。因為等號(=)約束說明當前的表達式是一個 Write-Only的,但另外還有一個符號——加號(+)用來說明當前表達式是一個Read-Write的,如果一個操作約束中沒有給出這兩個符號中的 任何一個,則說明當前表達式是Read-Only的。因為對于輸出操作來說,肯定是必須是可寫的,而等號(=)和加號(+)都表示可寫,只不過加號(+) 同時也表示是可讀的。所以對于一個輸出操作來說,其操作約束只需要有等號(=)或加號(+)中的任意一個就可以了。
二者的區別是:等號(=)表示當前操作表達式指定了一個純粹的輸出操作,而加號(+)則表示當前操作表達式不僅僅只是一個輸出操作還是一個輸入操作。但無論是等號(=)約束還是加號(+)約束所約束的操作表達式都只能放在Output域中,而不能被用在Input域中。
另外,有些文檔聲明:盡管GCC文檔中提供了加號(+)約束,但在實際的編譯中通不過;我不知道老版本會怎么樣,我在GCC 2.96中對加號(+)約束的使用非常正常。
我們通過一個例子看一下,在一個輸出操作中使用等號(=)約束和加號(+)約束的不同。
cat?example2.c??int?main(int?__argc,?char*?__argv[])??{??int?cr0?=?5;???__asm__?__volatile__("movl?%%cr0,?%0":"=a"?(cr0));???return?0;??}cat?example2.c??int?main(int?__argc,?char*?__argv[])??{??int?cr0?=?5;???__asm__?__volatile__("movl?%%cr0,?%0":"=a"?(cr0));???return?0;??}?gcc -S example2.c
catexample2.smain:pushlcatexample2.smain:pushl4, %esp?
movl?5,?4(5,?4(0, %eax?
leave?
ret?
這個例子是使用等號(=)約束的情況,變量cr0被放在內存-4(%ebp)的位置,所以指令mov %eax, -4(%ebp)即表示將%eax的內容輸出到變量cr0中。
下面是使用加號(+)約束的情況:
cat?example3.c??int?main(int?__argc,?char*?__argv[])??{??int?cr0?=?5;???__asm__?__volatile__("movl?%%cr0,?%0"?:?"+a"?(cr0));???return?0;??}cat?example3.c??int?main(int?__argc,?char*?__argv[])??{??int?cr0?=?5;???__asm__?__volatile__("movl?%%cr0,?%0"?:?"+a"?(cr0));???return?0;??}?gcc -S example3.c
catexample3.smain:pushlcatexample3.smain:pushl4, %esp?
movl?5,?4(5,?4(0, %eax
leave
ret
從編譯的結果可以看出,當使用加號(+)約束的時候,cr0不僅作為輸出,還作為輸入,所使用寄存器都是寄存器約束(字母a,表示使用eax寄存器)指定的。關于寄存器約束我們后面討論。
在Output域中可以有多個輸出操作表達式,多個操作表達式中間必須用逗號(,)分開。例如:
__asm__(?
"movl %%eax, %0 \n\t"?
"pushl %%ebx \n\t"?
"popl %1 \n\t"?
"movl %1, %2"?
: "+a"(cr0), "=b"(cr1), "=c"(cr2));
2、Input
Input域的內容用來指定當前內聯匯編語句的輸入。我們看一看這個例子:
__asm__("movl %0, %%db7" : : "a" (cpu->db7));
例中Input域的內容為一個表達式"a"[cpu->db7),被稱作“輸入表達式”,用來表示一個對當前內聯匯編的輸入。
像輸出表達式一樣,一個輸入表達式也分為兩部分:帶括號的部分(cpu->db7)和帶引號的部分"a"。這兩部分對于一個內聯匯編輸入表達式來說也是必不可少的。
括 號中的表達式cpu->db7是一個C/C++語言的表達式,它不必是一個左值表達式,也就是說它不僅可以是放在C/C++賦值操作左邊的表達式, 還可以是放在C/C++賦值操作右邊的表達式。所以它可以是一個變量,一個數字,還可以是一個復雜的表達式(比如a+b/c*d)。比如上例可以改為: __asm__("movl %0, %%db7" : : "a" (foo)),__asm__("movl %0, %%db7" : : "a" (0x1000))或__asm__("movl %0, %%db7" : : "a" (va*vb/vc))。
引號號中的 部分是約束部分,和輸出表達式約束不同的是,它不允許指定加號(+)約束和等號(=)約束,也就是說它只能是默認的Read-Only的。約束中必須指定 一個寄存器約束,例中的字母a表示當前輸入變量cpu->db7要通過寄存器eax輸入到當前內聯匯編中。
我們看一個例子:
cat?example4.c??int?main(int?__argc,?char*?__argv[])??{??int?cr0?=?5;???__asm__?__volatile__("movl?%0,?%%cr0"::"a"?(cr0));???return?0;??}cat?example4.c??int?main(int?__argc,?char*?__argv[])??{??int?cr0?=?5;???__asm__?__volatile__("movl?%0,?%%cr0"::"a"?(cr0));???return?0;??}?gcc -S example4.c
catexample4.smain:pushlcatexample4.smain:pushl4, %esp?
movl?5,?4(5,?4(0, %eax?
leave?
ret?
我們從編譯出的匯編代碼可以看到,在"Instruction List"之前,GCC按照我們的輸入約束"a",將變量cr0的內容裝入了eax寄存器。
3. Operation Constraint
每一個Input和Output表達式都必須指定自己的操作約束Operation Constraint,我們這里來討論在80386平臺上所可能使用的操作約束。
1、寄存器約束
當你當前的輸入或輸入需要借助一個寄存器時,你需要為其指定一個寄存器約束。你可以直接指定一個寄存器的名字,比如:
__asm__ __volatile__("movl %0, %%cr0"::"eax" (cr0));
也可以指定一個縮寫,比如:
__asm__ __volatile__("movl %0, %%cr0"::"a" (cr0));
如果你指定一個縮寫,比如字母a,則GCC將會根據當前操作表達式中C/C++表達式的寬度決定使用%eax,還是%ax或%al。比如:
unsigned short __shrt;
__asm__ ("mov %0,%%bx" : : "a"(__shrt));
由于變量__shrt是16-bit short類型,則編譯出來的匯編代碼中,則會讓此變量使用%ex寄存器。編譯結果為:
movw -2(%ebp), %ax # %ax = __shrt
#APP
movl %ax, %bx
#NO_APP
無論是Input,還是Output操作表達式約束,都可以使用寄存器約束。
下表中列出了常用的寄存器約束的縮寫。
約束 Input/Output 意義?
r I,O 表示使用一個通用寄存器,由GCC在%eax/%ax/%al, %ebx/%bx/%bl, %ecx/%cx/%cl, %edx/%dx/%dl中選取一個GCC認為合適的。?
q I,O 表示使用一個通用寄存器,和r的意義相同。?
a I,O 表示使用%eax / %ax / %al?
b I,O 表示使用%ebx / %bx / %bl?
c I,O 表示使用%ecx / %cx / %cl?
d I,O 表示使用%edx / %dx / %dl?
D I,O 表示使用%edi / %di?
S I,O 表示使用%esi / %si?
f I,O 表示使用浮點寄存器?
t I,O 表示使用第一個浮點寄存器?
u I,O 表示使用第二個浮點寄存器?
2、內存約束?
如果一個Input/Output操作表達式的C/C++表達式表現為一個內存地址,不想借助于任何寄存器,則可以使用內存約束。比如:
__asm__ ("lidt %0" : "=m"(__idt_addr)); 或 __asm__ ("lidt %0" : :"m"(__idt_addr));
我們看一下它們分別被放在一個C源文件中,然后被GCC編譯后的結果:
cat?example5.c??//?本例中,變量sh被作為一個內存輸入??int?main(int?__argc,?char*?__argv[])??{??char*?sh?=?(char*)&__argc;???__asm__?__volatile__("lidt?%0"?:?:?"m"?(sh));???return?0;??}cat?example5.c??//?本例中,變量sh被作為一個內存輸入??int?main(int?__argc,?char*?__argv[])??{??char*?sh?=?(char*)&__argc;???__asm__?__volatile__("lidt?%0"?:?:?"m"?(sh));???return?0;??}?gcc -S example5.c
catexample5.smain:pushlcatexample5.smain:pushl4, %esp?
leal 8(%ebp), %eax?
movl %eax, -4(%ebp) # sh = (char*) &__argc
#APP?
lidt -4(%ebp)?
#NO_APP?
movl?0,0,?cat example6.c
// 本例中,變量sh被作為一個內存輸出
int main(int __argc, char* __argv[])?
{?
char* sh = (char*)&__argc;?
__asm__ __volatile__("lidt %0" : "=m" (sh));?
return 0;?
}?
gcc?Sexample6.cgcc?Sexample6.c?cat example6.s
main:
pushl %ebp
movl %esp, %ebp
subl?4,4,0, %eax
leave
ret
首先,你會注意到,在這兩個例子中,變量sh沒有借助任何寄存器,而是直接參與了指令lidt的操作。
其次,通過仔細觀察,你會發現一個驚人的事實,兩個例子編譯出來的匯編代碼是一樣的!雖然,一個例子中變量sh作為輸入,而另一個例子中變量sh作為輸出。這是怎么回事?
原來,使用內存方式進行輸入輸出時,由于不借助寄存器,所以GCC不會按照你的聲明對其作任何的輸入輸出處理。GCC只會直接拿來用,究竟對這個C/C++表達式而言是輸入還是輸出,完全依賴與你寫在"Instruction List"中的指令對其操作的指令。
由 于上例中,對其操作的指令為lidt,lidt指令的操作數是一個輸入型的操作數,所以事實上對變量sh的操作是一個輸入操作,即使你把它放在 Output域也不會改變這一點。所以,對此例而言,完全符合語意的寫法應該是將sh放在Input域,盡管放在Output域也會有正確的執行結果。
所 以,對于內存約束類型的操作表達式而言,放在Input域還是放在Output域,對編譯結果是沒有任何影響的,因為本來我們將一個操作表達式放在 Input域或放在Output域是希望GCC能為我們自動通過寄存器將表達式的值輸入或輸出。既然對于內存約束類型的操作表達式來說,GCC不會自動為 它做任何事情,那么放在哪兒也就無所謂了。但從程序員的角度而言,為了增強代碼的可讀性,最好能夠把它放在符合實際情況的地方。
約束 Input/Output 意義?
m I,O 表示使用系統所支持的任何一種內存方式,不需要借助寄存器?
3、立即數約束
如果一個Input/Output操作表達式的C/C++表達式是一個數字常數,不想借助于任何寄存器,則可以使用立即數約束。
由于立即數在C/C++中只能作為右值,所以對于使用立即數約束的表達式而言,只能放在Input域。
比如:__asm__ __volatile__("movl %0, %%eax" : : "i" (100) );?
立即數約束很簡單,也很容易理解,我們在這里就不再贅述。
約束 Input/Output 意義?
i I 表示輸入表達式是一個立即數(整數),不需要借助任何寄存器?
F I 表示輸入表達式是一個立即數(浮點數),不需要借助任何寄存器?
4、通用約束
約束 Input/Output 意義?
g I,O 表示可以使用通用寄存器,內存,立即數等任何一種處理方式。?
0,1,2,3,4,5,6,7,8,9 I 表示和第n個操作表達式使用相同的寄存器/內存。?
通 用約束g是一個非常靈活的約束,當程序員認為一個C/C++表達式在實際的操作中,究竟使用寄存器方式,還是使用內存方式或立即數方式并無所謂時,或者程 序員想實現一個靈活的模板,讓GCC可以根據不同的C/C++表達式生成不同的訪問方式時,就可以使用通用約束g。比如:
#define JUST_MOV(foo) __asm__ ("movl %0, %%eax" : : "g"(foo))
JUST_MOV(100)和JUST_MOV(var)則會讓編譯器產生不同的代碼。
int main(int __argc, char* __argv[])?
{?
JUST_MOV(100);?
return 0;?
}?
編譯后生成的代碼為:
main:?
pushl %ebp?
movl %esp, %ebp?
#APP?
movl?100,100,0, %eax?
popl %ebp?
ret
很明顯這是立即數方式。而下一個例子:
int main(int __argc, char* __argv[])?
{?
JUST_MOV(__argc);?
return 0;?
}?
經編譯后生成的代碼為:
main:?
pushl %ebp?
movl %esp, %ebp?
#APP?
movl 8(%ebp), %eax?
#NO_APP?
movl?0,0,12, %esp?
movl?8,?4(8,?4(4, -8(%ebp)?
movl?3,?12(3,?12(0, %eax?
leave?
ret?
為 了避免這種情況,我們必須向GCC聲明這一點,要求GCC為所有的Input操作表達式指定別的寄存器,方法就是在Output操作表達式"=a" (__out)的操作約束中加入&約束,由于GCC規定等號(=)約束必須放在第一個,所以我們寫作"=&a"(__out)。?
下面是我們將&約束加入之后編譯的結果:
main:?
pushl %ebp?
movl %esp, %ebp?
subl?12,12,8, -4(%ebp)?
movl?4,?8(4,?8(3, -12(%ebp)?
movl -4(%ebp), %edx #__in1使用寄存器%edx
movl -8(%ebp), %eax?
movl %eax, %ecx # __in2使用寄存器%ecx
#APP?
popl %eax?
movl %edx, %esi?
movl %ecx, %edi?
#NO_APP?
movl %eax, %eax?
movl %eax, -12(%ebp) #__out使用寄存器%eax
movl?0,0,?cat example7.c
int main(int __argc, char* __argv[])?
{?
int in = 8;?
__asm__ ("addl %0, %%ebx"?
: /* no output */?
: "a" (in) : "bx");?
return 0;?
}
gcc?O?Sexample7.cgcc?O?Sexample7.c?cat example7.s
main:
pushl %ebp
movl %esp, %ebp
pushl %ebx # %ebx內容被保存?
movl?8,8,0, %eax
movl (%esp), %ebx # %ebx內容被恢復
leave
ret
下面這個例子的C源碼與上一個例子除了沒有聲明%ebx寄存器發生了改變之外,其它都相同。
cat?example8.c??int?main(int?__argc,?char*?__argv[])??{??int?in?=?8;???__asm__?("addl?%0,?%%ebx"??:?/*?no?output?*/??:?"a"?(in)?);???return?0;??}cat?example8.c??int?main(int?__argc,?char*?__argv[])??{??int?in?=?8;???__asm__?("addl?%0,?%%ebx"??:?/*?no?output?*/??:?"a"?(in)?);???return?0;??}?gcc -O -S example8.c
catexample8.smain:pushlcatexample8.smain:pushl8, %eax?
#APP?
addl %eax, %ebx?
#NO_APP?
movl $0, %eax?
popl %ebp?
ret
仔細對比一下example7.s和example8.s,你就會明白在Clobber/Modify域聲明一個寄存器的意義。
另 外需要注意的是,如果你在Clobber/Modify域聲明了一個寄存器,那么這個寄存器將不能再被用做當前內聯匯編語句的Input/Output操 作表達式的寄存器約束,如果Input/Output操作表達式的寄存器約束被指定為"r"或"g",GCC也不會選擇已經被聲明在 Clobber/Modify中的寄存器。比如:
__asm__ ("movl %0, %%ebx" : : "a"(__foo) : "ax", "bx");
此例中,由于Output操作表達式"a"(__foo)的寄存器約束已經指定了%eax寄存器,那么再在Clobber/Modify域中指定"ax"就是非法的。編譯時,GCC會給出編譯錯誤。
除 了寄存器的內容會被改變,內存的內容也可以被修改。如果一個內聯匯編語句"Instruction List"中的指令對內存進行了修改,或者在此內聯匯編出現的地方內存內容可能發生改變,而被改變的內存地址你沒有在其Output操作表達式使用"m" 約束,這種情況下你需要使用在Clobber/Modify域使用字符串"memory"向GCC聲明:“在這里,內存發生了,或可能發生了改變”。例 如:
void * memset(void * s, char c, size_t count)
{
__asm__("cld\n\t"
"rep\n\t"
"stosb"
: /* no output */
: "a" (c),"D" (s),"c" (count)
: "cx","di","memory");
return s;
}
此 例實現了標準函數庫memset,其內聯匯編中的stosb對內存進行了改動,而其被修改的內存地址s被指定裝入%edi,沒有任何Output操作表達 式使用了"m"約束,以指定內存地址s處的內容發生了改變。所以在其Clobber/Modify域使用"memory"向GCC聲明:內存內容發生了變 動。
如果一個內聯匯編語句的Clobber/Modify域存在"memory",那么GCC會保證在此內聯匯編之前,如果某個內存的內 容被裝入了寄存器,那么在這個內聯匯編之后,如果需要使用這個內存處的內容,就會直接到這個內存處重新讀取,而不是使用被存放在寄存器中的拷貝。因為這個 時候寄存器中的拷貝已經很可能和內存處的內容不一致了。
這只是使用"memory"時,GCC會保證做到的一點,但這并不是全部。因為使用"memory"是向GCC聲明內存發生了變化,而內存發生變化帶來的影響并不止這一點。比如我們在前面講到的例子:
int main(int __argc, char* __argv[])?
{?
int* __p = (int*)__argc;?
(*__p) = 9999;?
__asm__("":::"memory");?
if((*__p) == 9999)?
return 5;?
return (*__p);?
}
本 例中,如果沒有那條內聯匯編語句,那個if語句的判斷條件就完全是一句廢話。GCC在優化時會意識到這一點,而直接只生成return 5的匯編代碼,而不會再生成if語句的相關代碼,而不會生成return (*__p)的相關代碼。但你加上了這條內聯匯編語句,它除了聲明內存變化之外,什么都沒有做。但GCC此時就不能簡單的認為它不需要判斷都知道 (*__p)一定與9999相等,它只有老老實實生成這條if語句的匯編代碼,一起相關的兩個return語句相關代碼。
當一個內聯匯編 指令中包含影響eflags寄存器中的條件標志(也就是那些Jxx等跳轉指令要參考的標志位,比如,進位標志,0標志等),那么需要在 Clobber/Modify域中使用"cc"來聲明這一點。這些指令包括adc, div,popfl,btr,bts等等,另外,當包含call指令時,由于你不知道你所call的函數是否會修改條件標志,為了穩妥起見,最好也使用 "cc"。
我很少在相關資料中看到有關"cc"的確切用法,只有一份文檔提到了它,但還不是i386平臺的,只是說"cc"是處理器平臺 相關的,并非所有的平臺都支持它,但即使在不支持它的平臺上,使用它也不會造成編譯錯誤。我做了一些實驗,但發現使用"cc"和不使用"cc"所生成的代 碼沒有任何不同。但Linux 2.4的相關代碼中用到了它。如果誰知道在i386平臺上"cc"的細節,請和我聯系。
另外,還可以在 Clobber/Modify域指定數字0到9,以聲明第n個Input/Output操作表達式所使用的寄存器發生了變化,但正如我們在前面所提到的, 如果你為某個Input/Output操作表達式指定了寄存器,或使用"g","r"等約束讓GCC為其選擇寄存器,GCC已經知道哪個寄存器內容發生了 變化,所以這么做沒有什么意義;我也作了相關的試驗,沒有發現使用它會對GCC生成的匯編代碼有任何影響,至少在i386平臺上是這樣。Linux 2.4的所有i386平臺相關內聯匯編代碼中都沒有使用這一點,但S390平臺相關代碼中有用到,但由于我對S390匯編沒有任何概念,所以,也不知道這 么做的意義何在。
本文轉自張昺華-sky博客園博客,原文鏈接:http://www.cnblogs.com/sky-heaven/p/5283240.html,如需轉載請自行聯系原作者
新人創作打卡挑戰賽發博客就能抽獎!定制產品紅包拿不停!
總結
以上是生活随笔為你收集整理的C语言ASM汇编内嵌语法【转】的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ubuntu16.04中使用搜狗输入法Q
- 下一篇: 无线电波的入侵第1部分——无线电频率基础