c语言数组在栈上的分配,彻底弄懂为什么不能把栈上分配的数组(字符串)作为返回值...
背景
最近準備從 C 語言零基礎到 PHP 擴展開發實戰,案例的過程中準備了如下代碼碎片,演示解析http scheme
#include
#include
#include
char *parse_scheme(const char *url)
{
char *p = strstr(url,"://");
return strndup(url,p-url);
}
int main()
{
const char *url = "http://static.mengkang.net/upload/image/2019/0907/1567834464450406.png";
char *scheme = parse_scheme(url);
printf("%s\n",scheme);
free(scheme);
return 0;
}
上面是通過strndup的方式,背后也依托了malloc,所以最后也需要free。
有人在微信群私信parse_scheme能用char []來做返回值嗎?我們知道棧上的數組也能用來存儲字符串,那我們可以改寫成下面這樣嗎?
char *parse_scheme(const char *url)
{
char *p = strstr(url,"://");
long l = p - url + 1;
char scheme[l];
strncpy(scheme, url, l-1);
return scheme;
}
大多數人都知道不能這樣寫,因為返回的是棧上的地址,當從該函數返回之后,那段棧空間的操作權也釋放了,當再次使用該地址的時候,值就是不確定的了。
那我們今天就一起探討下出現這樣情況的背后的真正原理。
基礎預備
每個函數運行的時候因為需要內存來存放函數參數以及局部變量等,需要給每個函數分配一段連續的內存,這段內存就叫做函數的棧幀(Stack Frame)。
因為是一塊連續的內存地址,所以叫幀;為什么叫要加一個棧呢?
想必大家都熟悉了函數調用棧,為什么叫函數調用棧呢?比如下面的表達式
array_values(explode(",",file_get_contents(...)));
函數的執行順序是最內層的函數最先執行,然后依次返回執行外層的函數。所以函數的執行就是利用了棧的數據結構,所以就叫棧幀。
x86_64 cpu上的 rbp 寄存器存函數棧底地址,rsp 寄存器存函數棧頂地址。
實驗
#include
void foo(void)
{
int i;
printf("%d\n", i);
i = 666;
}
int main(void)
{
foo();
foo();
return 0;
}
$gcc -g 2.c
$./a.out
0
666
為什么第二次調用foo函數輸出的結果都是上次函數調用的賦值呢?先看下反匯編之后的代碼
000000000040052d :
#include
void foo(void)
{
40052d: 55 push %rbp
40052e: 48 89 e5 mov %rsp,%rbp
400531: 48 83 ec 10 sub $0x10,%rsp
int i;
printf("%d\n", i);
400535: 8b 45 fc mov -0x4(%rbp),%eax
400538: 89 c6 mov %eax,%esi
40053a: bf 00 06 40 00 mov $0x400600,%edi
40053f: b8 00 00 00 00 mov $0x0,%eax
400544: e8 c7 fe ff ff callq 400410
i = 666;
400549: c7 45 fc 9a 02 00 00 movl $0x29a,-0x4(%rbp)
}
400550: c9 leaveq
400551: c3 retq
0000000000400552 :
int main(void)
{
400552: 55 push %rbp
400553: 48 89 e5 mov %rsp,%rbp
foo();
400556: e8 d2 ff ff ff callq 40052d
foo();
40055b: e8 cd ff ff ff callq 40052d
return 0;
400560: b8 00 00 00 00 mov $0x0,%eax
}
400565: 5d pop %rbp
400566: c3 retq
400567: 66 0f 1f 84 00 00 00 nopw 0x0(%rax,%rax,1)
40056e: 00 00
理論分析
第一次進入 foo函數前后
在進入foo函數之前,因為main里沒有參數也沒有局部變量,所以,main 的棧幀的長度就是0,rbp和rsp相等(0x7fffffffe2c0)。當執行
callq 40052d
會把main函數的在調用foo之后需要返回執行的下一行代碼的地址壓棧,因為是64位機器,地址8字節。
進入foo之后
push %rbp
把rbp的值壓棧,因為也是存的地址,所以又占了8字節,所以當初始化foo函數的rbp的時候
mov %rsp,%rbp
rsp已經在原來的基礎上加了16字節,所以從0x7fffffffe2c0變成了0x7fffffffe2b0。
sub $0x10,%rsp
因為foo函數里面局部變量,編譯的時候就預留了16字節,所以rsp變為了0x7fffffffe2a0
最后執行了
movl $0x29a,-0x4(%rbp)
將666放在了0x7fffffffe2ac,當第二次調用的時候,打印i的匯編代碼如下
printf("%d\n", i);
400535: 8b 45 fc mov -0x4(%rbp),%eax
400538: 89 c6 mov %eax,%esi
40053a: bf 00 06 40 00 mov $0x400600,%edi
40053f: b8 00 00 00 00 mov $0x0,%eax
400544: e8 c7 fe ff ff callq 400410
第二次進入 foo函數前后
因為上次-0x4(%rbp)存了666,而第二次調用foo的rbp的值又和第一次一樣,所以是一個地址。所以666就被打印出來了。
回到主題
#include
#include
#include
char *parse_scheme(const char *url)
{
char *p = strstr(url,"://");
long l = p - url + 1;
char scheme[l];
strncpy(scheme, url, l-1);
printf("%s\n",scheme);
return scheme;
}
int main()
{
const char *url = "http://static.mengkang.net/upload/image/2019/0907/1567834464450406.png";
char *scheme = parse_scheme(url);
printf("%s\n",scheme);
return 0;
}
調試信息如下,當從parse_scheme返回時,打印scheme的結果還是http,但是當我們調用printf之后,和上面樣例中一樣,parse_scheme出棧,printf入棧,則棧上內存就又替換了,所以打印出來的結果則不一定是http了。
《新程序員》:云原生和全面數字化實踐50位技術專家共同創作,文字、視頻、音頻交互閱讀總結
以上是生活随笔為你收集整理的c语言数组在栈上的分配,彻底弄懂为什么不能把栈上分配的数组(字符串)作为返回值...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: c语言fopen函数打不开,[讨论]用f
- 下一篇: c语言在keil上程序合并,keil中怎