strtok 函数
?
C 庫函數(shù) -?strtok()
C 標(biāo)準(zhǔn)庫 - <string.h>
描述
C 庫函數(shù)?char *strtok(char *str, const char *delim)?分解字符串?str?為一組字符串,delim?為分隔符。
聲明
下面是 strtok() 函數(shù)的聲明。
char *strtok(char *str, const char *delim)參數(shù)
- str?-- 要被分解成一組小字符串的字符串。
- delim?-- 包含分隔符的 C 字符串。
返回值
該函數(shù)返回被分解的第一個子字符串,如果沒有可檢索的字符串,則返回一個空指針。
實例
下面的實例演示了 strtok() 函數(shù)的用法。
實例
#include <string.h> #include <stdio.h> int main () { char str[80] = "This is - www.runoob.com - website"; const char s[2] = "-"; char *token; /* 獲取第一個子字符串 */ token = strtok(str, s); /* 繼續(xù)獲取其他的子字符串 */ while( token != NULL ) { printf( "%s\n", token ); token = strtok(NULL, s); } return(0); }
讓我們編譯并運行上面的程序,這將產(chǎn)生以下結(jié)果:
This is www.runoob.com website===================================================
?
strtok()函數(shù)的使用以及注意事項
?
一、函數(shù)的簡介
???????? 函數(shù)原型:char *strtok(char *s, char *delim)
?????? ? 功能:作用于字符串s,以delim中的字符為分界符,將s切分成一個個子串;如果,s為空值NULL,則函數(shù)保存的指針SAVE_PTR在下一次調(diào)用中將作為起始位置。
???????? 返回值:分隔符匹配到的第一個子串
二、主要內(nèi)容
????????1、函數(shù)的作用是分解字符串,所謂分解,即沒有生成新串,只是在s所指向的內(nèi)容首次出現(xiàn)分界符的位置,將分界符修改成了'/0’,故第一次用strtok()返回第一個子串
???????? 2、第一次提取子串完畢之后,繼續(xù)對源字符串s進行提取,應(yīng)在其后(第二次,第三次。。。第n次)的調(diào)用中將strtok的第一個參數(shù)賦為空值NULL(表示函數(shù)繼續(xù)從上?? 一次調(diào)用隱式保存的位置,繼續(xù)分解字符串;對于前一次次調(diào)用來說,第一次調(diào)用結(jié)束前用一個this指針指向了分界符的下一位)
?????? ? 3、當(dāng)this指針指向“\0” 時,即沒有被分割的子串了,此時則返回NULL
???????? 4、可以把delim理解為分隔符的集合,delim中的字符均可以作為分隔符。
?????? ? 5、strtok在調(diào)用的時候,如果起始位置即為分隔符,則忽略了起始位置開始的分隔符
?
三、使用strtok需要注意的有以下幾點:
?
1.函數(shù)的作用是分解字符串,所謂分解,即沒有生成新串,只是在s所指向的內(nèi)容上做了些手腳而已。因此,源字符串s發(fā)生了變化!
設(shè)源字符串s為 char buffer[INFO_MAX_SZ]=",Fred male 25,John male 62,Anna female 16";? 過濾字符串delim為 char *delim = " ",即空格為分界符。
?
上圖的代碼會產(chǎn)生這樣的結(jié)果:
首先,buffer發(fā)生了變化。如果此時打印buffer的值,會顯示“,Fred”,而后面" male 25…16”不翼而飛了。實際上,strtok函數(shù)根據(jù)delim中的分界符,找到其首次出現(xiàn)的位置,即Fred后面那個空格(buffer[5]),將其修改成了'/0’。其余位置不變。這就很好解釋為什么打印buffer的值只能出現(xiàn)“,Fred”,而非buffer中的全部內(nèi)容了。因此,使用strtok時一定要慎重,以防止源字符串被修改。?
理解了buffer的變化,就很好解釋函數(shù)的返回值了。返回值buf為分界符之前的子串(其實這個說法并不確切,詳見"3”中對于返回值的詳細(xì)說明)。注意,由變量的地址可知,buf依然指向源字符串。
?
分界符delim沒有發(fā)生變化,就不再截圖了。
?
2.若要在第一次提取子串完畢之后,繼續(xù)對源字符串s進行提取,應(yīng)在其后(第二次,第三次。。。第n次)的調(diào)用中將strtok的第一個參數(shù)賦為空值NULL。
?
第一次調(diào)用的結(jié)果如前文所述,提取出了",Fred”。我們還想繼續(xù)以空格為分界,提取出后面的"male”等。由上圖可以看到,第一次之后的調(diào)用我們都給strtok的第一個參數(shù)傳遞了空值NULL(表示函數(shù)繼續(xù)從上一次調(diào)用隱式保存的位置,繼續(xù)分解字符串;對于上述的第二次調(diào)用來說,第一次調(diào)用結(jié)束前用一個this指針指向了分界符的下一位,即'm’所在的位置),這樣可依次提取出
?,?。。。。以此類推。。。。。
至于為什么要賦空值,要么你就記住結(jié)論,要么去查strtok的源代碼。本文的最后會有一些介紹。
當(dāng)然也有部分愛鉆牛角尖的人,非不按套路出牌,要看看不賦空值繼續(xù)賦值為buffer會有什么結(jié)果。其實,答案想也能想的到。再一次傳遞buffer,相當(dāng)于還從字符串的開頭查找分界符delim,而且此時buffer已經(jīng)被修改(可見的部分只剩下",Fred”),因此,其結(jié)果必然是找不到分界符delim。
?
3.關(guān)于函數(shù)返回值的探討
由"1”中所述,在提取到子串的情況下,strtok的返回值(假設(shè)返回值賦給了指針buf)是提取出的子串的指針。這個指針指向的是子串在源字符串中的起始位置。子串末尾的下一個字符在提取前為分隔符,提取后被修改成了'/0’。因此,若打印buf的值,可以成功的輸出子串的內(nèi)容。
在沒有提取到子串的情況下,函數(shù)會返回什么值呢?
?
由上圖可以看到buffer中并不包含分界符delim。調(diào)用strtok后buf的值為
?
因為沒有找到,源字符串buffer沒有發(fā)生改變,buf指向源字符串的首地址,打印輸出的值為整個字符串的完整值。
什么時候函數(shù)的返回值為空值NULL呢?
百度百科上說,“當(dāng)沒有被分割的串時則返回NULL。”這是一個很模棱兩可的說法。如果想要確切的了解清楚這個問題,可能需要看一下strtok的實現(xiàn)原理。這里先以實驗說明。
?
第一次調(diào)用strtok,毫無疑問,buf指向",Fred”。
第二次調(diào)用strtok,由于第一個參數(shù)為NULL,表示函數(shù)繼續(xù)以上次調(diào)用所保存的this指針的位置開始分解,即對"male 25”分解。分解完畢后,buf指向"male”。
第三次調(diào)用strtok,參數(shù)繼續(xù)設(shè)定為NULL,此時即對第二次保存的this指針的位置開始分解,即對"25”分解。因為無法找到包含分隔符delim的子串,所以buf指向"25”。
第四次調(diào)用,參數(shù)仍為NULL,此時第三次調(diào)用保存的this指針已指向字符串的末尾'/0’,已無法再進行分解。因此函數(shù)返回NULL,這也就是百度百科中所提到的“當(dāng)沒有被分割的串時函數(shù)返回NULL。”
?
4.參數(shù) 分隔符delim的探討(delim是分隔符的集合)
很多人在使用strtok的時候,都想當(dāng)然的以為函數(shù)在分割字符串時完整匹配分隔符delim,比如delim=”ab”,則對于"acdab”這個字符串,函數(shù)提取出的是"acd”。至少我在第一次使用的時候也是這么認(rèn)為的。其實我們都錯了,我是在看函數(shù)的源代碼時才發(fā)現(xiàn)這個問題的,且看下面的例子。
源字符串為buffer,分隔符delim為 逗號和空格,按照一般的想法我們會以為調(diào)用函數(shù)后,buf的值為"Fred,male,25”,結(jié)果是這樣么?
第一次調(diào)用之后的結(jié)果竟然是"Fred”,而非我們所想的結(jié)果。這是為什么呢?
我們回到GNU C Library中對strtok的功能定義:“Parse S into tokens separated by characters in DELIM”。也就是說包含在delim中的字符均可以作為分隔符,而非嚴(yán)格匹配。可以把delim理解為分隔符的集合。這一點是非常重要的~
當(dāng)然,我們在分解字符串的時候,很少使用多個分隔符。這也導(dǎo)致,很多人在寫例子的時候只討論了一個分隔符的情況。有更多的人在看例子的時候也就錯誤的認(rèn)識了delim的作用。
?
?
5.待分解的字符串,首字符就為分隔符
首字符為分隔符不能算作一個很特殊的情況。按照常規(guī)的分解思路也能正確分解字符串。
我想說明的是,strtok對于這種情況采用了比常規(guī)處理更快的方式。
如上圖例子所示。僅用一次調(diào)用就可以得到以逗號分隔的字符串"Fred male 25”,而F前面的','被忽略了。由此可見,strtok在調(diào)用的時候忽略了起始位置開始的分隔符。這一點,可以從strtok的源代碼得到證實。
?
6.不能向第一個參數(shù)傳遞字符串常量!
本文中所舉的例子都將源字符串保存為字符串?dāng)?shù)組變量。若你將源字符串定義成字符串常量,可想而知,程序會因為strtok函數(shù)試圖修改源字符串的值,而拋出異常。
?
?
總結(jié)
- 上一篇: 我的K均值算法的matlab实现
- 下一篇: 中地数码集团笔试题