线程安全与可重入函数
線程安全:一個函數被稱為線程安全的(thread-safe),當且僅當被多個并發進程反復調用時,它會一直產生正確的結果。如果一個函數不是線程安全的,我們就說它是線程不安全的(thread-unsafe)。我們定義四類(有相交的)線程不安全函數。
第1類:不保護共享變量的函數
將這類線程不安全函數變為線程安全的,相對比較容易:利用像P和V操作這樣的同步操作來保護共享變量。這個方法的優點是在調用程序中不需要做任何修改,缺點是同步操作將減慢程序的執行時間。
第2類:保持跨越多個調用的狀態函數
一個偽隨機數生成器是這類不安全函數的簡單例子。
unsigned int next = 1; int rand(void) {next = next * 1103515245 + 12345;return (unsigned int) (next / 65536) % 32768; }void srand(unsigned int seed) {next = seed; }rand函數是線程不安全的,因為當前調用的結果依賴于前次調用的中間結果。當我們調用srand為rand設置了一個種子后,我們反復從一個單線程中調用rand,我們能夠預期一個可重復的隨機數字序列。但是,如果有多個線程同時調用rand函數,這樣的假設就不成立了。
使得rand函數變為線程安全的唯一方式是重寫它,使得它不再使用任何靜態數據,取而代之地依靠調用者在參數中傳遞狀態信息。這樣的缺點是,程序員現在要被迫改變調用程序的代碼。
第3類:返回指向靜態變量指針的函數
某些函數(如gethostbyname)將計算結果放在靜態結構中,并返回一個指向這個結構的指針。如果我們從并發線程中調用這些函數,那么將可能發生災難,因為正在被一個線程使用的結果會被另一個線程悄悄地覆蓋了。
有兩種方法來處理這類線程不安全函數。一種是選擇重寫函數,使得調用者傳遞存放結果的結構地址。這就消除了所有共享數據,但是它要求程序員還要改寫調用者的代碼。
如果線程不安全函數是難以修改或不可修改的(例如,它是從一個庫中鏈接過來的),那么另外一種選擇就是使用lock-and-copy(加鎖-拷貝)技術。這個概念將線程不安全函數與互斥鎖聯系起來。在每個調用位置,對互斥鎖加鎖,調用函數不安全函數,動態地為結果非配存儲器,拷貝函數返回的結果到這個存儲器位置,然后對互斥鎖解鎖。一個吸引人的變化是定義了一個線程安全的封裝(wrapper)函數,它執行lock-and-copy,然后調用這個封轉函數來取代所有線程不安全的函數。例如下面的gethostbyname的線程安全函數。
struct hostent* gethostbyname_ts(char* host) {struct hostent* shared, * unsharedp;unsharedp = Malloc(sizeof(struct hostent));P(&mutex)shared = gethostbyname(hostname);*unsharedp = * shared;V(&mutex);return unsharedp; }第4類:調用線程不安全函數的函數
如果函數f調用線程不安全函數g,那么f就是線程不安全的嗎?不一定。如果g是類2類函數,即依賴于跨越多次調用的狀態,那么f也是不安全的,而且除了重寫g以外,沒有什么辦法。然而如果g是第1類或者第3類函數,那么只要用互斥鎖保護調用位置和任何得到的共享數據,f可能仍然是線程安全的。比如上面的gethostbyname_ts。
可重入函數
可重入函數:可重入函數是線程安全函數的一種,其特點在于它們被多個線程調用時,不會引用任何共享數據。
可重入函數通常要比不可重入的線程安全函數效率高一些,因為它們不需要同步操作。更進一步說,將第2類線程不安全函數轉化為線程安全函數的唯一方法就是重寫它,使之可重入。
下面為rand函數的一個可重入版本
顯式可重入函數:如果所有函數的參數都是傳值傳遞的(沒有指針),并且所有的數據引用都是本地的自動棧變量(也就是說沒有引用靜態或全局變量),那么函數就是顯示可重入的,也就是說不管如何調用,我們都可斷言它是可重入的。
隱式可重入函數:可重入函數中的一些參數是引用傳遞(使用了指針),也就是說,在調用線程小心地傳遞指向非共享數據的指針時,它才是可重入的。例如rand_r就是隱式可重入的。
我們使用可重入(reentrant)來包括顯式可重入函數和隱式可重入函數。然而,可重入性有時是調用者和被調用者共有的屬性,并不只是被調用者單獨的屬性。
?
c語言非線程安全函數引發的BUG一列
公司的機器最近遇到一個bug(其實這個bug一年前就出現過,只是未引起重視),現象是這樣的:在生產環境中,用戶連續打印票的時候,中間某張票的一個時間可能會出問題,該時間本來是一個未來的時間,卻被打印成了系統當前的時間.其他同事認為是傳入的參數出錯了,加了大量的調試信息和日志進去,結果去令人掉眼鏡,傳入的參數是完全正確的,但是結果去不是預期的.
最終排查BUG的任務轉到了我手里,我簡單分析了下上層流程,并無問題,于是把問題定位在底層庫的FormatTime函數上,于是要了份FormatTime的代碼查看(吐槽下,封閉的代碼庫往往造就一些隱蔽的問題),FormatTime的實現很簡單,調用localtime函數,然后格式化輸出,查看localtime函數的原型,如下
| struct?tm?*localtime(const?time_t?*timep); |
問題就出在localtime這個函數上,從函數原型來看,這個函數返回了一個struct tm的指針,但是傳入參數并未有傳入tm參數,那么就有3種情況
1,tm是內部malloc出來的
2,tm是一個全局變量
3,tm是一個局部static
第一種情可以首先排除,因為調用完localtime后沒要求free tm,或者提供相應的free函數,第2 3種情況可以視為一種情況,那即是:使用了內部全局變量!
那么問題就來了,這個函數是個非線程安全的函數,在多線程的環境下使用,會發生重入的情況,即如果兩個線程同時調用localtime函數,函數的返回結果都會是最后一次調用localtime的結果.這是一個典型的函數重入BUG.解決方法:使用線程安全的localtime_r函數替換localtime.至此,問題解決
c語言中有不少函數都是非線程安全的,例如strtok,gethostbyname,看到返回值為指針類型的函數時,都要留個心眼.
總結
以上是生活随笔為你收集整理的线程安全与可重入函数的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: C 中 static 的常见作用
- 下一篇: C语言内存字节对齐小结