當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

线程安全与可重入函数

發布時間：2024/4/18 编程问答 42 豆豆

生活随笔收集整理的這篇文章主要介紹了线程安全与可重入函数小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

線程安全：一個函數被稱為線程安全的（thread-safe），當且僅當被多個并發進程反復調用時，它會一直產生正確的結果。如果一個函數不是線程安全的，我們就說它是線程不安全的（thread-unsafe）。我們定義四類（有相交的）線程不安全函數。

第1類：不保護共享變量的函數

將這類線程不安全函數變為線程安全的，相對比較容易：利用像P和V操作這樣的同步操作來保護共享變量。這個方法的優點是在調用程序中不需要做任何修改，缺點是同步操作將減慢程序的執行時間。

第2類：保持跨越多個調用的狀態函數

一個偽隨機數生成器是這類不安全函數的簡單例子。

unsigned int next = 1; int rand(void) {next = next * 1103515245 + 12345;return (unsigned int) (next / 65536) % 32768; }void srand(unsigned int seed) {next = seed; }

rand函數是線程不安全的，因為當前調用的結果依賴于前次調用的中間結果。當我們調用srand為rand設置了一個種子后，我們反復從一個單線程中調用rand，我們能夠預期一個可重復的隨機數字序列。但是，如果有多個線程同時調用rand函數，這樣的假設就不成立了。

使得rand函數變為線程安全的唯一方式是重寫它，使得它不再使用任何靜態數據，取而代之地依靠調用者在參數中傳遞狀態信息。這樣的缺點是，程序員現在要被迫改變調用程序的代碼。

第3類：返回指向靜態變量指針的函數

某些函數（如gethostbyname）將計算結果放在靜態結構中，并返回一個指向這個結構的指針。如果我們從并發線程中調用這些函數，那么將可能發生災難，因為正在被一個線程使用的結果會被另一個線程悄悄地覆蓋了。

有兩種方法來處理這類線程不安全函數。一種是選擇重寫函數，使得調用者傳遞存放結果的結構地址。這就消除了所有共享數據，但是它要求程序員還要改寫調用者的代碼。

如果線程不安全函數是難以修改或不可修改的（例如，它是從一個庫中鏈接過來的），那么另外一種選擇就是使用lock-and-copy（加鎖-拷貝）技術。這個概念將線程不安全函數與互斥鎖聯系起來。在每個調用位置，對互斥鎖加鎖，調用函數不安全函數，動態地為結果非配存儲器，拷貝函數返回的結果到這個存儲器位置，然后對互斥鎖解鎖。一個吸引人的變化是定義了一個線程安全的封裝（wrapper）函數，它執行lock-and-copy，然后調用這個封轉函數來取代所有線程不安全的函數。例如下面的gethostbyname的線程安全函數。

struct hostent* gethostbyname_ts(char* host) {struct hostent* shared, * unsharedp;unsharedp = Malloc(sizeof(struct hostent));P(&mutex)shared = gethostbyname(hostname);*unsharedp = * shared;V(&mutex);return unsharedp; }

第4類：調用線程不安全函數的函數

如果函數f調用線程不安全函數g，那么f就是線程不安全的嗎？不一定。如果g是類2類函數，即依賴于跨越多次調用的狀態，那么f也是不安全的，而且除了重寫g以外，沒有什么辦法。然而如果g是第1類或者第3類函數，那么只要用互斥鎖保護調用位置和任何得到的共享數據，f可能仍然是線程安全的。比如上面的gethostbyname_ts。

可重入函數

可重入函數：可重入函數是線程安全函數的一種，其特點在于它們被多個線程調用時，不會引用任何共享數據。
可重入函數通常要比不可重入的線程安全函數效率高一些，因為它們不需要同步操作。更進一步說，將第2類線程不安全函數轉化為線程安全函數的唯一方法就是重寫它，使之可重入。

下面為rand函數的一個可重入版本

int rand_r(unsigned int* nextp) {*nextp = *nextp * 1103515245 + 12345;return (unsigned int) (*nextp / 65536) % 32768; }

顯式可重入函數：如果所有函數的參數都是傳值傳遞的（沒有指針），并且所有的數據引用都是本地的自動棧變量（也就是說沒有引用靜態或全局變量），那么函數就是顯示可重入的，也就是說不管如何調用，我們都可斷言它是可重入的。

隱式可重入函數：可重入函數中的一些參數是引用傳遞（使用了指針），也就是說，在調用線程小心地傳遞指向非共享數據的指針時，它才是可重入的。例如rand_r就是隱式可重入的。
我們使用可重入（reentrant）來包括顯式可重入函數和隱式可重入函數。然而，可重入性有時是調用者和被調用者共有的屬性，并不只是被調用者單獨的屬性。

c語言非線程安全函數引發的BUG一列

　　公司的機器最近遇到一個bug(其實這個bug一年前就出現過,只是未引起重視),現象是這樣的:在生產環境中,用戶連續打印票的時候,中間某張票的一個時間可能會出問題,該時間本來是一個未來的時間,卻被打印成了系統當前的時間.其他同事認為是傳入的參數出錯了,加了大量的調試信息和日志進去,結果去令人掉眼鏡,傳入的參數是完全正確的,但是結果去不是預期的.

　　最終排查BUG的任務轉到了我手里,我簡單分析了下上層流程,并無問題,于是把問題定位在底層庫的FormatTime函數上,于是要了份FormatTime的代碼查看(吐槽下,封閉的代碼庫往往造就一些隱蔽的問題),FormatTime的實現很簡單,調用localtime函數,然后格式化輸出,查看localtime函數的原型,如下

struct?tm?*localtime(const?time_t?*timep);

　　問題就出在localtime這個函數上,從函數原型來看,這個函數返回了一個struct tm的指針,但是傳入參數并未有傳入tm參數,那么就有3種情況

1,tm是內部malloc出來的

2,tm是一個全局變量

3,tm是一個局部static

　　第一種情可以首先排除,因為調用完localtime后沒要求free tm,或者提供相應的free函數,第2 3種情況可以視為一種情況,那即是:使用了內部全局變量!

　　那么問題就來了,這個函數是個非線程安全的函數,在多線程的環境下使用,會發生重入的情況,即如果兩個線程同時調用localtime函數,函數的返回結果都會是最后一次調用localtime的結果.這是一個典型的函數重入BUG.解決方法:使用線程安全的localtime_r函數替換localtime.至此,問題解決

　　c語言中有不少函數都是非線程安全的,例如strtok,gethostbyname,看到返回值為指針類型的函數時,都要留個心眼.

總結

以上是生活随笔為你收集整理的线程安全与可重入函数的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： C 中 static 的常见作用
下一篇： C语言内存字节对齐小结