DRD:线程错误检测器
目錄
8.1。概觀要使用此工具,必須--tool=drd?在Valgrind命令行上指定?。
8.1。概觀
DRD是用于檢測(cè)多線程C和C ++程序中的錯(cuò)誤的Valgrind工具。該工具適用于使用POSIX線程原語(yǔ)的任何程序,或者使用構(gòu)建在POSIX線程圖元之上的線程概念。
8.1.1。多線程編程范例
在程序中使用多線程有兩個(gè)可能的原因:
-
模擬并發(fā)活動(dòng)。與單個(gè)線程中多個(gè)活動(dòng)的狀態(tài)復(fù)用相比,將一個(gè)線程分配給每個(gè)活動(dòng)可以是一個(gè)很好的簡(jiǎn)化。這就是為什么大多數(shù)服務(wù)器軟件和嵌入式軟件都是多線程的。
-
同時(shí)使用多個(gè)CPU內(nèi)核來(lái)加速計(jì)算。這就是為什么許多高性能計(jì)算(HPC)應(yīng)用程序是多線程的。
多線程程序可以使用以下一個(gè)或多個(gè)編程范例。哪個(gè)范例適合取決于應(yīng)用程序類型。多線程編程范例的一些例子是:
-
鎖定。通過(guò)線程共享的數(shù)據(jù)可以通過(guò)鎖定進(jìn)行并發(fā)訪問(wèn)。例如POSIX線程庫(kù),Qt庫(kù)和Boost.Thread庫(kù)直接支持該范例。
-
消息傳遞。線程之間沒有共享數(shù)據(jù),但線程通過(guò)相互傳遞消息來(lái)交換數(shù)據(jù)。消息傳遞范例的實(shí)現(xiàn)示例是MPI和CORBA。
-
自動(dòng)并行化?編譯器將順序程序轉(zhuǎn)換為多線程程序。原始程序可能包含也可能不包含并行化提示。這種并行化提示的一個(gè)例子是OpenMP標(biāo)準(zhǔn)。在本標(biāo)準(zhǔn)中,定義了一組指令,告訴編譯器如何并行化C,C ++或Fortran程序。OpenMP非常適合于計(jì)算密集型應(yīng)用。例如,開源圖像處理軟件包正在使用OpenMP來(lái)最大化具有多個(gè)CPU內(nèi)核的系統(tǒng)的性能。GCC支持4.2.0版的OpenMP標(biāo)準(zhǔn)。
-
軟件事務(wù)內(nèi)存(STM)。通過(guò)事務(wù)更新線程之間共享的任何數(shù)據(jù)。每個(gè)交易之后,驗(yàn)證是否存在任何沖突的交易。如果存在沖突,則該事務(wù)被中止,否則就被提交。這是一種所謂的樂(lè)觀態(tài)度。有一個(gè)支持STM的Intel C ++編譯器的原型。關(guān)于向海灣合作委員會(huì)增加STM支持的研究正在進(jìn)行之中。
只要這些范例的實(shí)現(xiàn)基于POSIX線程圖元,DRD就支持多線程編程范例的任何組合。然而,DRD不支持直接使用例如Linux'futexes的程序。嘗試用DRD分析這些程序?qū)?dǎo)致DRD報(bào)告許多假陽(yáng)性。
8.1.2。POSIX線程編程模型
POSIX線程,也稱為Pthreads,是Unix系統(tǒng)上最廣泛使用的線程庫(kù)。
POSIX線程編程模型基于以下抽象:
-
共享地址空間。在同一進(jìn)程內(nèi)運(yùn)行的所有線程共享相同的地址空間。所有數(shù)據(jù)(無(wú)論是否共享)都由其地址標(biāo)識(shí)。
-
定期加載和存儲(chǔ)操作,允許從同一進(jìn)程中運(yùn)行的所有線程共享的內(nèi)存讀取值或向其寫入值。
-
原子存儲(chǔ)和加載修改存儲(chǔ)操作。雖然這些在POSIX線程標(biāo)準(zhǔn)中沒有提及,但大多數(shù)微處理器都支持原子內(nèi)存操作。
-
線程。每個(gè)線程表示并發(fā)活動(dòng)。
-
同步對(duì)象和這些同步對(duì)象的操作。在POSIX線程標(biāo)準(zhǔn)中定義了以下類型的同步對(duì)象:互斥體,條件變量,信號(hào)量,讀寫器同步對(duì)象,障礙和自旋鎖。
哪些源代碼語(yǔ)句生成哪些內(nèi)存訪問(wèn)取決于正在使用的編程語(yǔ)言的內(nèi)存模型。C和C ++語(yǔ)言還沒有一個(gè)確定的內(nèi)存模型。對(duì)于內(nèi)存模型草案,另見文檔?WG21 / N2338:并發(fā)內(nèi)存模型編譯器的后果。
有關(guān)POSIX線程的更多信息,另請(qǐng)參閱單一UNIX規(guī)范版本3,也稱為?IEEE Std 1003.1。
8.1.3。多線程編程問(wèn)題
根據(jù)程序中使用的多線程范例,可能會(huì)出現(xiàn)以下一個(gè)或多個(gè)問(wèn)題:
-
數(shù)據(jù)競(jìng)賽?一個(gè)或多個(gè)線程訪問(wèn)相同的內(nèi)存位置,而沒有足夠的鎖定。大多數(shù)但不是所有的數(shù)據(jù)競(jìng)賽都是編程錯(cuò)誤,并且是微妙和難以發(fā)現(xiàn)的錯(cuò)誤的原因。
-
鎖定爭(zhēng)用?一個(gè)線程通過(guò)持有鎖太長(zhǎng)來(lái)阻止一個(gè)或多個(gè)其他線程的進(jìn)度。
-
不正確的使用POSIX線程API。POSIX線程API的大多數(shù)實(shí)現(xiàn)已針對(duì)運(yùn)行速度進(jìn)行了優(yōu)化。這樣的實(shí)現(xiàn)不會(huì)對(duì)某些錯(cuò)誤抱怨,例如當(dāng)互斥體被另一個(gè)線程解鎖時(shí),而不是獲得互斥鎖上的鎖的線程。
-
僵局。當(dāng)兩個(gè)或多個(gè)線程無(wú)限期地等待彼此時(shí),會(huì)發(fā)生死鎖。
-
虛假分享?如果在不同處理器核心上運(yùn)行的線程經(jīng)常訪問(wèn)位于同一高速緩存行中的不同變量,那么由于高速緩存線的頻繁交換,這將減慢涉及的線程。
盡管數(shù)據(jù)競(jìng)賽發(fā)生的可能性可以通過(guò)有紀(jì)律的編程風(fēng)格來(lái)降低,但是在開發(fā)多線程軟件時(shí),必須使用自動(dòng)檢測(cè)數(shù)據(jù)競(jìng)賽的工具。DRD可以檢測(cè)這些,以及鎖定爭(zhēng)用和不正確使用POSIX線程API。
8.1.4。數(shù)據(jù)競(jìng)賽檢測(cè)
由多線程程序執(zhí)行的加載和存儲(chǔ)操作的結(jié)果取決于執(zhí)行內(nèi)存操作的順序。此訂單由以下決定:
由同一線程執(zhí)行的所有存儲(chǔ)器操作都按?程序順序執(zhí)行,即由程序源代碼確定的順序和先前加載操作的結(jié)果。
同步操作確定由不同線程執(zhí)行的存儲(chǔ)器操作的某些排序約束。這些排序約束稱為同步順序。
程序順序和同步順序的組合稱為?發(fā)生之前的關(guān)系。這一概念首先由S.Adve等人在“?檢測(cè)弱記憶體系數(shù)據(jù)競(jìng)賽”(ACM SIGARCH Computer Architecture News,v.19 n.3,p.234-243,1991年5月)中定義。
如果兩個(gè)操作都是由不同的線程執(zhí)行的,則?兩個(gè)內(nèi)存操作沖突,指的是相同的內(nèi)存位置,其中至少有一個(gè)是存儲(chǔ)操作。
如果所有沖突的存儲(chǔ)器訪問(wèn)是通過(guò)同步操作排序的,則多?線程程序是數(shù)據(jù)競(jìng)爭(zhēng)的。
確保多線程程序無(wú)數(shù)據(jù)資源的眾所周知的方法是確保遵守鎖定規(guī)則。例如,可以將互斥體與每個(gè)共享數(shù)據(jù)項(xiàng)相關(guān)聯(lián),并且在訪問(wèn)共享數(shù)據(jù)時(shí)對(duì)相關(guān)聯(lián)的互斥體進(jìn)行鎖定。
遵循鎖定規(guī)則的所有程序都是數(shù)據(jù)競(jìng)賽的,但并不是所有無(wú)數(shù)據(jù)競(jìng)爭(zhēng)的程序都遵循鎖定規(guī)則。存在多線程程序,其中通過(guò)條件變量,信號(hào)量或障礙來(lái)對(duì)共享數(shù)據(jù)進(jìn)行訪問(wèn)。作為一個(gè)例子,一類HPC應(yīng)用程序由一系列計(jì)算步驟組成,這些步驟在時(shí)間上由障礙隔開,而這些障礙是唯一的同步手段。盡管在這些應(yīng)用程序中存在許多沖突的存儲(chǔ)器訪問(wèn),盡管這樣的應(yīng)用程序不能使用互斥體,但是這些應(yīng)用程序大多數(shù)不包含數(shù)據(jù)種族。
在運(yùn)行時(shí)驗(yàn)證多線程程序的正確性存在兩種不同的方法。所謂的擦除算法的方法是驗(yàn)證所有共享存儲(chǔ)器訪問(wèn)是否遵循一致的鎖定策略。并且發(fā)生之前的數(shù)據(jù)競(jìng)爭(zhēng)檢測(cè)器直接驗(yàn)證所有的連接間存儲(chǔ)器訪問(wèn)是否通過(guò)同步操作排序。雖然最后一種方法實(shí)現(xiàn)起來(lái)更加復(fù)雜,雖然它對(duì)OS調(diào)度更加敏感,但它是一種通用的方法,適用于所有類的多線程程序。發(fā)生在數(shù)據(jù)競(jìng)爭(zhēng)檢測(cè)器之前的一個(gè)重要優(yōu)點(diǎn)是這些不報(bào)告任何誤報(bào)。
DRD是基于之前的算法。
8.2。使用DRD
8.2.1。DRD命令行選項(xiàng)
以下命令行選項(xiàng)可用于控制DRD工具本身的行為:
--check-stack-var=<yes|no> [default: no]控制DRD是否檢測(cè)堆棧變量上的數(shù)據(jù)競(jìng)爭(zhēng)。默認(rèn)情況下禁用驗(yàn)證堆棧變量,因?yàn)榇蠖鄶?shù)程序不會(huì)通過(guò)線程共享堆棧變量。
如果任何互斥鎖或?qū)懣ㄆ麈i定的時(shí)間長(zhǎng)于指定的時(shí)間(毫秒),則打印錯(cuò)誤消息。此選項(xiàng)可以檢測(cè)鎖爭(zhēng)用。
如果內(nèi)存訪問(wèn)信息在線程加入后立即被丟棄,則可能會(huì)錯(cuò)過(guò)在一個(gè)線程的結(jié)尾處的語(yǔ)句和另一個(gè)線程之間發(fā)生的數(shù)據(jù)競(jìng)爭(zhēng)。此選項(xiàng)允許指定應(yīng)保留多少連接的線程內(nèi)存訪問(wèn)信息。
是否僅報(bào)告在內(nèi)存位置檢測(cè)到的第一個(gè)數(shù)據(jù)競(jìng)賽或在內(nèi)存位置檢測(cè)到的所有數(shù)據(jù)競(jìng)賽。
是否報(bào)告訪問(wèn)內(nèi)存和釋放內(nèi)存之間的比賽。啟用此選項(xiàng)可能會(huì)導(dǎo)致DRD運(yùn)行速度稍慢。筆記:
-
使用自定義內(nèi)存分配器時(shí),請(qǐng)勿啟用此選項(xiàng)VG_USERREQ__MALLOCLIKE_BLOCK?,VG_USERREQ__FREELIKE_BLOCK?因?yàn)闀?huì)導(dǎo)致誤報(bào)。
-
使用引用計(jì)數(shù)的對(duì)象時(shí),不要啟用該選項(xiàng),因?yàn)檫@將導(dǎo)致誤報(bào),即使該代碼已與正確注釋?ANNOTATE_HAPPENS_BEFORE?和ANNOTATE_HAPPENS_AFTER。有關(guān)示例,請(qǐng)參見以下命令的輸出:?valgrind --tool=drd --free-is-write=yes drd/tests/annotate_smart_pointer。
是否在信號(hào)發(fā)送時(shí)通過(guò)或?未被鎖定來(lái)報(bào)告與該信號(hào)相關(guān)聯(lián)的互斥體的呼叫?pthread_cond_signal和?pthread_cond_broadcast在哪里?。發(fā)送一個(gè)信號(hào)而不用鎖定相關(guān)的互斥體是常見的編程錯(cuò)誤,可能導(dǎo)致微妙的競(jìng)爭(zhēng)條件和不可預(yù)知的行為。存在一些不尋常的同步模式,但是可以安全地發(fā)送信號(hào)而不對(duì)相關(guān)聯(lián)的互斥鎖進(jìn)行鎖定。?pthread_cond_waitpthread_cond_timed_wait
控制段合并。段合并是一種限制數(shù)據(jù)競(jìng)爭(zhēng)檢測(cè)算法的內(nèi)存使用的算法。禁用段合并可能提高競(jìng)賽報(bào)告中顯示的所謂“其他段”的準(zhǔn)確性,但也可能會(huì)觸發(fā)內(nèi)存不足錯(cuò)誤。
僅在創(chuàng)建指定數(shù)量的新細(xì)分后才執(zhí)行細(xì)分合并。這是一個(gè)高級(jí)配置選項(xiàng),可以選擇是否通過(guò)選擇較低的值來(lái)最小化DRD的內(nèi)存使用率,或者通過(guò)選擇略高的值來(lái)讓DRD運(yùn)行得更快。該參數(shù)的最佳值取決于正在分析的程序。默認(rèn)值適用于大多數(shù)程序。
如果讀卡器鎖定時(shí)間超過(guò)指定時(shí)間(以毫秒為單位),則打印錯(cuò)誤消息。此選項(xiàng)可以檢測(cè)鎖爭(zhēng)用。
在比賽報(bào)告中顯示相互沖突的細(xì)分。由于此信息可以幫助您找到數(shù)據(jù)競(jìng)爭(zhēng)的原因,默認(rèn)情況下會(huì)啟用此選項(xiàng)。禁用此選項(xiàng)可使DRD的輸出更加緊湊。
在線程退出時(shí)打印堆棧使用情況。當(dāng)程序創(chuàng)建大量線程時(shí),限制為線程堆棧分配的虛擬內(nèi)存量變得非常重要。該選項(xiàng)使得可以觀察到客戶端程序的每個(gè)線程已經(jīng)使用了多少堆棧內(nèi)存。注意:DRD工具本身在客戶端線程堆棧上分配一些臨時(shí)數(shù)據(jù)。這個(gè)臨時(shí)數(shù)據(jù)所需的空間必須由客戶端程序分配堆棧內(nèi)存,但不包括在DRD報(bào)告的堆棧使用中。
控制線程創(chuàng)建過(guò)程中是否應(yīng)忽略所有活動(dòng)。默認(rèn)情況下僅在Solaris上啟用。Solaris提供了比其他操作系統(tǒng)更高的吞吐量,并行性和可擴(kuò)展性,代價(jià)是更細(xì)粒度的鎖定活動(dòng)。這意味著例如,當(dāng)在glibc下創(chuàng)建一個(gè)線程時(shí),所有線程設(shè)置只使用一個(gè)大鎖。Solaris libc使用幾個(gè)細(xì)粒度的鎖,并且創(chuàng)建者線程盡快恢復(fù)其活動(dòng),例如堆棧和TLS設(shè)置順序到創(chuàng)建的線程。這種情況混淆了DRD,因?yàn)樗俣ㄔ趧?chuàng)建者和創(chuàng)建的線程之間存在一些錯(cuò)誤的順序;?因此,不會(huì)報(bào)告申請(qǐng)中的許多類型的種族條件。?yes為了防止這種錯(cuò)誤排序, 在Solaris上默認(rèn)情況下將此命令行選項(xiàng)設(shè)置為。所有活動(dòng)(加載,存儲(chǔ),客戶端請(qǐng)求)因此在以下期間被忽略:
-
pthread_create()在創(chuàng)建者線程中調(diào)用
-
線程創(chuàng)建階段(堆棧和TLS設(shè)置)在創(chuàng)建的線程中
以下選項(xiàng)可用于監(jiān)視客戶端程序的行為:
--trace-addr=<address> [default: none]跟蹤指定地址的所有加載和存儲(chǔ)活動(dòng)。此選項(xiàng)可以被指定多次。
跟蹤指定地址的所有加載和存儲(chǔ)活動(dòng),并保持這樣做,即使在該地址的內(nèi)存已被釋放并重新分配。
跟蹤所有內(nèi)存分配和釋放。可能產(chǎn)生大量的產(chǎn)量。
跟蹤所有障礙活動(dòng)。
跟蹤所有條件變量活動(dòng)。
跟蹤所有線程創(chuàng)建和所有線程終止事件。
跟蹤的執(zhí)行ANNOTATE_HAPPENS_BEFORE(),?ANNOTATE_HAPPENS_AFTER()以及?ANNOTATE_HAPPENS_DONE()客戶端請(qǐng)求。
跟蹤所有互斥體活動(dòng)。
跟蹤所有讀寫器鎖定活動(dòng)。
跟蹤所有信號(hào)量活動(dòng)。
8.2.2。檢測(cè)到的錯(cuò)誤:數(shù)據(jù)競(jìng)賽
每次檢測(cè)到數(shù)據(jù)競(jìng)賽時(shí),DRD會(huì)打印一條消息。在解釋DRD的輸出時(shí),請(qǐng)記住以下幾點(diǎn):
-
每個(gè)線程由DRD工具分配一個(gè)線程ID。線程ID是一個(gè)數(shù)字。線程ID從一開始就永遠(yuǎn)不會(huì)被回收。
-
術(shù)語(yǔ)段是指連續(xù)的負(fù)載,存儲(chǔ)和同步操作序列,全部由同一個(gè)線程發(fā)出。段始終在同步操作中開始和結(jié)束。由于性能原因,在段之間進(jìn)行數(shù)據(jù)競(jìng)爭(zhēng)分析,而不是在單獨(dú)的負(fù)載和存儲(chǔ)操作之間進(jìn)行。
-
在數(shù)據(jù)競(jìng)賽中總是至少有兩個(gè)內(nèi)存訪問(wèn)。涉及數(shù)據(jù)競(jìng)爭(zhēng)的內(nèi)存訪問(wèn)稱為?沖突存儲(chǔ)器訪問(wèn)。DRD打印一份與過(guò)去內(nèi)存訪問(wèn)沖突的每個(gè)內(nèi)存訪問(wèn)的報(bào)告。
下面您可以找到DRD在檢測(cè)到數(shù)據(jù)競(jìng)賽時(shí)打印的消息的示例:
$ valgrind --tool = drd --read-var-info = yes drd / tests / rwlock_race ... == 9466 ==主題3: == 9466 ==線程3在0x006020b8大小的沖突負(fù)載4 == 9466 ==在0x400B6C:thread_func(rwlock_race.c:29) == 9466 == by 0x4C291DF:vg_thread_wrapper(drd_pthread_intercepts.c:186) == 9466 == by 0x4E3403F:start_thread(in /lib64/libpthread-2.8.so) == 9466 == by 0x53250CC:clone(in /lib64/libc-2.8.so) == 9466 ==位置0x6020b8是本地var“s_racy”內(nèi)的0個(gè)字節(jié) == 9466 ==在rwlock_race.c中聲明:18,在線程3的框架#0中 == 9466 ==其他段啟動(dòng)(線程2) == 9466 == at 0x4C2847D:pthread_rwlock_rdlock *(drd_pthread_intercepts.c:813) == 9466 == by 0x400B6B:thread_func(rwlock_race.c:28) == 9466 == by 0x4C291DF:vg_thread_wrapper(drd_pthread_intercepts.c:186) == 9466 == by 0x4E3403F:start_thread(in /lib64/libpthread-2.8.so) == 9466 == by 0x53250CC:clone(in /lib64/libc-2.8.so) == 9466 ==其他段末(線程2) == 9466 == at 0x4C28B54:pthread_rwlock_unlock *(drd_pthread_intercepts.c:912) == 9466 == by 0x400B84:thread_func(rwlock_race.c:30) == 9466 == by 0x4C291DF:vg_thread_wrapper(drd_pthread_intercepts.c:186) == 9466 == by 0x4E3403F:start_thread(in /lib64/libpthread-2.8.so) == 9466 == by 0x53250CC:clone(in /lib64/libc-2.8.so) ...上述報(bào)告具有以下含義:
-
左側(cè)列中的數(shù)字是由DRD分析的進(jìn)程的進(jìn)程ID。
-
第一行(“線程3”)告訴您線程的線程ID,在哪個(gè)上下文中檢測(cè)到數(shù)據(jù)競(jìng)爭(zhēng)。
-
下一行告訴執(zhí)行哪種操作(加載或存儲(chǔ))以及哪個(gè)線程。同一行也顯示沖突訪問(wèn)中涉及的起始地址和字節(jié)數(shù)。
-
接下來(lái),顯示沖突訪問(wèn)的調(diào)用堆棧。如果您的程序已使用調(diào)試信息(-g)進(jìn)行編譯,則此調(diào)用堆棧將包含文件名和行號(hào)。此調(diào)用堆棧(clone?和start_thread)中的兩個(gè)最底層框架顯示了NPTL如何啟動(dòng)一個(gè)線程。第三幀(vg_thread_wrapper)由DRD添加。第四幀(thread_func)是第一個(gè)有趣的行,因?yàn)樗@示了線程入口點(diǎn),即作為第三個(gè)參數(shù)傳遞的函數(shù)?pthread_create。
-
接下來(lái),顯示沖突地址的分配上下文。對(duì)于動(dòng)態(tài)分配的數(shù)據(jù),顯示分配調(diào)用堆棧。對(duì)于靜態(tài)變量和堆棧變量,只有在指定了該選項(xiàng)時(shí)才會(huì)顯示分配上下文?--read-var-info=yes。否則DRD將打印Allocation context: unknown。
-
沖突訪問(wèn)涉及至少兩個(gè)內(nèi)存訪問(wèn)。對(duì)于這些訪問(wèn)之一,顯示精確的調(diào)用堆棧,并且對(duì)于其他訪問(wèn),顯示近似調(diào)用堆棧,即其他訪問(wèn)段的開始和結(jié)束。該信息可以解釋如下:
-
從兩個(gè)調(diào)用堆棧的底部開始,并對(duì)具有相同功能名稱,文件名和行號(hào)的數(shù)量堆棧幀進(jìn)行計(jì)數(shù)。在上述例子中三個(gè)最下面的幀是相同的(clone,?start_thread和?vg_thread_wrapper)。
-
兩個(gè)調(diào)用堆棧中的下一個(gè)更高的堆棧幀現(xiàn)在告訴您在哪個(gè)源代碼區(qū)域中發(fā)生了其他內(nèi)存訪問(wèn)。上述輸出告訴數(shù)據(jù)競(jìng)爭(zhēng)中涉及的其他內(nèi)存訪問(wèn)發(fā)生在文件中的源代碼行28和30之間?rwlock_race.c。
8.2.3。檢測(cè)到的錯(cuò)誤:鎖定爭(zhēng)用
線程必須能夠進(jìn)行而不被其他線程阻塞太久。有時(shí),線程必須等到互斥體或讀寫器同步對(duì)象被另一個(gè)線程解鎖。這被稱為?鎖爭(zhēng)用。
鎖爭(zhēng)用導(dǎo)致延遲。這種拖延應(yīng)盡可能短。兩個(gè)命令行選項(xiàng)?--exclusive-threshold=<n>,并?--shared-threshold=<n>通過(guò)使DRD報(bào)告任何持續(xù)時(shí)間超過(guò)指定閾值的鎖,可以檢測(cè)到過(guò)多的鎖爭(zhēng)用。一個(gè)例子:
$ valgrind --tool = drd --exclusive-threshold = 10 drd / tests / hold_lock -i 500 ... == 10668 ==收購(gòu)于: == 10668 == at 0x4C267C8:pthread_mutex_lock(drd_pthread_intercepts.c:395) == 10668 == by 0x400D92:main(hold_lock.c:51) == 10668 ==鎖定互斥量0x7fefffd50在503 ms(閾值:10 ms)內(nèi)保持。 == 10668 == at 0x4C26ADA:pthread_mutex_unlock(drd_pthread_intercepts.c:441) == 10668 == 0x400DB5:main(hold_lock.c:55) ...hold_lock只要由-i(interval)參數(shù)指定?,測(cè)試程序就會(huì)保存一個(gè)鎖。DRD輸出報(bào)告在源文件中在線路51獲取hold_lock.c并在線55釋放的鎖定在?503ms內(nèi)保持,而對(duì)DRD指定了10ms的閾值。
8.2.4。檢測(cè)到的錯(cuò)誤:濫用POSIX線程API
DRD能夠檢測(cè)并報(bào)告POSIX線程API的以下濫用情況:
-
將一種類型的同步對(duì)象(例如互斥體)的地址傳遞到期望具有指向另一類型同步對(duì)象(例如條件變量)的指針的POSIX API調(diào)用。
-
嘗試解鎖未鎖定的互斥體。
-
嘗試解鎖被另一個(gè)線程鎖定的互斥體。
-
嘗試PTHREAD_MUTEX_NORMAL遞歸地鎖定類型或螺旋鎖的互斥體?。
-
鎖定的互斥體的銷毀或釋放。
-
將信號(hào)發(fā)送到條件變量,而與條件變量相關(guān)聯(lián)的互斥體上沒有鎖定。
-
調(diào)用pthread_cond_wait未鎖定的互斥體,被另一個(gè)線程鎖定或遞歸鎖定的互斥體。
-
將兩個(gè)不同的互斥體與條件變量相關(guān)聯(lián)pthread_cond_wait。
-
正在等待的條件變量的銷毀或釋放。
-
鎖定的讀寫器同步對(duì)象的銷毀或釋放。
-
嘗試解鎖未被調(diào)用線程鎖定的讀寫器同步對(duì)象。
-
嘗試遞歸地鎖定讀寫器同步對(duì)象。
-
嘗試將用戶定義的讀寫器同步對(duì)象的地址傳遞給POSIX線程函數(shù)。
-
嘗試將POSIX讀寫器同步對(duì)象的地址傳遞給用戶定義的讀寫器同步對(duì)象的注釋之一。
-
互斥體,條件變量,讀寫器鎖定,信號(hào)量或屏障的重新初始化。
-
正在等待的信號(hào)燈或屏障的銷毀或釋放。
-
屏障等待和屏障破壞之間缺少同步。
-
退出一個(gè)線程,而不會(huì)首先解鎖該線程鎖定的自旋鎖,互斥鎖或讀寫器同步對(duì)象。
-
將無(wú)效的線程ID傳遞給pthread_join?或pthread_cancel。
8.2.5。客戶端請(qǐng)求
就像其他Valgrind工具一樣,有可能讓客戶端程序通過(guò)客戶端請(qǐng)求與DRD工具進(jìn)行交互。除了客戶端請(qǐng)求之外,還定義了一些允許以便利的方式使用客戶端請(qǐng)求的宏。
頭文件中定義了客戶端程序與DRD工具之間的接口<valgrind/drd.h>。可用的宏和客戶端請(qǐng)求是:
-
宏DRD_GET_VALGRIND_THREADID和相應(yīng)的客戶端請(qǐng)求VG_USERREQ__DRD_GET_VALGRIND_THREAD_ID。查詢由Valgrind核心分配給執(zhí)行此客戶端請(qǐng)求的線程的線程ID。Valgrind的線程ID從一個(gè)開始,如果線程停止則被回收。
-
宏DRD_GET_DRD_THREADID和相應(yīng)的客戶端請(qǐng)求VG_USERREQ__DRD_GET_DRD_THREAD_ID。查詢由DRD分配給執(zhí)行此客戶端請(qǐng)求的線程的線程ID。這些是DRD在數(shù)據(jù)競(jìng)賽報(bào)告和跟蹤消息中報(bào)告的線程ID。DRD的線程ID從一開始就永遠(yuǎn)不會(huì)被回收。
-
宏DRD_IGNORE_VAR(x),?ANNOTATE_TRACE_MEMORY(&x)和相應(yīng)的客戶端請(qǐng)求VG_USERREQ__DRD_START_SUPPRESSION。一些應(yīng)用程序包含有意的種族。存在例如從兩個(gè)不同線程將共享變量分配給相同值的應(yīng)用程序。抑制這種種族可能比解決這些種族更為方便。該客戶端請(qǐng)求允許抑制這種種族。
-
宏DRD_STOP_IGNORING_VAR(x)和相應(yīng)的客戶端請(qǐng)求?VG_USERREQ__DRD_FINISH_SUPPRESSION。告訴DRD不再忽略通過(guò)宏DRD_IGNORE_VAR(x)或通過(guò)客戶端請(qǐng)求抑制的地址范圍的數(shù)據(jù)競(jìng)爭(zhēng)VG_USERREQ__DRD_START_SUPPRESSION。
-
這個(gè)宏DRD_TRACE_VAR(x)。追蹤從起始&x和占用sizeof(x)字節(jié)開始的地址范圍的所有加載和存儲(chǔ)活動(dòng)。當(dāng)DRD在指定的變量上報(bào)告數(shù)據(jù)競(jìng)爭(zhēng)時(shí),并不立即清楚哪些源代碼語(yǔ)句觸發(fā)了沖突的訪問(wèn),可能非常有助于跟蹤違規(guī)內(nèi)存位置上的所有活動(dòng)。
-
這個(gè)宏DRD_STOP_TRACING_VAR(x)。停止跟蹤地址范圍的加載和存儲(chǔ)活動(dòng),&x并占用sizeof(x)?字節(jié)。
-
這個(gè)宏ANNOTATE_TRACE_MEMORY(&x)。跟蹤至少觸及地址單個(gè)字節(jié)的所有加載和存儲(chǔ)活動(dòng)&x。
-
客戶端請(qǐng)求VG_USERREQ__DRD_START_TRACE_ADDR,允許跟蹤指定地址范圍的所有加載和存儲(chǔ)活動(dòng)。
-
客戶端請(qǐng)求VG_USERREQ__DRD_STOP_TRACE_ADDR。不再跟蹤指定地址范圍的加載和存儲(chǔ)活動(dòng)。
-
宏ANNOTATE_HAPPENS_BEFORE(addr)告訴DRD插入一個(gè)標(biāo)記。在執(zhí)行對(duì)指定地址的變量的訪問(wèn)之后插入此宏。
-
該宏ANNOTATE_HAPPENS_AFTER(addr)告訴DRD,指定地址上的變量的下一次訪問(wèn)應(yīng)該被認(rèn)為是在ANNOTATE_HAPPENS_BEFORE(addr)引用同一變量的最新注釋之前的訪問(wèn)之后發(fā)生的?。這兩個(gè)宏的目的是告訴DRD通過(guò)原子內(nèi)存操作實(shí)現(xiàn)的線程間內(nèi)存訪問(wèn)順序。另見drd/tests/annotate_smart_pointer.cpp一個(gè)例子。
-
宏ANNOTATE_RWLOCK_CREATE(rwlock)告訴DRD地址rwlock上的對(duì)象是不是pthread_rwlock_t同步對(duì)象的讀寫器?同步對(duì)象。另見drd/tests/annotate_rwlock.c一個(gè)例子。
-
該宏ANNOTATE_RWLOCK_DESTROY(rwlock)告訴DRD地址處的讀寫器同步對(duì)象rwlock已被破壞。
-
宏ANNOTATE_WRITERLOCK_ACQUIRED(rwlock)告訴DRD已經(jīng)在地址處的讀寫器同步對(duì)象上獲取了寫入器鎖rwlock。
-
該宏ANNOTATE_READERLOCK_ACQUIRED(rwlock)告訴DRD已經(jīng)在地址處的讀寫器同步對(duì)象上獲取了讀取器鎖定rwlock。
-
宏ANNOTATE_RWLOCK_ACQUIRED(rwlock, is_w)?告訴DRD?在地址處的讀寫器同步對(duì)象上已經(jīng)獲取了寫入器鎖定(何時(shí)is_w != 0)或讀取器鎖定(何時(shí)is_w == 0)rwlock。
-
宏ANNOTATE_WRITERLOCK_RELEASED(rwlock)告訴DRD地址上的讀寫器同步對(duì)象已經(jīng)釋放了寫入器鎖rwlock。
-
該宏ANNOTATE_READERLOCK_RELEASED(rwlock)告訴DRD在地址處的讀寫器同步對(duì)象上已經(jīng)釋放了讀取器鎖定rwlock。
-
宏ANNOTATE_RWLOCK_RELEASED(rwlock, is_w)?告訴DRD寫入器鎖定(何時(shí)is_w != 0)或讀取器鎖定(何時(shí)is_w == 0)已在地址處的讀寫器同步對(duì)象上釋放rwlock。
-
該宏ANNOTATE_BARRIER_INIT(barrier, count, reinitialization_allowed)告訴DRD,地址處的一個(gè)新的屏障對(duì)象barrier已被初始化,該count線程參與每個(gè)屏障,以及是否將沒有中間破壞的屏障重新初始化作為錯(cuò)誤報(bào)告。另見drd/tests/annotate_barrier.c一個(gè)例子。
-
宏ANNOTATE_BARRIER_DESTROY(barrier)?告訴DRD屏障對(duì)象即將被銷毀。
-
該宏ANNOTATE_BARRIER_WAIT_BEFORE(barrier)?告訴DRD,等待屏障將開始。
-
宏ANNOTATE_BARRIER_WAIT_AFTER(barrier)?指示DRD等待屏障已經(jīng)完成。
-
宏ANNOTATE_BENIGN_RACE_SIZED(addr, size, descr)告訴DRD,在指定地址上檢測(cè)到的任何種族是良性的,因此不應(yīng)該報(bào)告。該descr參數(shù)被忽略,但可用于記錄為什么數(shù)據(jù)競(jìng)賽addr是良性的。
-
宏ANNOTATE_BENIGN_RACE_STATIC(var, descr)?告訴DRD,在指定的靜態(tài)變量上檢測(cè)到的任何種族都是良性的,因此不應(yīng)該報(bào)告。該descr?參數(shù)被忽略,但可用于記錄為什么數(shù)據(jù)競(jìng)賽var是良性的。注意:這個(gè)宏只能在C ++程序中使用,而不能在C程序中使用。
-
宏ANNOTATE_IGNORE_READS_BEGIN告訴DRD忽略當(dāng)前線程執(zhí)行的所有內(nèi)存加載。
-
宏ANNOTATE_IGNORE_READS_END告訴DRD停止忽略當(dāng)前線程執(zhí)行的內(nèi)存負(fù)載。
-
宏ANNOTATE_IGNORE_WRITES_BEGIN告訴DRD忽略當(dāng)前線程執(zhí)行的所有內(nèi)存存儲(chǔ)。
-
宏ANNOTATE_IGNORE_WRITES_END告訴DRD停止忽略當(dāng)前線程執(zhí)行的內(nèi)存存儲(chǔ)。
-
宏ANNOTATE_IGNORE_READS_AND_WRITES_BEGIN告訴DRD忽略當(dāng)前線程執(zhí)行的所有內(nèi)存訪問(wèn)。
-
宏ANNOTATE_IGNORE_READS_AND_WRITES_END告訴DRD停止忽略當(dāng)前線程執(zhí)行的內(nèi)存訪問(wèn)。
-
該宏ANNOTATE_NEW_MEMORY(addr, size)告訴DRD客戶端程序中的自定義內(nèi)存分配器分配了指定的內(nèi)存范圍,并且客戶端程序?qū)㈤_始使用此內(nèi)存范圍。
-
宏ANNOTATE_THREAD_NAME(name)告訴DRD將指定的名稱與當(dāng)前線程相關(guān)聯(lián),并將此名稱包含在DRD打印的錯(cuò)誤消息中。
-
宏VALGRIND_MALLOCLIKE_BLOCK和?VALGRIND_FREELIKE_BLOCK從Valgrind核心實(shí)現(xiàn);?它們?cè)?客戶端請(qǐng)求機(jī)制中描述。
注意:如果您自己編譯Valgrind,則該命令?<valgrind/drd.h>將頭文件?安裝在目錄中。如果您通過(guò)將其安裝為一個(gè)包獲得Valgrind,那么您可能必須安裝另一個(gè)包含?Valgrind頭文件可用的名稱。?/usr/includemake installvalgrind-devel
8.2.6。調(diào)試C ++ 11程序
如果要使用C ++ 11類std :: thread,則需要執(zhí)行以下操作來(lái)注釋在該類的實(shí)現(xiàn)中使用的std :: shared_ptr <>對(duì)象:
-
在包含任何C ++頭文件之前,在公共頭的起始處或每個(gè)源文件的開始添加以下代碼:
#include <valgrind / drd.h> #define _GLIBCXX_SYNCHRONIZATION_HAPPENS_BEFORE(addr)ANNOTATE_HAPPENS_BEFORE(addr) #define _GLIBCXX_SYNCHRONIZATION_HAPPENS_AFTER(addr)ANNOTATE_HAPPENS_AFTER(addr) -
下載gcc源代碼,從源文件libstdc ++ - v3 / src / c ++ 11 / thread.cc將執(zhí)行?execute_native_thread_routine()?和std::thread::_M_start_thread()?函數(shù)復(fù)制到與應(yīng)用程序鏈接的源文件中。確保在此源文件中也可以正確定義_GLIBCXX_SYNCHRONIZATION_HAPPENS _ *()宏。
有關(guān)更多信息,請(qǐng)參閱“GNU C ++庫(kù)手冊(cè)”,“調(diào)試支持”?(http://gcc.gnu.org/onlineocs/libstdc++/manual/debug.html)。
8.2.7。調(diào)試GNOME程序
GNOME應(yīng)用程序使用由提供的線程原語(yǔ)?glib和?gthread圖書館。這些庫(kù)構(gòu)建在POSIX線程之上,因此由DRD直接支持。請(qǐng)記住,g_thread_init在創(chuàng)建任何線程之前必須先調(diào)用?,否則DRD會(huì)報(bào)告glib函數(shù)上的幾個(gè)數(shù)據(jù)比賽。又見?GLib的參考手冊(cè)有關(guān)詳細(xì)信息?g_thread_init。
glib?圖書館?提供的許多設(shè)施之一是一個(gè)塊分配器,稱為g_slice。在使用DRD時(shí),必須通過(guò)將以下內(nèi)容添加到shell環(huán)境變量來(lái)禁用此塊分配器:?G_SLICE=always-malloc。有關(guān)更多信息,請(qǐng)參閱GLib參考手冊(cè)。
8.2.8。調(diào)試Boost.Thread程序
Boost.Thread庫(kù)是跨平臺(tái)Boost庫(kù)附帶的線程庫(kù)。這個(gè)線程庫(kù)是即將推出的C ++ 0x線程庫(kù)的早期實(shí)現(xiàn)。
使用Boost.Thread庫(kù)的應(yīng)用程序在DRD下運(yùn)行良好。
有關(guān)Boost.Thread的更多信息,請(qǐng)?jiān)L問(wèn):
-
Anthony Williams,Boost.Thread?Library Documentation,Boost website,2007。
-
安東尼·威廉姆斯,Boost Threads的新功能?,最新修改的Boost Thread庫(kù),Dobbs博士,2008年10月。
8.2.9。調(diào)試OpenMP程序
OpenMP代表開放多重處理。OpenMP標(biāo)準(zhǔn)包括一組用于C,C ++和Fortran程序的編譯器指令,允許編譯器將順序程序轉(zhuǎn)換為并行程序。OpenMP非常適合HPC應(yīng)用程序,并允許在直接使用POSIX線程API的情況下在更高級(jí)別工作。雖然OpenMP確保POSIX API被正確使用,但OpenMP程序仍然可以包含數(shù)據(jù)競(jìng)爭(zhēng)。因此,使用線程檢查工具驗(yàn)證OpenMP程序是絕對(duì)有意義的。
DRD支持GCC生成的OpenMP共享內(nèi)存程序。GCC自版本4.2.0起支持OpenMP。GCC對(duì)OpenMP程序的運(yùn)行時(shí)支持由一個(gè)名為“庫(kù)”的庫(kù)提供?libgomp。在該庫(kù)中實(shí)現(xiàn)的同步原語(yǔ)使用Linux'futex系統(tǒng)調(diào)用直接,除非該庫(kù)已配置該?--disable-linux-futex選項(xiàng)。DRD僅支持已使用此選項(xiàng)配置的libgomp庫(kù),并且其中存在符號(hào)信息。對(duì)于大多數(shù)Linux發(fā)行版,這意味著您必須重新編譯GCC。有關(guān)drd/scripts/download-and-build-gcc如何編譯GCC的示例,請(qǐng)參閱Valgrind源代碼樹中的腳本?。libgomp.so當(dāng)OpenMP程序啟動(dòng)時(shí),您還必須確保新編譯的?庫(kù)已加載。
導(dǎo)出LD_LIBRARY_PATH =?/ gcc-4.4.0 / lib64:?/ gcc-4.4.0 / lib:例如,drd/tests/omp_matinv當(dāng)在命令行上指定了選項(xiàng)-r時(shí),測(cè)試OpenMP測(cè)試程序會(huì)?觸發(fā)數(shù)據(jù)競(jìng)爭(zhēng)。數(shù)據(jù)競(jìng)賽由以下代碼觸發(fā):
#pragma omp parallel for private(j) for(j = 0; j <rows; j ++) {if(i!= j){const elem_t factor = a [j * cols + i];for(k = 0; k <cols; k ++){a [j * cols + k] - = a [i * cols + k] *因子;}} }上面的代碼是racy,因?yàn)樽兞縦沒有被聲明為private。DRD將打印以下代碼的以下錯(cuò)誤消息:
$ valgrind --tool = drd --check-stack-var = yes --read-var-info = yes drd / tests / omp_matinv 3 -t 2 -r ... 線程1/1在0x7fefffbc4大小的沖突存儲(chǔ)4在0x4014A0:gj.omp_fn.0(omp_matinv.c:203)通過(guò)0x401211:gj(omp_matinv.c:159)by 0x40166A:invert_matrix(omp_matinv.c:238)通過(guò)0x4019B4:main(omp_matinv.c:316) 位置0x7fefffbc4是本地var“k”內(nèi)的0個(gè)字節(jié) 在omp_matinv.c中聲明:160,在線程1的幀#0中 ...在上述輸出中,函數(shù)名稱gj.omp_fn.0?由GCC從函數(shù)名生成?gj。分配上下文信息顯示數(shù)據(jù)競(jìng)爭(zhēng)是由修改變量引起的k。
注意:對(duì)于4.4.0之前的GCC版本,不顯示分配上下文信息。使用這些GCC版本,上述輸出中最可用的信息是源文件名和檢測(cè)到數(shù)據(jù)競(jìng)爭(zhēng)的行號(hào)(omp_matinv.c:203)。
有關(guān)OpenMP的更多信息,另請(qǐng)參閱?openmp.org。
8.2.10。DRD和自定義內(nèi)存分配器
DRD跟蹤通過(guò)標(biāo)準(zhǔn)的內(nèi)存分配和釋放功能發(fā)生的所有內(nèi)存分配事件(malloc,free,?new和delete),通過(guò)進(jìn)入和已經(jīng)標(biāo)注了Valgrind的內(nèi)存池的客戶端請(qǐng)求的堆棧幀或退出。DRD使用內(nèi)存分配和釋放信息用于兩個(gè)目的:
-
要知道尚未明確銷毀的POSIX對(duì)象的范圍結(jié)束。例如POSIX線程標(biāo)準(zhǔn)pthread_mutex_destroy在釋放互斥體對(duì)象所在的內(nèi)存之前不需要調(diào)用?。
-
要知道變量的范圍在哪里結(jié)束。如果一個(gè)線程使用了堆內(nèi)存,該線程將釋放該內(nèi)存,另一個(gè)線程分配并啟動(dòng)該內(nèi)存,則不得為該內(nèi)存報(bào)告數(shù)據(jù)競(jìng)爭(zhēng)。
DRD的正確操作對(duì)工具知道內(nèi)存分配和釋放事件至關(guān)重要。當(dāng)分析與DRD客戶端程序,使用自定義的內(nèi)存分配器,無(wú)論是儀表自定義的內(nèi)存分配器與VALGRIND_MALLOCLIKE_BLOCK?和VALGRIND_FREELIKE_BLOCK宏或禁用定制的內(nèi)存分配器。
例如,GNU libstdc ++庫(kù)可以通過(guò)設(shè)置環(huán)境變量來(lái)配置為使用標(biāo)準(zhǔn)內(nèi)存分配函數(shù)而不是內(nèi)存池?GLIBCXX_FORCE_NEW。有關(guān)更多信息,另請(qǐng)參閱libstdc ++手冊(cè)。
8.2.11。DRD與Memcheck
DRD的正確操作對(duì)于客戶機(jī)程序中沒有內(nèi)存錯(cuò)誤,如懸掛指針是至關(guān)重要的。這意味著在使用DRD進(jìn)行分析之前,確保您的程序是Memcheck-clean是一個(gè)好主意。然而,有些Memcheck報(bào)告可能是由數(shù)據(jù)競(jìng)賽造成的。在這種情況下,在Memcheck之前運(yùn)行DRD是有意義的。
那么應(yīng)該先運(yùn)行哪個(gè)工具?如果DRD和Memcheck都抱怨程序,可能的方法是在每次運(yùn)行每個(gè)工具之后交替運(yùn)行兩個(gè)工具并修復(fù)盡可能多的錯(cuò)誤,直到兩個(gè)工具都沒有打印任何更多的錯(cuò)誤消息。
8.2.12。資源要求
DRD對(duì)堆棧和堆棧內(nèi)存的要求以及客戶端程序執(zhí)行時(shí)間的影響如下:
-
在DRD下使用默認(rèn)DRD選項(xiàng)運(yùn)行程序時(shí),與客戶端程序的本地運(yùn)行相比,需要1.1到3.6倍的內(nèi)存。如果加載了調(diào)試信息(--read-var-info=yes),則需要更多的內(nèi)存。
-
DRD在客戶端程序線程的堆棧上分配一些臨時(shí)數(shù)據(jù)結(jié)構(gòu)。此數(shù)據(jù)量限制在1 - 2 KB。確保線程堆棧足夠大。
-
大多數(shù)應(yīng)用程序在DRD下的運(yùn)行速度要比本機(jī)單線程運(yùn)行速度慢20到50倍。對(duì)于執(zhí)行頻繁互斥鎖定/解鎖操作的應(yīng)用程序,減速將最為顯著。
8.2.13。有效使用DRD的提示和提示
使用DRD時(shí),以下信息可能會(huì)有所幫助:
-
確保調(diào)試信息存在于正在分析的可執(zhí)行文件中,以便DRD可以在堆棧跟蹤中打印功能名稱和行??號(hào)信息。大多數(shù)編譯器可以通過(guò)編譯器選項(xiàng)來(lái)提供調(diào)試信息?-g。
-
編譯選項(xiàng)-O1而不是?-O0。這將減少生成的代碼量,可能會(huì)減少調(diào)試信息的數(shù)量,并將加快DRD處理客戶端程序的速度。有關(guān)詳細(xì)信息,請(qǐng)參閱入門指南。
-
如果DRD報(bào)告了作為L(zhǎng)inux發(fā)行版一部分的庫(kù)的任何錯(cuò)誤,例如,libc.so或者?libstdc++.so安裝這些庫(kù)的調(diào)試包將使DRD的輸出更加詳細(xì)。
-
當(dāng)使用C ++時(shí),不要將輸出從多個(gè)線程發(fā)送到?std::cout。這樣做不僅可以生成多個(gè)數(shù)據(jù)競(jìng)賽報(bào)告,還可能導(dǎo)致多個(gè)線程的輸出混淆。使用?printf或執(zhí)行以下操作:
-
派生一個(gè)類std::ostreambuf?,讓該類逐行發(fā)送輸出?stdout。這將避免不同線程生成的各行文本混淆。
-
std::ostream?為每個(gè)線程創(chuàng)建一個(gè)實(shí)例。這使流格式設(shè)置線程本地。傳遞從每個(gè)實(shí)例的構(gòu)造函數(shù)派生的類的每個(gè)線程的std::ostreambuf實(shí)例。
-
讓每個(gè)線程將其輸出發(fā)送到自己的實(shí)例?std::ostream而不是?std::cout。
8.3。有效地使用POSIX線程API
8.3.1。互斥類型
單一UNIX規(guī)范版本二定義了以下四種互斥體類型(另請(qǐng)參見pthread_mutexattr_settype:文檔):
-
正常,這意味著不執(zhí)行錯(cuò)誤檢查,并且互斥量是非遞歸的。
-
錯(cuò)誤檢查,這意味著互斥體是非遞歸的,并且執(zhí)行錯(cuò)誤檢查。
-
遞歸,這意味著互斥體可能被遞歸鎖定。
-
默認(rèn),這意味著錯(cuò)誤檢查行為是未定義的,并且遞歸鎖定的行為也是未定義的。或者:可移植代碼不能通過(guò)Pthreads API觸發(fā)錯(cuò)誤條件,也不得遞歸地鎖定默認(rèn)類型的互斥體。
在復(fù)雜的應(yīng)用中,事先并不總是清楚地將遞歸鎖定哪些互斥鎖,哪些互斥不會(huì)被遞歸地鎖定。嘗試遞歸地鎖定非遞歸互斥將導(dǎo)致在沒有線程檢查工具的情況下很難找到的競(jìng)爭(zhēng)條件。所以要么使用錯(cuò)誤檢查互斥體類型,并一直檢查Pthread API互斥調(diào)用的返回值,或者使用遞歸互斥體類型。
8.3.2。條件變量
條件變量允許一個(gè)線程喚醒一個(gè)或多個(gè)其他線程。條件變量通常用于通知一個(gè)或多個(gè)線程關(guān)于共享數(shù)據(jù)的狀態(tài)變化。不幸的是,通過(guò)使用條件變量作為狀態(tài)信息傳播的唯一手段來(lái)引入競(jìng)爭(zhēng)條件是非常容易的。一個(gè)更好的方法是讓線程輪詢由互斥體保護(hù)的狀態(tài)變量的更改,并將條件變量?jī)H用作線程喚醒機(jī)制。另請(qǐng)參見源文件?drd/tests/monitor_example.cpp,了解如何在C ++中實(shí)現(xiàn)這一概念。該示例中使用的監(jiān)視器概念是一個(gè)眾所周知的非常有用的概念 - 有關(guān)監(jiān)視器?概念的更多信息,另請(qǐng)參見維基百科。
8.3.3。pthread_cond_timedwait和超時(shí)
歷史上,該函數(shù)?pthread_cond_timedwait僅允許規(guī)定絕對(duì)超時(shí),這是一個(gè)與調(diào)用此函數(shù)時(shí)間無(wú)關(guān)的超時(shí)。但是,幾乎每次調(diào)用此函數(shù)都表示相對(duì)超時(shí)。這通常是通過(guò)傳遞總和?clock_gettime(CLOCK_REALTIME)和相對(duì)超時(shí)作為第三個(gè)參數(shù)。這種方法是不正確的,因?yàn)槔鏽tpd的前向或后向時(shí)鐘調(diào)整將影響超時(shí)。一個(gè)更可靠的方法如下:
-
當(dāng)初始化條件變量時(shí)?pthread_cond_init,指定超時(shí)?pthread_cond_timedwait將使用時(shí)鐘?CLOCK_MONOTONIC而不是?CLOCK_REALTIME。你可以這樣做?pthread_condattr_setclock(..., CLOCK_MONOTONIC)。
-
當(dāng)調(diào)用pthread_cond_timedwait時(shí),將總和?clock_gettime(CLOCK_MONOTONIC)?和相對(duì)超時(shí)作為第三個(gè)參數(shù)。
另見?drd/tests/monitor_example.cpp一個(gè)例子。
8.4。限制
DRD目前有以下限制:
-
DRD就像Memcheck一樣,將拒絕在已經(jīng)刪除所有符號(hào)信息的Linux發(fā)行版上啟動(dòng)?ld.so。這是例如OpenPCS和Gentoo的PPC版本。在使用DRD之前,您必須在這些平臺(tái)上安裝glibc debuginfo軟件包。另請(qǐng)參見openSUSE bug?396197和Gentoo bug?214065。
-
使用gcc 4.4.3和之前,DRD可能會(huì)std::string在多線程程序中的C ++類上報(bào)告數(shù)據(jù)競(jìng)爭(zhēng)。這是一個(gè)知道的libstdc++問(wèn)題 - 更多信息,請(qǐng)參閱GCC錯(cuò)誤?40518?。
-
如果您自己編譯DRD源代碼,則需要GCC 3.0或更高版本。不支持GCC 2.95。
-
在Linux的兩個(gè)POSIX線程實(shí)現(xiàn)中,只支持NPTL(Native POSIX線程庫(kù))。較舊的LinuxThreads庫(kù)不受支持。
8.5。反饋
如果您有關(guān)于DRD的任何意見,建議,反饋或錯(cuò)誤報(bào)告,請(qǐng)隨時(shí)在Valgrind用戶郵件列表上發(fā)布消息或提交錯(cuò)誤報(bào)告。又見http://www.valgrind.org/以獲取更多信息。
總結(jié)
以上是生活随笔為你收集整理的DRD:线程错误检测器的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: mac下webstorm 安装
- 下一篇: 国内物联网平台初探(七) ——Ablec