OS / 总线锁和缓存一致性
?隨著多核時代的到來,并發操作已經成了很正常的現象,操作系統必須要有一些機制和原語,以保證某些基本操作的原子性,比如處理器需要保證讀一個字節或寫一個字節是原子的,那么它是如何實現的呢?有兩種機制:總線鎖定、緩存一致性。
我們知道,CPU 和物理內存之間的通信速度遠慢于 CPU 的處理速度,所以 CPU 有自己的內部緩存,根據一些規則將內存中的數據讀取到內部緩存中來,以加快頻繁讀取的速度。
我們假設在一臺 PC 上只有一個 CPU 和一份內部緩存,那么所有進程和線程看到的數據都是緩存里的數據,不會存在問題;但現在服務器通常是多 CPU,更普遍的是,每塊 CPU 里有多個內核,而每個內核都維護了自己的緩存,那么這時候多線程并發就會存在緩存不一致性,這會導致嚴重問題。
以 i++ 為例,i 的初始值是 0,那么在開始每塊緩存都存儲了 i 的值 0,當第一塊內核做 i++ 的時候,其緩存中的值變成了1,即使馬上回寫到主內存,那么在回寫之后第二塊內核緩存中的 i 值依然是 0,其執行 i++,回寫到內存就會覆蓋第一塊內核的操作,使得最終的結果是 1,而不是預期中的 2。
那么怎么解決整個問題呢?
操作系統提供了總線鎖定的機制。前端總線(也叫CPU總線)是所有CPU與芯片組連接的主干道,負責CPU與外界所有部件的通信,包括高速緩存、內存、北橋。其控制總線向各個部件發送控制信號、通過地址總線發送地址信號指定其要訪問的部件、通過數據總線雙向傳輸數據。在 CPU1 要做 i++ 操作的時候,其在總線上發出一個 LOCK# 信號,其他處理器就不能操作緩存了該共享變量內存地址的緩存,也就是阻塞了其他CPU,使該處理器可以獨享此共享內存。
但我們只需要對此共享變量的操作是原子就可以了,而總線鎖定把CPU和內存的通信給鎖住了,使得在鎖定期間,其他處理器不能操作其他內存地址的數據,從而開銷較大,所以后來的 CPU 都提供了緩存一致性機制,Intel 的奔騰 486 之后就提供了這種優化。
緩存一致性:緩存一致性機制就整體來說,是當某塊 CPU 對緩存中的數據進行操作了之后,就通知其他 CPU 放棄儲存在它們內部的緩存,或者從主內存中重新讀取,用MESI闡述原理如下:
MESI協議:是以緩存行(緩存的基本數據單位,在 Intel 的 CPU 上一般是 64 字節)的幾個狀態來命名的(全名是 Modified、Exclusive、 Share、Invalid)。該協議要求在每個緩存行上維護兩個狀態位,使得每個數據單位可能處于 M、E、S 和 I 這四種狀態之一,各種狀態含義如下:
- M:被修改的。處于這一狀態的數據,只在本CPU中有緩存數據,而其他CPU中沒有。同時其狀態相對于內存中的值來說,是已經被修改的,且沒有更新到內存中。
- E:獨占的。處于這一狀態的數據,只有在本CPU中有緩存,且其數據沒有修改,即與內存中一致。
- S:共享的。處于這一狀態的數據在多個CPU中都有緩存,且與內存一致。
- I:無效的。本CPU中的這份緩存已經無效。
一個處于 M 狀態的緩存行,必須時刻監聽所有試圖讀取該緩存行對應的主存地址的操作,如果監聽到,則必須在此操作執行前把其緩存行中的數據寫回 CPU。
一個處于 S 狀態的緩存行,必須時刻監聽使該緩存行無效或者獨享該緩存行的請求,如果監聽到,則必須把其緩存行狀態設置為 I 。
一個處于 E 狀態的緩存行,必須時刻監聽其他試圖讀取該緩存行對應的主存地址的操作,如果監聽到,則必須把其緩存行狀態設置為 S。
當 CPU 需要讀取數據時,如果其緩存行的狀態是 I 的,則需要從內存中讀取,并把自己狀態變成 S ,如果不是 I,則可以直接讀取緩存中的值,但在此之前,必須要等待其他CPU的監聽結果,如其他CPU也有該數據的緩存且狀態是 M,則需要等待其把緩存更新到內存之后,再讀取。
當 CPU 需要寫數據時,只有在其緩存行是 M 或者 E 的時候才能執行,否則需要發出特殊的 RFO 指令(Read Or Ownership,這是一種總線事務),通知其他 CPU 置緩存無效(i),這種情況下性能開銷是相對較大的。在寫入完成后,修改其緩存狀態為 M。
所以如果一個變量在某段時間只被一個線程頻繁地修改,則使用其內部緩存就完全可以辦到,不涉及到總線事務,如果緩存一會被這個 CPU 獨占、一會被那個 CPU 獨占,這時才會不斷產生 RFO 指令影響到并發性能。這里說的緩存頻繁被獨占并不是指線程越多越容易觸發,而是這里的CPU協調機制,這有點類似于有時多線程并不一定提高效率,原因是線程掛起、調度的開銷比執行任務的開銷還要大,這里的多CPU 也是一樣,如果在 CPU 間調度不合理,也會形成 RFO 指令的開銷比任務開銷還要大。當然,這不是編程者需要考慮的事,操作系統會有相應的內存地址的相關判斷。
? ? ? ?并非所有情況都會使用緩存一致性的,如被操作的數據不能被緩存在CPU內部或操作數據跨越多個緩存行(狀態無法標識),則處理器會調用總線鎖定;另外當 CPU 不支持緩存鎖定時,自然也只能用總線鎖定了,比如說奔騰 486 以及更老的 CPU。
?
轉載:https://blog.csdn.net/qq_35642036/article/details/82801708
?
(SAW:Game Over!)
總結
以上是生活随笔為你收集整理的OS / 总线锁和缓存一致性的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 编码 / Base 64
- 下一篇: OS / linux / 互斥锁实现原理