CAS操作确保原子性
(一)CAS操作
在JDK 5之前Java語(yǔ)言是靠synchronized關(guān)鍵字保證同步的,這會(huì)導(dǎo)致有鎖
鎖機(jī)制存在以下問(wèn)題:
(1)在多線程競(jìng)爭(zhēng)下,加鎖、釋放鎖會(huì)導(dǎo)致比較多的上下文切換和調(diào)度延時(shí),引起性能問(wèn)題。
(2)一個(gè)線程持有鎖會(huì)導(dǎo)致其它所有需要此鎖的線程掛起。
(3)如果一個(gè)優(yōu)先級(jí)高的線程等待一個(gè)優(yōu)先級(jí)低的線程釋放鎖會(huì)導(dǎo)致優(yōu)先級(jí)倒置,引起性能風(fēng)險(xiǎn)。
volatile是不錯(cuò)的機(jī)制,但是volatile不能保證原子性。因此對(duì)于同步最終還是要回到鎖機(jī)制上來(lái)。
獨(dú)占鎖是一種悲觀鎖,synchronized就是一種獨(dú)占鎖,會(huì)導(dǎo)致其它所有需要鎖的線程掛起,等待持有鎖的線程釋放鎖。而另一個(gè)更加有效的鎖就是樂(lè)觀鎖。所謂樂(lè)觀鎖就是,每次不加鎖而是假設(shè)沒(méi)有沖突而去完成某項(xiàng)操作,如果因?yàn)闆_突失敗就重試,直到成功為止。樂(lè)觀鎖用到的機(jī)制就是CAS,Compare and Swap。
一、什么是CAS
CAS,compare and swap的縮寫(xiě),中文翻譯成比較并交換。
我們都知道,在java語(yǔ)言之前,并發(fā)就已經(jīng)廣泛存在并在服務(wù)器領(lǐng)域得到了大量的應(yīng)用。所以硬件廠商老早就在芯片中加入了大量直至并發(fā)操作的原語(yǔ),從而在硬件層面提升效率。在intel的CPU中,使用cmpxchg指令。
在Java發(fā)展初期,java語(yǔ)言是不能夠利用硬件提供的這些便利來(lái)提升系統(tǒng)的性能的。而隨著java不斷的發(fā)展,Java本地方法(JNI)的出現(xiàn),使得java程序越過(guò)JVM直接調(diào)用本地方法提供了一種便捷的方式,因而java在并發(fā)的手段上也多了起來(lái)。而在Doug Lea提供的cucurenct包中,CAS理論是它實(shí)現(xiàn)整個(gè)java包的基石。
CAS 操作包含三個(gè)操作數(shù) —— 內(nèi)存位置(V)、預(yù)期原值(A)和新值(B)。 如果內(nèi)存位置的值與預(yù)期原值相匹配,那么處理器會(huì)自動(dòng)將該位置值更新為新值 。否則,處理器不做任何操作。無(wú)論哪種情況,它都會(huì)在 CAS 指令之前返回該 位置的值。(在 CAS 的一些特殊情況下將僅返回 CAS 是否成功,而不提取當(dāng)前 值。)CAS 有效地說(shuō)明了“我認(rèn)為位置 V 應(yīng)該包含值 A;如果包含該值,則將 B 放到這個(gè)位置;否則,不要更改該位置,只告訴我這個(gè)位置現(xiàn)在的值即可。”
通常將 CAS 用于同步的方式是從地址 V 讀取值 A,執(zhí)行多步計(jì)算來(lái)獲得新 值 B,然后使用 CAS 將 V 的值從 A 改為 B。如果 V 處的值尚未同時(shí)更改,則 CAS 操作成功。
類似于 CAS 的指令允許算法執(zhí)行讀-修改-寫(xiě)操作,而無(wú)需害怕其他線程同時(shí) 修改變量,因?yàn)槿绻渌€程修改變量,那么 CAS 會(huì)檢測(cè)它(并失敗),算法 可以對(duì)該操作重新計(jì)算。
二、CAS的目的
利用CPU的CAS指令,同時(shí)借助JNI來(lái)完成Java的非阻塞算法。其它原子操作都是利用類似的特性完成的。而整個(gè)J.U.C都是建立在CAS之上的,因此對(duì)于synchronized阻塞算法,J.U.C在性能上有了很大的提升。
三、CAS存在的問(wèn)題
CAS雖然很高效的解決原子操作,但是CAS仍然存在三大問(wèn)題。ABA問(wèn)題,循環(huán)時(shí)間長(zhǎng)開(kāi)銷大和只能保證一個(gè)共享變量的原子操作
1. ?ABA問(wèn)題。因?yàn)镃AS需要在操作值的時(shí)候檢查下值有沒(méi)有發(fā)生變化,如果沒(méi)有發(fā)生變化則更新,但是如果一個(gè)值原來(lái)是A,變成了B,又變成了A,那么使用CAS進(jìn)行檢查時(shí)會(huì)發(fā)現(xiàn)它的值沒(méi)有發(fā)生變化,但是實(shí)際上卻變化了。ABA問(wèn)題的解決思路就是使用版本號(hào)。在變量前面追加上版本號(hào),每次變量更新的時(shí)候把版本號(hào)加一,那么A-B-A 就會(huì)變成1A-2B-3A。
從Java1.5開(kāi)始JDK的atomic包里提供了一個(gè)類AtomicStampedReference來(lái)解決ABA問(wèn)題。這個(gè)類的compareAndSet方法作用是首先檢查當(dāng)前引用是否等于預(yù)期引用,并且當(dāng)前標(biāo)志是否等于預(yù)期標(biāo)志,如果全部相等,則以原子方式將該引用和該標(biāo)志的值設(shè)置為給定的更新值。
關(guān)于ABA問(wèn)題參考文檔:?http://blog.hesey.net/2011/09/resolve-aba-by-atomicstampedreference.html
2. 循環(huán)時(shí)間長(zhǎng)開(kāi)銷大。自旋CAS如果長(zhǎng)時(shí)間不成功,會(huì)給CPU帶來(lái)非常大的執(zhí)行開(kāi)銷。如果JVM能支持處理器提供的pause指令那么效率會(huì)有一定的提升,pause指令有兩個(gè)作用,第一它可以延遲流水線執(zhí)行指令(de-pipeline),使CPU不會(huì)消耗過(guò)多的執(zhí)行資源,延遲的時(shí)間取決于具體實(shí)現(xiàn)的版本,在一些處理器上延遲時(shí)間是零。第二它可以避免在退出循環(huán)的時(shí)候因內(nèi)存順序沖突(memory order violation)而引起CPU流水線被清空(CPU pipeline flush),從而提高CPU的執(zhí)行效率。
?
3. 只能保證一個(gè)共享變量的原子操作。當(dāng)對(duì)一個(gè)共享變量執(zhí)行操作時(shí),我們可以使用循環(huán)CAS的方式來(lái)保證原子操作,但是對(duì)多個(gè)共享變量操作時(shí),循環(huán)CAS就無(wú)法保證操作的原子性,這個(gè)時(shí)候就可以用鎖,或者有一個(gè)取巧的辦法,就是把多個(gè)共享變量合并成一個(gè)共享變量來(lái)操作。比如有兩個(gè)共享變量i=2,j=a,合并一下ij=2a,然后用CAS來(lái)操作ij。從Java1.5開(kāi)始JDK提供了AtomicReference類來(lái)保證引用對(duì)象之間的原子性,你可以把多個(gè)變量放在一個(gè)對(duì)象里來(lái)進(jìn)行CAS操作。
四、 concurrent包的實(shí)現(xiàn)
由于java的CAS同時(shí)具有 volatile 讀和volatile寫(xiě)的內(nèi)存語(yǔ)義,因此Java線程之間的通信現(xiàn)在有了下面四種方式:
Java的CAS會(huì)使用現(xiàn)代處理器上提供的高效機(jī)器級(jí)別原子指令,這些原子指令以原子方式對(duì)內(nèi)存執(zhí)行讀-改-寫(xiě)操作,這是在多處理器中實(shí)現(xiàn)同步的關(guān)鍵(從本質(zhì)上來(lái)說(shuō),能夠支持原子性讀-改-寫(xiě)指令的計(jì)算機(jī)器,是順序計(jì)算圖靈機(jī)的異步等價(jià)機(jī)器,因此任何現(xiàn)代的多處理器都會(huì)去支持某種能對(duì)內(nèi)存執(zhí)行原子性讀-改-寫(xiě)操作的原子指令)。同時(shí),volatile變量的讀/寫(xiě)和CAS可以實(shí)現(xiàn)線程之間的通信。把這些特性整合在一起,就形成了整個(gè)concurrent包得以實(shí)現(xiàn)的基石。如果我們仔細(xì)分析concurrent包的源代碼實(shí)現(xiàn),會(huì)發(fā)現(xiàn)一個(gè)通用化的實(shí)現(xiàn)模式:
AQS,非阻塞數(shù)據(jù)結(jié)構(gòu)和原子變量類(java.util.concurrent.atomic包中的類),這些concurrent包中的基礎(chǔ)類都是使用這種模式來(lái)實(shí)現(xiàn)的,而concurrent包中的高層類又是依賴于這些基礎(chǔ)類來(lái)實(shí)現(xiàn)的。從整體來(lái)看,concurrent包的實(shí)現(xiàn)示意圖如下:
(二)在AtomicInteger中應(yīng)用
CAS原理:?
? ? ? 通過(guò)查看AtomicInteger的源碼可知,?
? ? ? ?`private volatile int value;
public final boolean compareAndSet(int expect, int update) {?
? ? ? ? ? ? ? ? ? ? return unsafe.compareAndSwapInt(this, valueOffset, expect, update);?
? ? ? ? ? ? ? ?} `?
? ? ? ? ? ? 通過(guò)申明一個(gè)volatile (內(nèi)存鎖定,同一時(shí)刻只有一個(gè)線程可以修改內(nèi)存值)類型的變量,再加上unsafe.compareAndSwapInt的方法,來(lái)保證實(shí)現(xiàn)線程同步的。
二、CAS(Compare and Swap)
CAS指令在Intel CPU上稱為CMPXCHG指令,它的作用是將指定內(nèi)存地址的內(nèi)容與所給的某個(gè)值相比,如果相等,則將其內(nèi)容替換為指令中提供的新值,如果不相等,則更新失敗。這一比較并交換的操作是原子的,不可以被中斷。初一看,CAS也包含了讀取、比較 (這也是種操作)和寫(xiě)入這三個(gè)操作,和之前的i++并沒(méi)有太大區(qū)別,是的,的確在操作上沒(méi)有區(qū)別,但CAS是通過(guò)硬件命令保證了原子性,而i++沒(méi)有,且硬件級(jí)別的原子性比i++這樣高級(jí)語(yǔ)言的軟件級(jí)別的運(yùn)行速度要快地多。雖然CAS也包含了多個(gè)操作,但其的運(yùn)算是固定的(就是個(gè)比較),這樣的鎖定性能開(kāi)銷很小。
從內(nèi)存領(lǐng)域來(lái)說(shuō)這是樂(lè)觀鎖,因?yàn)樗趯?duì)共享變量更新之前會(huì)先比較當(dāng)前值是否與更新前的值一致,如果是,則更新,如果不是,則無(wú)限循環(huán)執(zhí)行(稱為自旋),直到當(dāng)前值與更新前的值一致為止,才執(zhí)行更新。
??簡(jiǎn)單的來(lái)說(shuō),CAS有3個(gè)操作數(shù),內(nèi)存值V,舊的預(yù)期值A(chǔ),要修改的新值B。當(dāng)且僅當(dāng)預(yù)期值A(chǔ)和內(nèi)存值V相同時(shí),將內(nèi)存值V修改為B,否則返回V。這是一種樂(lè)觀鎖的思路,它相信在它修改之前,沒(méi)有其它線程去修改它;而Synchronized是一種悲觀鎖,它認(rèn)為在它修改之前,一定會(huì)有其它線程去修改它,悲觀鎖效率很低。下面來(lái)看一下AtomicInteger是如何利用CAS實(shí)現(xiàn)原子性操作的。
volatile變量
[java]?view plaincopy[java]?view plaincopy
Compare And Set
[java]?view plaincopy比較并設(shè)置,這里利用Unsafe類的JNI方法實(shí)現(xiàn),使用CAS指令,可以保證讀-改-寫(xiě)是一個(gè)原子操作。compareAndSwapInt有4個(gè)參數(shù),this - 當(dāng)前AtomicInteger對(duì)象,Offset - value屬性在內(nèi)存中的位置(需要強(qiáng)調(diào)的是不是value值在內(nèi)存中的位置),expect - 預(yù)期值,update - 新值,根據(jù)上面的CAS操作過(guò)程,當(dāng)內(nèi)存中的value值等于expect值時(shí),則將內(nèi)存中的value值更新為update值,并返回true,否則返回false。在這里我們有必要對(duì)Unsafe有一個(gè)簡(jiǎn)單點(diǎn)的認(rèn)識(shí),從名字上來(lái)看,不安全,確實(shí),這個(gè)類是用于執(zhí)行低級(jí)別的、不安全操作的方法集合,這個(gè)類中的方法大部分是對(duì)內(nèi)存的直接操作,所以不安全,但當(dāng)我們使用反射、并發(fā)包時(shí),都間接的用到了Unsafe。
循環(huán)設(shè)置
現(xiàn)在在來(lái)看開(kāi)篇提到的兩個(gè)方法,我們拿incrementAndGet來(lái)分析一下其實(shí)現(xiàn)過(guò)程。 [java]?view plaincopy循環(huán)內(nèi),獲取當(dāng)前值并設(shè)置更新值,調(diào)用compareAndSet進(jìn)行CAS操作,如果成功就返回更新至,否則重試到成功為止。這里可能存在一個(gè)隱患,那就是循環(huán)時(shí)間過(guò)長(zhǎng),總是在當(dāng)前線程compareAndSet時(shí),有另一個(gè)線程設(shè)置了value(點(diǎn)子太背了),這個(gè)當(dāng)然是屬于小概率時(shí)間,目前Java貌似還不能處理這種情況。
CAS用作原子操作
現(xiàn)在CPU內(nèi)部已經(jīng)執(zhí)行原子的CAS操作。Java5以來(lái),你可以使用java.util.concurrent.atomic包中的一些原子類來(lái)使用CPU中的這些功能。
下面是一個(gè)使用AtomicBoolean類實(shí)現(xiàn)lock()方法的例子:
[java]?view plaincopylocked變量不再是boolean類型而是AtomicBoolean。這個(gè)類中有一個(gè)compareAndSet()方法,它使用一個(gè)期望值和AtomicBoolean實(shí)例的值比較,和兩者相等,則使用一個(gè)新值替換原來(lái)的值。在這個(gè)例子中,它比較locked的值和false,如果locked的值為false,則把修改為true。
如果值被替換了,compareAndSet()返回true,否則,返回false。
使用Java5+提供的CAS特性而不是使用自己實(shí)現(xiàn)的的好處是Java5+中內(nèi)置的CAS特性可以讓你利用底層的你的程序所運(yùn)行機(jī)器的CPU的CAS特性。這會(huì)使還有CAS的代碼運(yùn)行更快。
簡(jiǎn)單例子:
[java]?view plaincopycas缺點(diǎn)
雖然使用CAS可以實(shí)現(xiàn)非阻塞式的原子性操作,但是會(huì)產(chǎn)生ABA問(wèn)題,關(guān)于ABA問(wèn)題:? ? ? ?有ABA問(wèn)題(即在更新前的值是A,但在操作過(guò)程中被其他線程更新為B,又更新為 A),這時(shí)當(dāng)前線程認(rèn)為是可以執(zhí)行的,其實(shí)是發(fā)生了不一致現(xiàn)象,如果這種不一致對(duì)程序有影響(真正有這種影響的場(chǎng)景很少,除非是在變量操作過(guò)程中以此變量為標(biāo)識(shí)位做一些其他的事,比如初始化配置),則需要使用AtomicStampedReference(除了對(duì)更新前的原值進(jìn)行比較,也需要用更新前的 stamp標(biāo)志位來(lái)進(jìn)行比較)。
總結(jié):?
可以用CAS在無(wú)鎖的情況下實(shí)現(xiàn)原子操作,但要明確應(yīng)用場(chǎng)合,非常簡(jiǎn)單的操作且又不想引入鎖可以考慮使用CAS操作,當(dāng)想要非阻塞地完成某一操作也可以考慮CAS。不推薦在復(fù)雜操作中引入CAS,會(huì)使程序可讀性變差,且難以測(cè)試,同時(shí)會(huì)出現(xiàn)ABA問(wèn)題
總結(jié)
以上是生活随笔為你收集整理的CAS操作确保原子性的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 数据预处理—数据清洗(2)—异常值(极值
- 下一篇: matlab 创建批量文件夹_初识MAT