Linux Kernel中spinlock的设计与实现
👉👉👉 個人博客筆記導讀目錄(全部) 👈👈👈
.
說明:
在默認情況下,本文講述的都是ARMV8-aarch64架構,linux kernel 5.14
背景
早期spinlock的設計
早期的spinlock的設計是鎖的擁有者加鎖時將鎖的值設置為1,釋放鎖時將鎖的值設置為0,這樣做的缺點是會出現 先來搶占鎖的進程一直搶占不到鎖,而后來的進程可能一來 就能獲取到鎖。導致這個原因的是先搶占的進程和后搶占的進程在搶占鎖時并沒有一個先后關系,最終就是離鎖所在的內存最近的cpu節點就有更多的機會搶占鎖,離鎖所在內存遠的節點可能一直搶占不到。
新版spinlock設計
為了解決這個spinlock的不公平問題,linux 2.6.25內核以后,spinlock采用了一種"FIFO ticket-based"算法的spinlock機制,可以很好的實現先來先搶占的思想。具體的做法如下:
- (1)、spinlock的核心字段有owner和next,在初始時,owner=next=0
- (2)、當第一個進程搶占spinlock時,會在進程函數本地保存下next的值,也就是next=0,并將spinlock的next字段加1;
- (3)、當獲取spinlock的進程的本地next和spinlock的owner相等時,該進程就獲取到spinlock;
- (4)、由于第一個進程本地的next=0,并且spinlock的owner為0,所以第一個CPU獲取到spinlock;
- (5)、接著當第二個進程搶占spinlock,此時spinlock的next值為1,保存到本地,然后將spinlock的next字段加1。而spinlock的owner字段依然為0,第二個進程的本地next 不等于spinlock的owner,所以一直自旋等待spinlock;
- (6)、第三個進程搶占spinlock,得到本地next值為2,然后將spinlock的next字段加1。此時spinlock的owner字段還是為0,所以第三個進程自旋等待。
- (7)、當第一個進程處理完臨界區以后,就釋放spinlock,執行的操作是將spinlock的owner字段加1;
- (8)、由于第二個進程和第三個進程都還在等待spinlock,他們會不停第獲取spinlock的owner字段,并和自己本地的next值進行比較。當第二個進程發現自己的next值和spinlock的owner字段相等時(此時next == owner == 2),第二個進程就獲取到spinlock。第三個進程的本地next值是3,和spinlock的owner字段不相等,所以繼續等待;
- (9)、只有在第二個進程釋放了spinlock,就會將spinlock的owner字段加1,第三個進程才有機會獲取spinlock。
我在舉個例子,如下:
T1 : 進程1調用spin_lock,此時next=0, owner=0獲得該鎖,在arch_spin_lock()底層實現中,會next++
T2 : 進程2調用spin_lock,此時next=1, owner=0沒有獲得該鎖,while(1)中調用wfe指令standby在那里,等待owner==next成立.
T3 : 進程3調用spin_lock,此時next=2, owner=0沒有獲得該鎖,while(1)中調用wfe指令standby在那里,等待owner==next成立.
T4&T5 : 進程1調用spin_unlock,此時owner++,即owner=1,接著調用sev指令,讓進程2和進程3退出standby狀態,走while(1)流程,重新檢查owner==next條件。此時進程2條件成立,進程3繼續等待。進程2獲得該鎖,進程3繼續等待。
Linux Kernel中的SpinLock的實現
(linux/include/linux/spinlock.h)static __always_inline void spin_unlock(spinlock_t *lock) {raw_spin_unlock(&lock->rlock); }static __always_inline void spin_lock(spinlock_t *lock) {raw_spin_lock(&lock->rlock); } (linux/include/linux/spinlock.h)#define raw_spin_lock_irq(lock) _raw_spin_lock_irq(lock) #define raw_spin_lock_bh(lock) _raw_spin_lock_bh(lock) #define raw_spin_unlock(lock) _raw_spin_unlock(lock) #define raw_spin_unlock_irq(lock) _raw_spin_unlock_irq(lock)#define raw_spin_lock(lock) _raw_spin_lock(lock) (linux/kernel/locking/spinlock.c)#ifdef CONFIG_UNINLINE_SPIN_UNLOCK void __lockfunc _raw_spin_unlock(raw_spinlock_t *lock) {__raw_spin_unlock(lock); } EXPORT_SYMBOL(_raw_spin_unlock); #endif#ifndef CONFIG_INLINE_SPIN_LOCK void __lockfunc _raw_spin_lock(raw_spinlock_t *lock) {__raw_spin_lock(lock); } EXPORT_SYMBOL(_raw_spin_lock); #endif (linux/include/linux/spinlock_api_smp.h)static inline void __raw_spin_unlock(raw_spinlock_t *lock) {spin_release(&lock->dep_map, _RET_IP_);do_raw_spin_unlock(lock);preempt_enable(); }static inline void __raw_spin_lock(raw_spinlock_t *lock) {preempt_disable();spin_acquire(&lock->dep_map, 0, 0, _RET_IP_);LOCK_CONTENDED(lock, do_raw_spin_trylock, do_raw_spin_lock); } (linux/include/linux/spinlock.h)static inline void do_raw_spin_unlock(raw_spinlock_t *lock) __releases(lock) {mmiowb_spin_unlock();arch_spin_unlock(&lock->raw_lock);__release(lock); }static inline void do_raw_spin_lock(raw_spinlock_t *lock) __acquires(lock) {__acquire(lock);arch_spin_lock(&lock->raw_lock);mmiowb_spin_lock(); } (linux/include/asm-generic/qspinlock.h)#define arch_spin_is_locked(l) queued_spin_is_locked(l) #define arch_spin_is_contended(l) queued_spin_is_contended(l) #define arch_spin_value_unlocked(l) queued_spin_value_unlocked(l) #define arch_spin_lock(l) queued_spin_lock(l) #define arch_spin_trylock(l) queued_spin_trylock(l) #define arch_spin_unlock(l) queued_spin_unlock(l)queued_spin_lock等的實現在linux/kernel/locking/qspinlock.c,不是一般的復雜,我們就不貼代碼分析了。總之底層用到了ldxr、stxr等exclusive獨占的指令
總結
以上是生活随笔為你收集整理的Linux Kernel中spinlock的设计与实现的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Exclusive monitor在sp
- 下一篇: [reference]-Features