Leaf:美团分布式ID生成服务开源
Leaf是美團(tuán)基礎(chǔ)研發(fā)平臺推出的一個分布式ID生成服務(wù),名字取自德國哲學(xué)家、數(shù)學(xué)家萊布尼茨的一句話:“There are no two identical leaves in the world.”Leaf具備高可靠、低延遲、全局唯一等特點。目前已經(jīng)廣泛應(yīng)用于美團(tuán)金融、美團(tuán)外賣、美團(tuán)酒旅等多個部門。具體的技術(shù)細(xì)節(jié),可參考此前美團(tuán)技術(shù)博客的一篇文章:《Leaf美團(tuán)分布式ID生成服務(wù)》。近日,Leaf項目已經(jīng)在Github上開源:https://github.com/Meituan-Dianping/Leaf,希望能和更多的技術(shù)同行一起交流、共建。
Leaf特性
Leaf在設(shè)計之初就秉承著幾點要求:
Leaf誕生
Leaf第一個版本采用了預(yù)分發(fā)的方式生成ID,即可以在DB之上掛N個Server,每個Server啟動時,都會去DB拿固定長度的ID List。這樣就做到了完全基于分布式的架構(gòu),同時因為ID是由內(nèi)存分發(fā),所以也可以做到很高效。接下來是數(shù)據(jù)持久化問題,Leaf每次去DB拿固定長度的ID List,然后把最大的ID持久化下來,也就是并非每個ID都做持久化,僅僅持久化一批ID中最大的那一個。這個方式有點像游戲里的定期存檔功能,只不過存檔的是未來某個時間下發(fā)給用戶的ID,這樣極大地減輕了DB持久化的壓力。
整個服務(wù)的具體處理過程如下:
- Leaf Server 1:從DB加載號段[1,1000]。
- Leaf Server 2:從DB加載號段[1001,2000]。
- Leaf Server 3:從DB加載號段[2001,3000]。
用戶通過Round-robin的方式調(diào)用Leaf Server的各個服務(wù),所以某一個Client獲取到的ID序列可能是:1,1001,2001,2,1002,2002……也可能是:1,2,1001,2001,2002,2003,3,4……當(dāng)某個Leaf Server號段用完之后,下一次請求就會從DB中加載新的號段,這樣保證了每次加載的號段是遞增的。
Leaf數(shù)據(jù)庫中的號段表格式如下:
+-------------+--------------+------+-----+-------------------+-----------------------------+ | Field | Type | Null | Key | Default | Extra | +-------------+--------------+------+-----+-------------------+-----------------------------+ | biz_tag | varchar(128) | NO | PRI | | | | max_id | bigint(20) | NO | | 1 | | | step | int(11) | NO | | NULL | | | desc | varchar(256) | YES | | NULL | | | update_time | timestamp | NO | | CURRENT_TIMESTAMP | on update CURRENT_TIMESTAMP | +-------------+--------------+------+-----+-------------------+-----------------------------+Leaf Server加載號段的SQL語句如下:
Begin UPDATE table SET max_id=max_id+step WHERE biz_tag=xxx SELECT tag, max_id, step FROM table WHERE biz_tag=xxx Commit整體上,V1版本實現(xiàn)比較簡單,主要是為了盡快解決業(yè)務(wù)層DB壓力的問題,而快速迭代出的一個版本。因而在生產(chǎn)環(huán)境中,也發(fā)現(xiàn)了些問題。比如:
Leaf雙Buffer優(yōu)化
為了解決這兩個問題,Leaf采用了異步更新的策略,同時通過雙Buffer的方式,保證無論何時DB出現(xiàn)問題,都能有一個Buffer的號段可以正常對外提供服務(wù),只要DB在一個Buffer的下發(fā)的周期內(nèi)恢復(fù),就不會影響整個Leaf的可用性。
這個版本代碼在線上穩(wěn)定運(yùn)行了半年左右,Leaf又遇到了新的問題:
Leaf動態(tài)調(diào)整Step
假設(shè)服務(wù)QPS為Q,號段長度為L,號段更新周期為T,那么Q * T = L。最開始L長度是固定的,導(dǎo)致隨著Q的增長,T會越來越小。但是Leaf本質(zhì)的需求是希望T是固定的。那么如果L可以和Q正相關(guān)的話,T就可以趨近一個定值了。所以Leaf每次更新號段的時候,根據(jù)上一次更新號段的周期T和號段長度step,來決定下一次的號段長度nextStep:
- T < 15min,nextStep = step * 2
- 15min < T < 30min,nextStep = step
- T > 30min,nextStep = step / 2
至此,滿足了號段消耗穩(wěn)定趨于某個時間區(qū)間的需求。當(dāng)然,面對瞬時流量幾十、幾百倍的暴增,該種方案仍不能滿足可以容忍數(shù)據(jù)庫在一段時間不可用、系統(tǒng)仍能穩(wěn)定運(yùn)行的需求。因為本質(zhì)上來講,Leaf雖然在DB層做了些容錯方案,但是號段方式的ID下發(fā),最終還是需要強(qiáng)依賴DB。
MySQL高可用
在MySQL這一層,Leaf目前采取了半同步的方式同步數(shù)據(jù),通過公司DB中間件Zebra加MHA做的主從切換。未來追求完全的強(qiáng)一致,會考慮切換到MySQL Group Replication。
現(xiàn)階段由于公司數(shù)據(jù)庫強(qiáng)一致的特性還在演進(jìn)中,Leaf采用了一個臨時方案來保證機(jī)房斷網(wǎng)場景下的數(shù)據(jù)一致性:
- 多機(jī)房部署數(shù)據(jù)庫,每個機(jī)房一個實例,保證都是跨機(jī)房同步數(shù)據(jù)。
- 半同步超時時間設(shè)置到無限大,防止半同步方式退化為異步復(fù)制。
Leaf監(jiān)控
針對服務(wù)自身的監(jiān)控,Leaf提供了Web層的內(nèi)存數(shù)據(jù)映射界面,可以實時看到所有號段的下發(fā)狀態(tài)。比如每個號段雙buffer的使用情況,當(dāng)前ID下發(fā)到了哪個位置等信息都可以在Web界面上查看。
Leaf Snowflake
Snowflake,Twitter開源的一種分布式ID生成算法。基于64位數(shù)實現(xiàn),下圖為Snowflake算法的ID構(gòu)成圖。
- 第1位置為0。
- 第2-42位是相對時間戳,通過當(dāng)前時間戳減去一個固定的歷史時間戳生成。
- 第43-52位是機(jī)器號workerID,每個Server的機(jī)器ID不同。
- 第53-64位是自增ID。
這樣通過時間+機(jī)器號+自增ID的組合來實現(xiàn)了完全分布式的ID下發(fā)。
在這里,Leaf提供了Java版本的實現(xiàn),同時對Zookeeper生成機(jī)器號做了弱依賴處理,即使Zookeeper有問題,也不會影響服務(wù)。Leaf在第一次從Zookeeper拿取workerID后,會在本機(jī)文件系統(tǒng)上緩存一個workerID文件。即使ZooKeeper出現(xiàn)問題,同時恰好機(jī)器也在重啟,也能保證服務(wù)的正常運(yùn)行。這樣做到了對第三方組件的弱依賴,一定程度上提高了SLA。
未來規(guī)劃
- 號段加載優(yōu)化:Leaf目前重啟后的第一次請求還是會同步加載MySQL,之所以這么做而非服務(wù)初始化加載號段的原因,主要是MySQL中的Leaf Key并非一定都被這個Leaf服務(wù)節(jié)點所加載,如果每個Leaf節(jié)點都在初始化加載所有的Leaf Key會導(dǎo)致號段的大量浪費(fèi)。因此,未來會在Leaf服務(wù)Shutdown時,備份這個服務(wù)節(jié)點近一天使用過的Leaf Key列表,這樣重啟后會預(yù)先從MySQL加載Key List中的號段。
- 單調(diào)遞增:簡易的方式,是只要保證同一時間、同一個Leaf Key都從一個Leaf服務(wù)節(jié)點獲取ID,即可保證遞增。需要注意的問題是Leaf服務(wù)節(jié)點切換時,舊Leaf 服務(wù)用過的號段需要廢棄。路由邏輯,可采用主備的模型或者每個Leaf Key 配置路由表的方式來實現(xiàn)。
關(guān)于開源
分布式ID生成的方案有很多種,Leaf開源版本提供了兩種ID的生成方式:
- 號段模式:低位趨勢增長,較少的ID號段浪費(fèi),能夠容忍MySQL的短時間不可用。
- Snowflake模式:完全分布式,ID有語義。
讀者可以按需選擇適合自身業(yè)務(wù)場景的ID下發(fā)方式。希望美團(tuán)的方案能給予大家一些幫助,同時也希望各位能夠一起交流、共建。
Leaf項目Github地址:https://github.com/Meituan-Dianping/Leaf 。
如有任何疑問和問題,歡迎提交至Github issues。
總結(jié)
以上是生活随笔為你收集整理的Leaf:美团分布式ID生成服务开源的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 人工智能在线特征系统中的数据存取技术
- 下一篇: 细说ReactiveCocoa的冷信号与