记一次redis规模化运维讨论会
http://www.10tiao.com/html/490/201608/2648672432/1.html
7月29日下午,在滴滴,有幸邀請到了業(yè)界的一些同學(xué),一起就「redis規(guī)模化運維」踩過的坑和最佳實踐,做了深入的討論和交流。知識是無價的,分享卻是無私的,非常感謝各位朋友們的參與。「世上本沒有路,填的坑多了,便成了路」共勉。
?
滴滴codis集群運維實踐
主講人:曾凡禹、刑惺
?
codis是滴滴業(yè)務(wù)依賴最重的基礎(chǔ)服務(wù)之一,上千臺服務(wù)器,上百套集群。過多的集群,給運維上帶來了很多的挑戰(zhàn)和阻礙,這是由于對codis的集群穩(wěn)定性把控不足,為了減少單個集群故障對業(yè)務(wù)的影響范圍,所以不得已而為之,物理上的隔離造成了集群數(shù)量變多,同時資源利用率無法最大化。
?
滴滴的同學(xué),給我們從以下幾個方面,做了拆解:
-
滴滴redis架構(gòu)的演進(jìn)
-
codis在運維中存在的一些問題
-
codis連接關(guān)閉慢引發(fā)的事故
-
滴滴對于codis的一些改進(jìn)
?
?
?
小米redis運維實踐?
主講人:卓汝林、張文
?
小米的同學(xué),從redis-cluster3.0 beta7(2014年6月),就開始引入生產(chǎn)環(huán)境嘗試,到目前的百余個集群,數(shù)千個節(jié)點的規(guī)模,單個集群內(nèi)存容量1TB+,15億+的鍵,百萬級QPS的吞吐量,其中經(jīng)歷了各種各樣的問題,也積累了豐富的實踐經(jīng)驗。
?
汝林從以下幾個方面為我們做了精彩的呈現(xiàn):
?
-
RedisCluster在小米的運營簡介 ?
-
Redis Monitor? and Alarm
-
Redis Troubleshooting cases
-
Redis Cluster capacity planning
-
Redis大規(guī)模運營過程遇到的問題
?
從汝林的分享中,我們深深感受到了小米的同學(xué),精細(xì)化運維的態(tài)度和追求極致的精神,以監(jiān)控為例,監(jiān)控維度覆蓋了CPU、IO、Memory、Network、Latency、再到redis自身運行相關(guān)的業(yè)務(wù)指標(biāo),都做了詳盡的覆蓋和研究,確保了集群的運行狀態(tài)都處于可控、透明的狀態(tài)。
?
?
此外,汝林也細(xì)數(shù)了在redis cluster運維過程中,踩過的各種坑,以及對應(yīng)的排查思路和解決方案,從理論到實踐,都做了非常詳細(xì)的闡述,是不可多得的第一手資料。
?
?
優(yōu)酷藍(lán)鯨系統(tǒng)簡介
主講人:吳建超?
?
吳建超同學(xué),分享了優(yōu)酷基于redis cluster所構(gòu)建的一體化存儲解決方案,為我們打開了另外一種思路,感受到了不同的運維風(fēng)格。
?
-
集群目前的狀況
-
集群結(jié)構(gòu)
-
我們在SDK方面的工作
-
我們在運維方面的工作
-
監(jiān)控、報警
-
重寫運維腳本
?
?
?
微博redis服務(wù)化之路?
主講人:曹增濤?
?
微博作為國內(nèi)最早大規(guī)模使用redis的公司之一,在redis方面做了非常多的探索和優(yōu)化。曹增濤同學(xué),從以下方面給大家做了深入的分享。
?
-
redis在微博應(yīng)用介紹
-
redis在微博架構(gòu)中的應(yīng)用
-
redis運維中遇到的一些問題及改造
-
redis服務(wù)化之路
?
微博在對redis的持續(xù)優(yōu)化中,最令人印象深刻的,包括有“主從優(yōu)化”、“支持動態(tài)升級”、“持久化優(yōu)化”,其中動態(tài)升級,在規(guī)模化運維中,能幫助我們大幅提升效率。
在高可用方面,采用一主多從,故障自動選主等手段來保障,同時通過優(yōu)化“主從同步”來提升效率和保障可用性。
redis作為使用最廣泛的服務(wù),如何與整個運維體系打通,提升運維效率,也是至關(guān)重要的。
?
?
?
?
?
Redis in Baidu
主講人:閆宇?
?
百度云的閆宇同學(xué),則著重從服務(wù)化的角度,詳細(xì)的拆解了,redis在百度云的應(yīng)用場景、優(yōu)化、運維實踐等方面,讓我們感受到了“大廠的風(fēng)范”:)
一個場景分析和改造的案例:
?
redis服務(wù)化支撐體系
?
?
餓了么redis運維實踐
主講人:郭浩川
?
最后,浩川同學(xué),介紹了餓了么在redis運維自動化方面的工作,非常精彩,同時也分享了餓了么在運維過程中踩過的坑...
分享了他們在運維過程中總結(jié)出來的一些最佳實踐
餓了么的redis監(jiān)控非常體系化,給大家留下了非常深的印象。
?
?
?
送上現(xiàn)場照片,感謝各位朋友一起交流
?
?
轉(zhuǎn)載于:https://www.cnblogs.com/davidwang456/articles/9305338.html
總結(jié)
以上是生活随笔為你收集整理的记一次redis规模化运维讨论会的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 蘑菇街的稳定性实践
- 下一篇: 如何优雅的分析 Redis 里存了啥?