异数OS 2017 DPDK 峰会观后感
1.DPDK in Container
使用虛擬網(wǎng)卡設(shè)備技術(shù)為每一個(gè)容器分配一個(gè)IP 網(wǎng)卡適配器(queue)。容器技術(shù)可以解決虛擬機(jī)技術(shù)中虛擬機(jī)過于臃腫,難于熱遷移的問題,可能可以代替美團(tuán)OVS方案,解決OVS熱遷移方案不足的問題。
2.F-Stack
F-Stack拒絕有意義的提問,帶來了現(xiàn)場的一番哄笑,F-Stack違背了DPDK最初的技術(shù)方向,其提供了POSIX接口被迫使用了Linux線程IO模型,導(dǎo)致其能力只能達(dá)到linux協(xié)議棧RSS 無鎖優(yōu)化后的1.4倍,這是mtcp ans 也存在的同樣問題,而完全放棄Linux線程IO模型自己實(shí)現(xiàn)OS任務(wù)調(diào)度的seastar則是F-Stack mtcp ans 性能的5-10倍。
F-Stack拒絕了長連接性能,技術(shù)上講這主要是因?yàn)橹腃10K問題,在linux windows等主流操作系統(tǒng)中,在無法做QOS的情況下,大量長連接會(huì)很不穩(wěn)定,導(dǎo)致雪崩問題,C10K問題不解決,則高效的消息推送方案則無法實(shí)施,比如未來的websocket技術(shù),IM領(lǐng)域的360Push Whatsapp 環(huán)信等應(yīng)用場合就無法做到,長連接性能直接關(guān)系到IM的運(yùn)營成本,不知道微信是否有用F-Stack,具體可以參看Whatsapp “零”運(yùn)營技術(shù),而這一塊內(nèi)容是異數(shù)OS方案需要解決的問題重點(diǎn)。
F-Stack演講者則用兩個(gè)現(xiàn)實(shí)問題搪塞了技術(shù)問題,說騰訊的業(yè)務(wù)都是短鏈接業(yè)務(wù),騰訊的業(yè)務(wù)平臺(tái)都要使用linux生態(tài),所以放棄了自研協(xié)議棧,這在技術(shù)上講實(shí)際是一種退步。
F-Stack在Send時(shí)多出現(xiàn)了一次內(nèi)存拷貝動(dòng)作,這個(gè)問題在異數(shù)OS中則被解決,原理是用異數(shù)OS的惰性IO資源,利用可用的ring buffer,在ring buffer可用的時(shí)候調(diào)度TCP worker線程在ring buffer上直接進(jìn)行發(fā)包渲染工作。
3.A Better Virtio towords NFV Cloud
高科技,不懂:)
4.SPDK
沒詳細(xì)聽,感覺意義不是特別重大,因?yàn)閼?yīng)用系統(tǒng)中,磁盤IO壓力不會(huì)特別高,而且存儲(chǔ)是有壽命的,不宜頻繁使用,好的系統(tǒng)設(shè)計(jì),比如一些kv都是盡量少的提交持久化磁盤任務(wù),所以更好的文件系統(tǒng)以及更好的持久化任務(wù)系統(tǒng)(OS)才是真正的重點(diǎn)。
5.性能調(diào)優(yōu)
for循環(huán)優(yōu)化在內(nèi)存io密集型應(yīng)用方面用不上,只能用在多層for循環(huán)重壓力算法中,另外dpdk的內(nèi)存預(yù)讀是否有用,我這邊使用的gcc的是沒有用的,不管是連續(xù)方寸還是隨機(jī)訪問。
問及Hash 隨機(jī)訪存優(yōu)化,演講者就說去看vpp...要看的話就不要問了...
6. 美團(tuán)OVS
7.DPDL
聽的不太清楚,個(gè)人理解是RSS FDIR等技術(shù)并不能解決所有負(fù)載分流問題,所以需要誕生一種多核同時(shí)能處理一個(gè)ring的需求。因此原本的單生產(chǎn)者單消費(fèi)者的ring需要被擴(kuò)展設(shè)計(jì)出多生產(chǎn)者多消費(fèi)者的ring,本來單生產(chǎn)者單消費(fèi)者的ring是利用cache一致性協(xié)議無鎖無atom的多核通訊,cache line內(nèi)不需要保序,但需求變更后則會(huì)要求加鎖保序。
提問者則有質(zhì)疑,這樣的情況加鎖則意味著阻塞CPU核,最壞的自旋鎖情況則是多核比單核還慢。
提問者的質(zhì)疑異數(shù)OS提供了解決方案。
異數(shù)OS的虛擬交換機(jī)使用無鎖無atom的多生產(chǎn)者多消費(fèi)者的設(shè)計(jì),用于LPC的實(shí)現(xiàn),但必須配合異數(shù)OS使用,原理上講,他還是利用cache 一致性協(xié)議,沒有OS的情況,則只能自旋鎖阻塞CPU核,但是有OS則可以在try無效時(shí)做線程切換動(dòng)作,在Linux下,這兩種鎖都被應(yīng)用實(shí)做以便于適應(yīng)不同的情況,原因是linux的線程切換代價(jià)極高,所以直接決定了鎖能夠達(dá)到的頻度,頻度不高時(shí)可以使用線程切換的自旋鎖,以便于充實(shí)CPU核,帶來性能提升,但網(wǎng)卡ring的PMD頻度很高,則不能用這種方式,而異數(shù)OS則可以用這個(gè)方案,原因是異數(shù)OS每盒最大線程切換能力可以達(dá)到50M。
8.intel 25Gbe Ethernet Adapter
個(gè)人理解,交換機(jī)領(lǐng)域功能不足,OS協(xié)議棧性能不濟(jì)的情況下,限制了其推廣。
9.DPDK Cryptodev Framework
提問者質(zhì)疑延遲的問題,因?yàn)閞ing 要利用cache加速,不可能做大,因此延遲很敏感。
10.騰訊DDOS清洗
只講了使用DPDK抓包,清洗算法未知,做到了90M的速度,所以猜測只是一些DPI,fastpath,不能做復(fù)雜的session清洗。
所以提問者立刻問了能不能做5層6層7層清洗,集群黑名單同步等問題,顯然是無解的,所以現(xiàn)場再次哄笑。DPDK社區(qū)群上有人懷疑騰訊來的人都是做技術(shù)運(yùn)維的。
11.Low Latency Interrupt Mode PMD
回歸到了一個(gè)經(jīng)典問題,DPDK只看到了自己的問題,沒發(fā)現(xiàn)別人玩不轉(zhuǎn),DPDK說我用用戶層PMD繞開Linux內(nèi)核協(xié)議棧,Linux說,沒我你做不出協(xié)議棧,這個(gè)問題又再次出現(xiàn)了,在局部上講,低流量壓力下時(shí)PMD浪費(fèi)CPU資源,引入中斷模式的PMD可能會(huì)有效率,但是中斷關(guān)系到OS的線程切換,為了減少線程切換,一般要用綁核以及本地化任務(wù)調(diào)度等技術(shù),但中斷顯然打破了上層設(shè)計(jì)格局。
提問者大概的意思是中斷速率和PMD速率是否可以自動(dòng)根據(jù)網(wǎng)絡(luò)流量做自適應(yīng)調(diào)節(jié),但沒有得到直接答復(fù),因?yàn)檫@可能超過了演講者的問題理解范圍。
異數(shù)OS則在這個(gè)問題上做了完整解決。
異數(shù)OS的PMD線程會(huì)被QOS做IOPS控制,在不同壓力下可以自適應(yīng)變化到1M 2M....10M,在try miss的情況下PMD線程會(huì)被QOS掛起,切換到其他就緒線程(包括idle降溫線程),在IOPS資源可用時(shí)再被喚醒回來。
12.嵌入式交換機(jī)解決方案
交換機(jī)不是太懂:)
13.Panabit Support Millons Users in vBRAS
QQ技術(shù)群中 move經(jīng)驗(yàn)豐富 測試過他們的產(chǎn)品,說syn異常時(shí),鏈接資源無法被清理,只能reboot,那么說明他們應(yīng)該沒有OS來管理龐大的session 生命期,只是個(gè)fastpath,甚至連定時(shí)器都沒有(定時(shí)器在海量鏈接時(shí)很耗資源)。
孫總的銷售思路比研發(fā)在戰(zhàn)略上肯定更加清晰,導(dǎo)致論戰(zhàn)上的勝利。
如果有OS的話,有希望做應(yīng)用業(yè)務(wù)級(jí)別精確的QOS,所以顛覆式創(chuàng)新比標(biāo)準(zhǔn)制定者(中興華為)肯定更能獲得希望,但他們的OS真做了嗎?
14. DPDK PMD in LXC
上場論戰(zhàn)太感人,在回味,所以沒聽。
15.Yuanshan DDOS清洗
降低的比騰訊要豐富些,但關(guān)鍵的清洗識(shí)別算法是保密的。
值得關(guān)注的是演講者講了一個(gè)冷笑話對(duì)全場主題做了一個(gè)有意義的總結(jié),說一座山擋住wifi信號(hào),然后愚公移山是否有意義來告誡參會(huì)者,每個(gè)人的理解可以不同,我的理解如下:
1. OVS等虛擬化等方案是否使問題變得更復(fù)雜,代價(jià)更高。
2. 標(biāo)準(zhǔn)制定者與顛覆式創(chuàng)新者之間,我們是否應(yīng)該支持顛覆式創(chuàng)新者的做法(孫總的靈活QOS與中興華為移動(dòng)的QOS標(biāo)準(zhǔn),F-stack的被現(xiàn)實(shí)大山壓倒與seastar的丟棄包袱完全開創(chuàng)新世界)。
總結(jié)
以上是生活随笔為你收集整理的异数OS 2017 DPDK 峰会观后感的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 吸引人的旅游标语文案29句
- 下一篇: 女人不回你信息代表什么