程序员捅了个P0故障,公司股价反而涨了10%!
?
?今年6月,有一次大范圍的全球知名網(wǎng)站宕機(jī),國(guó)內(nèi)的網(wǎng)民感知可能沒那么強(qiáng)烈,但是在國(guó)外,很多知名網(wǎng)站都受到了波及。
本次大規(guī)模宕機(jī)時(shí)長(zhǎng)長(zhǎng)達(dá)一小時(shí),受到影響的網(wǎng)站有谷歌、Twitter、亞馬遜、eBay、Target、Reddit、PayPal、Square、Spotify、Twitch,還有《衛(wèi)報(bào)》、《金融時(shí)報(bào)》、《獨(dú)立報(bào)》、《紐約時(shí)報(bào)》、CNN、BBC、TechRadar等各大媒體網(wǎng)站。
1當(dāng)晚,網(wǎng)友們?cè)谠L問這些網(wǎng)站的時(shí)候,網(wǎng)站都無法正常顯示,會(huì)提示 "Error 503 Service Unavailable"。甚至英國(guó)政府網(wǎng)站gov.uk同樣中招!
正在網(wǎng)民們猜測(cè)是什么原因?qū)е卤姸啻笮途W(wǎng)站集體宕機(jī)的時(shí)候,一家"名不見經(jīng)傳"的公司宣稱本次大規(guī)模宕機(jī)可能和他們有關(guān):
“我們目前正在調(diào)查對(duì)我們的內(nèi)容交付網(wǎng)絡(luò)服務(wù)(Content Delivery Network)帶來潛在影響的沖擊。”
這家公司是一家名為Fastly的公司,他們的主營(yíng)業(yè)務(wù)就是提供互聯(lián)網(wǎng)內(nèi)容傳遞服務(wù)。他們主要的產(chǎn)品是邊緣計(jì)算平臺(tái),其實(shí)就是提供內(nèi)容分發(fā)網(wǎng)絡(luò)(CDN)、網(wǎng)絡(luò)安全服務(wù)、負(fù)載均衡及視頻流等服務(wù)的。
因?yàn)楹芏喙疽?wù)全球用戶,全球用戶想要訪問他們的網(wǎng)站,都需要通過網(wǎng)絡(luò)從他們的服務(wù)器上加載資源。Fastly就干了這么一件事兒,就是他提供了可以把服務(wù)器資源更近、更快的交付給終端用戶的服務(wù)。
相當(dāng)于把服務(wù)器上的資源預(yù)先加載到他們的CDN節(jié)點(diǎn)中,用戶訪問網(wǎng)站的時(shí)候,只需要從他們這里就可以獲取到服務(wù)器資源了,不需要和遠(yuǎn)程服務(wù)器直接交互,大大縮短了時(shí)間。
2
美國(guó)太平洋時(shí)間8日凌晨2:58分,Fastly表示全球大量網(wǎng)站斷網(wǎng)和他們有關(guān)之后,人們開始具體故障原因。
很多人的第一想法是可能是受到了黑客攻擊。甚至很多想象力豐富的朋友已經(jīng)在腦海里上演了一出黑客攻防大戲了。
大約1小時(shí)之后,在美國(guó)太平洋時(shí)間8日凌晨4:10分,Fastly表示他們已經(jīng)找到了問題并且完成修復(fù)。
“我們發(fā)現(xiàn)一個(gè)服務(wù)配置的更改引發(fā)了全球服務(wù)的短暫中斷,目前已將這一配置關(guān)閉,我們?nèi)蚍?wù)網(wǎng)絡(luò)已恢復(fù)正常。”
服務(wù)器配置更改???
這無論怎么看都是個(gè)低級(jí)錯(cuò)誤。這個(gè)解釋,顯然讓很多程序員們沒辦法接受,這么重要的系統(tǒng),配置推送難道沒有做灰度嗎?
后來,據(jù)說這個(gè)配置錯(cuò)誤最初是在5月份的一次發(fā)布時(shí)引入的,直到6月份才導(dǎo)致bug觸發(fā)。
在看到相關(guān)報(bào)道之后,我就在想,又要有程序員背鍋了,這么大的影響,一定是個(gè)P0級(jí)故障了,這種故障,至少要有副總裁級(jí)別的人被fire掉吧?
但是,事情接下來的發(fā)展出乎了我的意料。
3
本以為這件事會(huì)以Fastly道歉賠償、高管引咎辭職、程序員被開除收?qǐng)觥?br />
但是,有一個(gè)有意思的現(xiàn)象發(fā)生了。
當(dāng)人們知道這次重大故障的主要責(zé)任方是Fastly時(shí),這家公司的股價(jià)卻在盤中大漲超過10%。
因?yàn)?#xff0c;很多人發(fā)現(xiàn),原來這個(gè)之前從來沒聽說過的公司,竟然和這么多大企業(yè)都有合作關(guān)系,竟然能有這么大的影響力。
而且,更讓大家確認(rèn)這家公司有前途的是,當(dāng)天的故障,全球最大的云服務(wù)商Amazon也同樣宕機(jī)了。所以….
這個(gè)事情一發(fā)生,讓大家瞬間認(rèn)識(shí)了一家叫做Fastly的公司。
4
這個(gè)事件,有幾個(gè)事情是需要大家注意的:
1、邊緣計(jì)算云服務(wù)現(xiàn)在的應(yīng)用已經(jīng)非常廣泛了
2、云服務(wù)商一旦出問題,那就一定是大問題。如何保證云服務(wù)的穩(wěn)定性,是個(gè)長(zhǎng)期的課題
2、這么大的故障,可以在1小時(shí)左右發(fā)現(xiàn)、定位并解決,這家公司的效率已經(jīng)算是很高了
3、線上變更要謹(jǐn)慎!!!哪怕是一行配置!
最后,本文內(nèi)容,不構(gòu)成任何投資建議!!!
有道無術(shù),術(shù)可成;有術(shù)無道,止于術(shù)
歡迎大家關(guān)注Java之道公眾號(hào)
好文章,我在看??
?
?
總結(jié)
以上是生活随笔為你收集整理的程序员捅了个P0故障,公司股价反而涨了10%!的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 用JPA在测试的时候无法创建Entity
- 下一篇: centos 搭建git服务器