应对恶劣网络环境,为php-curl设置超时限制,防止服务器卡死
挖洋貨這項目,因為沒有公司的名頭,也就無法備案,所以前端機(jī)放在阿里云香港ECS,另配一臺阿里云杭州ECS來跑crontab——執(zhí)行爬蟲、保存圖片到阿里云OSS等。最近覺得杭州ECS有點多余了(原本還有個杭州RDS的,統(tǒng)一搬到香港RDS了),打算撤掉,就把杭州ECS上的crontab全部搬回香港ECS來跑,這下就引發(fā)不少問題了。
引發(fā)什么問題了呢?最核心的問題是香港ECS處在國際網(wǎng)絡(luò)環(huán)境,訪問大陸服務(wù)器時經(jīng)常會出現(xiàn)網(wǎng)絡(luò)抖動的現(xiàn)象,非常無解。具體一點來說,比如香港ECS向阿里云杭州open search(open search沒有香港節(jié)點呀親 ╥﹏╥...)查詢的時候,經(jīng)常報錯;又比如香港ECS抓到圖片后上傳杭州OSS(OSS是有香港節(jié)點,問題是沒有圖片處理的服務(wù)啊,你們說這不是坑死人嗎),慢是其次,經(jīng)常卡住一段時間后才報錯,這使得上傳的效率極其低下(我會告訴你就因為這個原因,積壓了好幾千爬回來的商品等著上傳圖片才能上架嗎)。
open search的問題還是很好解決的,SDK有提供超時的配置,我把超時限制設(shè)大了一點(5秒),基本上就不會報錯了。
而OSS的SDK根本沒有提供這方面的配置,為了解決這個問題,我決定深入到這SDK來修改源碼。
OSS的SDK是通過php-curl來請求api的,經(jīng)調(diào)查后,我發(fā)現(xiàn)此SDK有個名為requestcore.class.php的文件中定義了一個RequestCore類,很明顯,這個類就是負(fù)責(zé)發(fā)送請求的。其中,prep_request()負(fù)責(zé)配置curl,send_request($parse = false)則負(fù)責(zé)執(zhí)行curl(即真正發(fā)送請求)。
首先來看看prep_request(),其中包含兩個php-curl的兩個超時配置:CURLOPT_TIMEOUT以及CURLOPT_CONNECTTIMEOUT
curl_setopt($curl_handle, CURLOPT_TIMEOUT, 5184000);
curl_setopt($curl_handle, CURLOPT_CONNECTTIMEOUT, 120);
CURLOPT_TIMEOUT好理解,就是整個curl請求過程(http request & response)的超時限制,以秒為單位,設(shè)置為0則無限制。
CURLOPT_CONNECTTIMEOUT比較難理解,目前確認(rèn)的是,這是curl請求過程中的一小部分,因此必須要設(shè)得比CURLOPT_TIMEOUT小,不然CURLOPT_TIMEOUT無意義。網(wǎng)上的資料是這么說的:
CURLOPT_CONNECTTIMEOUT 在發(fā)起連接前等待的時間,如果設(shè)置為0,則無限等待。
這個發(fā)起連接前等待的時間比較模糊,我傾向于這指的是完成TCP三次握手過程前所耗費的時間,或者換句話說,TCP三次握手的整個過程必須要在CURLOPT_CONNECTTIMEOUT內(nèi)完成,否則就超時。TCP三次握手無法在指定時間內(nèi)完成表示服務(wù)器正處在繁忙/奔潰的狀態(tài)或網(wǎng)絡(luò)異常,這正符合本文所提到的場景。
基于這一猜想下,我把CURLOPT_CONNECTTIMEOUT設(shè)成3秒:
curl_setopt($curl_handle, CURLOPT_CONNECTTIMEOUT, 3);
如此,就不需要在網(wǎng)絡(luò)抖動的時候等待2分鐘(SDK設(shè)定的CURLOPT_CONNECTTIMEOUT是120秒)才報錯了。
PS:如果想要設(shè)置超時時間少于1秒,需要用到CURLOPT_TIMEOUT_MS,但此配置據(jù)鳥哥說有bug,未測試,留個心眼:《Curl的毫秒超時的一個”Bug”》
總結(jié)
以上是生活随笔為你收集整理的应对恶劣网络环境,为php-curl设置超时限制,防止服务器卡死的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Maven 打包war文件
- 下一篇: Create React App 2.0