IM系统中如何保证消息的可靠投递(即QoS机制)(转)
消息的可靠性,即消息的不丟失和不重復(fù),是im系統(tǒng)中的一個難點。當(dāng)初qq在技術(shù)上(當(dāng)時叫oicq)因為以下兩點原因才打敗了icq:
1)qq的消息投遞可靠(消息不丟失,不重復(fù))
2)qq的垃圾消息少(它antispam做得好,這也是一個難點,但不是本文重點討論的內(nèi)容)
今天,本文將用十分通俗的語言,來講述webim系統(tǒng)中消息可靠性的問題。
一、報文類型
im的客戶端與服務(wù)器通過發(fā)送報文(也就是請求包)來完成消息的傳遞,報文分為三種,請求報文(request,后簡稱為為R),應(yīng)答報文(acknowledge,后簡稱為A),通知報文(notify,后簡稱為N),這三種報文的解釋如下:
R:客戶端主動發(fā)送給服務(wù)器的報文
A:服務(wù)器被動應(yīng)答客戶端的報文,一個A一定對應(yīng)一個R
N:服務(wù)器主動發(fā)送給客戶端的報文
二、普通消息投遞流程
用戶A給用戶B發(fā)送一個“你好”,很容易想到,流程如下:
1)client-A向im-server發(fā)送一個消息請求包,即msg:R
2)im-server在成功處理后,回復(fù)client-A一個消息響應(yīng)包,即msg:A
3)如果此時client-B在線,則im-server主動向client-B發(fā)送一個消息通知包,即msg:N(當(dāng)然,如果client-B不在線,則消息會存儲離線)
三、上述消息投遞流程出現(xiàn)的問題
從流程圖中容易看到,發(fā)送方client-A收到msg:A后,只能說明im-server成功接收到了消息,并不能說明client-B接收到了消息。在若干場景下,可能出現(xiàn)msg:N包丟失,且發(fā)送方client-A完全不知道,例如:
1)服務(wù)器崩潰,msg:N包未發(fā)出
2)網(wǎng)絡(luò)抖動,msg:N包被網(wǎng)絡(luò)設(shè)備丟棄
3)client-B崩潰,msg:N包未接收
結(jié)論是悲觀的:接收方client-B是否有收到msg:N,發(fā)送方client-A完全不可控,那怎么辦呢?
四、應(yīng)用層確認(rèn)+im消息可靠投遞的六個報文
upd是一種不可靠的傳輸層協(xié)議,tcp是一種可靠的傳輸層協(xié)議,tcp是如何做到可靠的?答案是:超時、重傳、確認(rèn)。
要想實現(xiàn)應(yīng)用層的消息可靠投遞,必須加入應(yīng)用層的確認(rèn)機制,即:要想讓發(fā)送方client-A確保接收方client-B收到了消息,必須讓接收方client-B給一個消息的確認(rèn),這個應(yīng)用層的確認(rèn)的流程,與消息的發(fā)送流程類似:
4)client-B向im-server發(fā)送一個ack請求包,即ack:R
5)im-server在成功處理后,回復(fù)client-B一個ack響應(yīng)包,即ack:A
6)則im-server主動向client-A發(fā)送一個ack通知包,即ack:N
至此,發(fā)送“你好”的client-A,在收到了ack:N報文后,才能確認(rèn)client-B真正接收到了“你好”。
會發(fā)現(xiàn),一條消息的發(fā)送,分別包含(上)(下)兩個半場,即msg的R/A/N三個報文,ack的R/A/N三個報文,一個應(yīng)用層即時通訊消息的可靠投遞,共涉及6個報文,這就是im系統(tǒng)中消息投遞的最核心技術(shù)(如果某個im系統(tǒng)不包含這6個報文,不要談什么消息的可靠性)。
五、可靠消息投遞存在什么問題
期望六個報文完成消息的可靠投遞,但實際情況下:
1)msg:R,msg:A報文可能丟失,此時直接提示“發(fā)送失敗”即可,問題不大
2)msg:N,ack:R,ack:A,ack:N這四個報文都可能丟失(原因如第二章所述,可能是服務(wù)器奔潰、網(wǎng)絡(luò)抖動、或者客戶端奔潰),此時client-A都收不到期待的ack:N報文,即client-A不能確認(rèn)client-B是否收到“你好”,那怎么辦呢?
六、消息的超時與重傳
client-A發(fā)出了msg:R,收到了msg:A之后,在一個期待的時間內(nèi),如果沒有收到ack:N,client-A會嘗試將msg:R重發(fā)。可能client-A同時發(fā)出了很多消息,故client-A需要在本地維護一個等待ack隊列,并配合timer超時機制,來記錄哪些消息沒有收到ack:N,以定時重發(fā)。
一旦收到了ack:N,說明client-B收到了“你好”消息,對應(yīng)的消息將從“等待ack隊列”中移除。
七、消息的重傳存在什么問題
第五章提到過,msg:N報文,ack:N報文都有可能丟失:
1)msg:N報文丟失,說明client-B之前壓根沒有收到“你好”報文,超時與重傳機制十分有效
2)ack:N報文丟失,說明client-B之前已經(jīng)收到了“你好”報文(只是client-A不知道而已),超時與重傳機制將導(dǎo)致client-B收到重復(fù)的消息,那怎么辦呢?
啟示:
平時使用qq,或許大伙都有類似的體驗,彈出一個對話框“因為網(wǎng)絡(luò)原因,消息發(fā)送失敗,是否要重發(fā)”,此時,有可能是對方?jīng)]有收到消息(發(fā)送方網(wǎng)絡(luò)不好,msg:N丟失),也可能已經(jīng)收到了消息(接收方網(wǎng)絡(luò)不好,反復(fù)重傳后,ack:N依然丟失),出現(xiàn)這個提示時,大伙不妨和對端確認(rèn)一下,看是哪種情況。
八、消息的去重
解決方法也很簡單,由發(fā)送方client-A生成一個消息去重的msgid,保存在“等待ack隊列”里,同一條消息使用相同的msgid來重傳,供client-B去重,而不影響用戶體驗。
九、其他
1)上述設(shè)計理念,由客戶端重傳,可以保證服務(wù)端無狀態(tài)性(架構(gòu)設(shè)計基本準(zhǔn)則)
2)如果client-B不在線,im-server保存了離線消息后,要偽造ack:N發(fā)送給client-A
3)離線消息的拉取,為了保證消息的可靠性,也需要有ack機制,但由于拉取離線消息不存在N報文,故實際情況要簡單的多,即先發(fā)送offline:R報文拉取消息,收到offline:A后,再發(fā)送offlineack:R刪除離線消息
十、總結(jié)
1)im系統(tǒng)是通過超時、重傳、確認(rèn)、去重的機制來保證消息的可靠投遞,不丟不重
2)切記,一個“你好”的發(fā)送,包含上半場msg:R/A/N與下半場ack:R/A/N的6個報文
個人消息是一個1對1的ack,群消息就沒有這么簡單了,群消息存在一個擴散系數(shù),如果大家感興趣,下一次將和大家討論im群消息的可靠投遞。
轉(zhuǎn)載于:https://www.cnblogs.com/djrLog/p/5603755.html
總結(jié)
以上是生活随笔為你收集整理的IM系统中如何保证消息的可靠投递(即QoS机制)(转)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: android 隐藏系统键盘
- 下一篇: Incorrect string val