系统设计:负载均衡(负载均衡算法、转发实现、session)
一、負載均衡
集群中的應用服務器(節點)通常被設計成無狀態,這樣的話用戶可以請求任何一個節點。
負載均衡器會根據集群中每個節點的負載情況,將用戶請求轉發到合適的節點上。
負載均衡器可以用來實現高可用以及伸縮性:
- 高可用:當某個節點故障時,負載均衡器會將用戶請求轉發到另外的節點上,從而保證所有服務持續可用;
- 伸縮性:根據系統整體負載情況,可以很容易地添加或移除節點。
負載均衡器運行過程包含兩個部分:
負載均衡算法
1. 輪詢(Round Robin)
輪詢算法把每個請求輪流發送到每個服務器上。
下圖中,一共有 6 個客戶端產生了 6 個請求,這 6 個請求按 (1, 2, 3, 4, 5, 6) 的順序發送。(1, 3, 5) 的請求會被發送到服務器 1,(2, 4, 6) 的請求會被發送到服務器 2。
?
該算法比較適合每個服務器的性能差不多的場景,如果有性能存在差異的情況下,那么性能較差的服務器可能無法承擔過大的負載(下圖的 Server 2)。
?
2. 加權輪詢(Weighted Round Robbin)
加權輪詢是在輪詢的基礎上,根據服務器的性能差異,為服務器賦予一定的權值,性能高的服務器分配更高的權值。
例如下圖中,服務器 1 被賦予的權值為 5,服務器 2 被賦予的權值為 1,那么 (1, 2, 3, 4, 5) 請求會被發送到服務器 1,(6) 請求會被發送到服務器 2。
?
3. 最少連接(least Connections)
由于每個請求的連接時間不一樣,使用輪詢或者加權輪詢算法的話,可能會讓一臺服務器當前連接數過大,而另一臺服務器的連接過小,造成負載不均衡。
例如下圖中,(1, 3, 5) 請求會被發送到服務器 1,但是 (1, 3) 很快就斷開連接,此時只有 (5) 請求連接服務器 1;(2, 4, 6) 請求被發送到服務器 2,只有 (2) 的連接斷開,此時 (6, 4) 請求連接服務器 2。該系統繼續運行時,服務器 2 會承擔過大的負載。
?
最少連接算法就是將請求發送給當前最少連接數的服務器上。
例如下圖中,服務器 1 當前連接數最小,那么新到來的請求 6 就會被發送到服務器 1 上。
?
4. 加權最少連接(Weighted Least Connection)
在最少連接的基礎上,根據服務器的性能為每臺服務器分配權重,再根據權重計算出每臺服務器能處理的連接數。
?
5. 隨機算法(Random)
把請求隨機發送到服務器上。
和輪詢算法類似,該算法比較適合服務器性能差不多的場景。
?
6. 源地址哈希法 (IP Hash)
源地址哈希通過對客戶端 IP 計算哈希值之后,再對服務器數量取模得到目標服務器的序號。
可以保證同一 IP 的客戶端的請求會轉發到同一臺服務器上,用來實現會話粘滯(Sticky Session)
?
轉發實現
1. HTTP 重定向
HTTP 重定向負載均衡服務器使用某種負載均衡算法計算得到服務器的 IP 地址之后,將該地址寫入 HTTP 重定向報文中,狀態碼為 302。客戶端收到重定向報文之后,需要重新向服務器發起請求。
缺點:
- 需要兩次請求,因此訪問延遲比較高;
- HTTP 負載均衡器處理能力有限,會限制集群的規模。
該負載均衡轉發的缺點比較明顯,實際場景中很少使用它。
?
2. DNS 域名解析
在 DNS 解析域名的同時使用負載均衡算法計算服務器 IP 地址。
優點:
- DNS 能夠根據地理位置進行域名解析,返回離用戶最近的服務器 IP 地址。
缺點:
- 由于 DNS 具有多級結構,每一級的域名記錄都可能被緩存,當下線一臺服務器需要修改 DNS 記錄時,需要過很長一段時間才能生效。
大型網站基本使用了 DNS 做為第一級負載均衡手段,然后在內部使用其它方式做第二級負載均衡。也就是說,域名解析的結果為內部的負載均衡服務器 IP 地址。
?
3. 反向代理服務器
反向代理服務器位于源服務器前面,用戶的請求需要先經過反向代理服務器才能到達源服務器。反向代理可以用來進行緩存、日志記錄等,同時也可以用來做為負載均衡服務器。
在這種負載均衡轉發方式下,客戶端不直接請求源服務器,因此源服務器不需要外部 IP 地址,而反向代理需要配置內部和外部兩套 IP 地址。
優點:
- 與其它功能集成在一起,部署簡單。
缺點:
- 所有請求和響應都需要經過反向代理服務器,它可能會成為性能瓶頸。
?反向代理負載均衡(nginx)
傳統代理服務器位于瀏覽器一端,代理瀏覽器將HTTP請求發送到互聯網上。而反向代理服務器則位于網站機房一側,代理網站web服務器接收http請求。
  反向代理的作用是保護網站安全,所有互聯網的請求都必須經過代理服務器,相當于在web服務器和可能的網絡攻擊之間建立了一個屏障。
  除此之外,代理服務器也可以配置緩存加速web請求。當用戶第一次訪問靜態內容的時候,靜態內存就被緩存在反向代理服務器上,這樣當其他用戶訪問該靜態內容時,就可以直接從反向代理服務器返回,加速web請求響應速度,減輕web服務器負載壓力。
  另外,反向代理服務器也可以實現負載均衡的功能。
 由于反向代理服務器轉發請求在HTTP協議層面,因此也叫應用層負載均衡。優點是部署簡單,缺點是可能成為系統的瓶頸。
 ?
4. 網絡層
在操作系統內核進程獲取網絡數據包,根據負載均衡算法計算源服務器的 IP 地址,并修改請求數據包的目的 IP 地址,最后進行轉發。
源服務器返回的響應也需要經過負載均衡服務器,通常是讓負載均衡服務器同時作為集群的網關服務器來實現。
優點:
- 在內核進程中進行處理,性能比較高。
缺點:
- 和反向代理一樣,所有的請求和響應都經過負載均衡服務器,會成為性能瓶頸。
5. 鏈路層
在鏈路層根據負載均衡算法計算源服務器的 MAC 地址,并修改請求數據包的目的 MAC 地址,并進行轉發。
通過配置源服務器的虛擬 IP 地址和負載均衡服務器的 IP 地址一致,從而不需要修改 IP 地址就可以進行轉發。也正因為 IP 地址一樣,所以源服務器的響應不需要轉發回負載均衡服務器,可以直接轉發給客戶端,避免了負載均衡服務器的成為瓶頸。
這是一種三角傳輸模式,被稱為直接路由。對于提供下載和視頻服務的網站來說,直接路由避免了大量的網絡傳輸數據經過負載均衡服務器。
這是目前大型網站使用最廣負載均衡轉發方式,在 Linux 平臺可以使用的負載均衡服務器為 LVS(Linux Virtual Server)。
參考:
- Comparing Load Balancing Algorithms
- Redirection and Load Balancing
二、集群下的 Session 管理
一個用戶的 Session 信息如果存儲在一個服務器上,那么當負載均衡器把用戶的下一個請求轉發到另一個服務器,由于服務器沒有用戶的 Session 信息,那么該用戶就需要重新進行登錄等操作。
Sticky Session
需要配置負載均衡器,使得一個用戶的所有請求都路由到同一個服務器,這樣就可以把用戶的 Session 存放在該服務器中。
缺點:
- 當服務器宕機時,將丟失該服務器上的所有 Session。
?
Session Replication
在服務器之間進行 Session 同步操作,每個服務器都有所有用戶的 Session 信息,因此用戶可以向任何一個服務器進行請求。
缺點:
- 占用過多內存;
- 同步過程占用網絡帶寬以及服務器處理器時間。
?
Session Server
使用一個單獨的服務器存儲 Session 數據,可以使用傳統的 MySQL,也使用 Redis 或者 Memcached 這種內存型數據庫。
優點:
- 為了使得大型網站具有伸縮性,集群中的應用服務器通常需要保持無狀態,那么應用服務器不能存儲用戶的會話信息。Session Server 將用戶的會話信息單獨進行存儲,從而保證了應用服務器的無狀態。
缺點:
- 需要去實現存取 Session 的代碼。
?
參考:
- Session Management using Spring Session with JDBC DataStore
總結
以上是生活随笔為你收集整理的系统设计:负载均衡(负载均衡算法、转发实现、session)的全部內容,希望文章能夠幫你解決所遇到的問題。
 
                            
                        - 上一篇: 系统设计:性能指标、伸缩性、扩展性、可用
- 下一篇: 操作系统:操作系统知识点总结
