HTTP缓存是如何实现
瀏覽器是如何知道使用緩存的,其實這都是通過http中,瀏覽器將最后修改時間發送請求給web服務器,web服務器收到請求后跟服務器上的文檔最后修改的時間對比,如果web服務器上最新文檔修改時間小于或者等于瀏覽器發送過來的,則發送304給瀏覽器,使用緩存版本。
在微博上月影指出有錯的地方:
last-modified和etag是弱緩存,cache-control只在地址欄輸入、外鏈引用才有效//@十年蹤跡:這篇文章講的不對,cache-control是強緩存,而expires和etag是協商緩存,強緩存不去服務器請求,而協商緩存始終會去服務器請求如果未失效服務器返回304,F5刷新會忽略強緩存不會忽略協商緩存
我認真的讀了一下文章,發現文章沒說錯,里面說ctrl+f5是不使用任何緩存,f5還是會使用緩存的,只是沒有明白的說是具體是哪種緩存。
緩存的概念
緩存這個東西真的是無處不在, 有瀏覽器端的緩存, 有服務器端的緩存,有代理服務器的緩存, 有ASP.NET頁面緩存,對象緩存。 數據庫也有緩存, 等等。
http中具有緩存功能的是瀏覽器緩存,以及緩存代理服務器。
http緩存的是指:當Web請求抵達緩存時, 如果本地有“已緩存的”副本,就可以從本地存儲設備而不是從原始服務器中提取這個文檔。
緩存的好處
緩存的好處是顯而易見的, 好處有,
1. 減少了冗余的數據傳輸,節省了網費。
2. 減少了服務器的負擔, 大大提高了網站的性能
3. 加快了客戶端加載網頁的速度
Fiddler可以方便地查看緩存的header
Fiddler中把header都分門別類的放在一起,這樣方便查看。
如何判斷緩存新鮮度
Web服務器通過2種方式來判斷瀏覽器緩存是否是最新的。
第一種, 瀏覽器把緩存文件的最后修改時間通過 header ”If-Modified-Since“來告訴Web服務器。
第二種, 瀏覽器把緩存文件的ETag, 通過header "If-None-Match", 來告訴Web服務器。
通過最后修改時間, 來判斷緩存新鮮度
1. 瀏覽器客戶端想請求一個文檔,? 首先檢查本地緩存,發現存在這個文檔的緩存,? 獲取緩存中文檔的最后修改時間,通過: If-Modified-Since, 發送Request給Web服務器。
2. Web服務器收到Request,將服務器的文檔修改時間(Last-Modified): 跟request header 中的,If-Modified-Since相比較, 如果時間是一樣的, 說明緩存還是最新的, Web服務器將發送304 Not Modified給瀏覽器客戶端, 告訴客戶端直接使用緩存里的版本。如下圖。
3. 假如該文檔已經被更新了。Web服務器將發送該文檔的最新版本給瀏覽器客戶端, 如下圖。
實例: 打開Fiddler, 然后打開博客園首頁。然后F5刷新幾次瀏覽器。 你會看到博客園首頁也用了緩存。
與緩存有關的header
我們來看看每個header的具體含義。
Request
| Cache-Control: max-age=0 | 以秒為單位 |
| If-Modified-Since: Mon, 19 Nov 2012 08:38:01 GMT | 緩存文件的最后修改時間。 |
| If-None-Match: "0693f67a67cc1:0" | 緩存文件的Etag值 |
| Cache-Control: no-cache | 不使用緩存 |
| Pragma: no-cache | 不使用緩存 |
Response
| Cache-Control: public | 響應被緩存,并且在多用戶間共享,? (公有緩存和私有緩存的區別,請看另一節) |
| Cache-Control: private | 響應只能作為私有緩存,不能在用戶之間共享 |
| Cache-Control:no-cache | 提醒瀏覽器要從服務器提取文檔進行驗證 |
| Cache-Control:no-store | 絕對禁止緩存(用于機密,敏感文件) |
| Cache-Control: max-age=60 | 60秒之后緩存過期(相對時間) |
| Date: Mon, 19 Nov 2012 08:39:00 GMT | 當前response發送的時間 |
| Expires: Mon, 19 Nov 2012 08:40:01 GMT | 緩存過期的時間(絕對時間) |
| Last-Modified: Mon, 19 Nov 2012 08:38:01 GMT | 服務器端文件的最后修改時間 |
| ETag: "20b1add7ec1cd1:0" | 服務器端文件的Etag值 |
如果同時存在cache-control和Expires怎么辦呢?
瀏覽器總是優先使用cache-control,如果沒有cache-control才考慮Expires
ETag
ETag是實體標簽(Entity Tag)的縮寫, 根據實體內容生成的一段hash字符串(類似于MD5或者SHA1之后的結果),可以標識資源的狀態。 當資源發送改變時,ETag也隨之發生變化。
ETag是Web服務端產生的,然后發給瀏覽器客戶端。瀏覽器客戶端是不用關心Etag是如何產生的。
為什么使用ETag呢? 主要是為了解決Last-Modified 無法解決的一些問題。
1. 某些服務器不能精確得到文件的最后修改時間, 這樣就無法通過最后修改時間來判斷文件是否更新了。
2. 某些文件的修改非常頻繁,在秒以下的時間內進行修改. Last-Modified只能精確到秒。
3. 一些文件的最后修改時間改變了,但是內容并未改變。 我們不希望客戶端認為這個文件修改了。
實例, 打開Fiddler, 打開博客園首頁。? 你可以看到很多圖片,或者CSS文件都是用了緩存。 這些都是通過比較ETag的值,來判斷文件是否更新了。
瀏覽器不使用緩存
CTRL+F5強制刷新瀏覽器,或者設置IE。? 可以讓瀏覽器不使用緩存。
1. 瀏覽器發送Http request, 給Web 服務器, header中帶有Cache-Control: no-cache.?? 明確告訴Web服務器,客戶端不使用緩存。
2. Web服務器將把最新的文檔發送給瀏覽器客戶端.
實例:
打開Fiddler, 打開博客園首頁, 然后按CTRL+F5強制刷新瀏覽器,你將看到
Pragma: no-cache的作用和Cache-Control: no-cache一模一樣。 都是不使用緩存。
Pragma: no-cache 是HTTP 1.0中定義的, 所以為了兼容HTTP 1.0. 所以會同時使用Pragma: no-cache和Cache-Control: no-cache
直接使用緩存,不去服務器驗證
按F5刷新瀏覽器和在地址欄里輸入網址然后回車。 這兩個行為是不一樣的。
按F5刷新瀏覽器, 瀏覽器會去Web服務器驗證緩存。
如果是在地址欄輸入網址然后回車,瀏覽器會"直接使用有效的緩存", 而不會發http request 去服務器驗證緩存,這種情況叫做緩存命中,如下圖
實例: 比較第一次訪問博客園主頁和第二次博客園主頁
1. 啟動Fiddler, 用firefox打開博客園主頁, 發現有50多個session。
2. 按CTRL+X將Fiddler中的所有session刪除。 關閉firefox,重新打開一個firefox,打開博客園主頁。?? 發現只有30多個session.
分析;? 少了的session是因為firefox直接用了緩存,而沒有發http request。
如何設置IE不使用緩存
打開IE。點擊工具欄上的, 工具->Internet選項->常規->瀏覽歷史記錄 設置. 選擇“從不”。然后保存。
然后點擊“刪除”? 把Internet臨時文件都刪掉 (IE緩存的文件就是Internet臨時文件)。
公有緩存和私有緩存的區別
Cache-Control: public 指可以公有緩存, 可以是數千名用戶共享的。
Cache-Control: private 指只支持私有緩存, 私有緩存是單個用戶專用的。
總結
以上是生活随笔為你收集整理的HTTP缓存是如何实现的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 卖冰淇淋的宣传文案27句
- 下一篇: 七猫小说app怎么读