當前位置：首頁 > 运维知识 > windows >内容正文

windows

2016-04-25-信息系统实践手记5-CACHE设计一例

發布時間：2023/12/31 windows 31 豆豆

生活随笔收集整理的這篇文章主要介紹了 2016-04-25-信息系统实践手记5-CACHE设计一例小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

layout: post
title: 2016-04-25-信息系統實踐手記5-CACHE設計一例
key: 20160425
tags: 業務場景 CACHE 系統分析系統設計緩存
modify_date: 2016-04-25
---

信息系統實踐手記5-CACHE設計一例

說明：

本文發布于: gitee,github,博客園
轉載和引用請指明原作者和連接及出處.

正文：

信息系統實踐手記系列是系筆者在平時研發中先后遇到的大小的問題，其中比較典型的內容加以收集和分享。
信息系統實踐手記目錄：博客園(或查看源碼的README.MD文件)

摘要：

此文描述了對CACHE緩存的一些理解。

正文

1.CACHE是啥？

最近一直在了解scala，Spark，Python，數據挖掘，以及復雜科學的一些內容，在充實和忙碌之余，雖興趣濃厚，但體力不支，疲勞的很，無奈耽擱了實踐手記。原本計劃2周掛出一篇來分享，實在抱歉。要分享的東西太多，碼字太費時間，有時候甚至覺得開會也許更好（很多人反感開會，那是因為沒開過高效的會）！其實很多東西主要還是考自己去走，去體會。閑話不說，切入正題。很多研發人員，尤其是開發程序的同志，找到一個cache框架或類庫可用，比如hibernate的cache功能，然后就一股腦用上去。雖然會有效果，很愉悅，是好事，既增加經驗，也體會了框架的魅力和效率，但其實還有東西可以進一步去領會。究竟為啥要用CACHE？CACHE是啥？什么樣的場景用什么樣的CACHE？很少有人問。那CACHE到底是啥呢？還真難于表述清晰，但有一些要點：

CACHE的產生是為了緩解處理鏈上不同節點之間速度不協調的情況。舉例若干：
- 計算機系統：一般有速度梯度：CPU內部寄存器（register）IO>內存IO>磁盤IO>網絡IO，為協調它們之間傳遞數據的速度差，就可設置緩存結構，叫CACHE；
  - 說明1：以上說的是一般情況，不考慮特別的磁陣RAID，高速SCSI，千兆或萬兆網絡等；
  - 說明2：CPU內部也分L1，L2，L3等多級寄存器結構，當做多級CACHE使用，早先的386/486處理器沒分那么多層次；
- 地鐵系統：有時候出事故，人特多，站內站外由管理員把守入口分批放人到1層大廳，則1層大廳是一個CACHE；管理員分批從大廳放人到B1層站臺，則B1站臺也是一個CACHE；當CACHE快撐滿的時候，管理員就會喊“慢慢來，不要擠，暫時關閉，大家耐心等待！”，于是人就被囤積在不同的CACHE里，以便協調地鐵運量和人流涌入的速度差問題。
- 工廠流水線：另一個典型例子是工廠的流水線。以前老式流水線每個工位站1個人，處理1個裝配動作，比如給黃小鴨玩具裝上1條腿。一個工件，如果流經10個處理節點，那就會有10個人來處理10個步驟。顯然，老板期望流水線一直處于充滿狀態，則最高效的源源不斷有產出。但意外總會發生，比如某工件N流轉到Px節點，Px節點的工人很累，處理較慢，導致Px-1步驟流出的工件不斷堆積，而這個Px處理節點處理臺的工件堆積場所，就是一個BUFFER緩存區（也就是CACHE），它越來越滿，就提醒Px的工人，加緊干，否則一旦CACHE撐爆，就無法克服（追上）速度差（時間差）的問題！（畫外音：可以看出流水線機制的高效和科學，以及“殘酷”）。
- 生產者消費者模式：經典的程序設計模式“生產者和消費者”模型也有一個CACHE的設計，就是協調生產和消費的速度差，類似“工廠流水線”
CACHE實際上是用空間上的代價來緩解時間上的不協調。
- 你肯定要問“既然速度有差異，那CACHE再大也沒用？”，的確，再大的CACHE也是用來臨時克服速度差異的，它期望可以用空間暫時的堆積追回偶發導致的時間不協調（速度差是絕對的，這個在設計場景之前就知道，但速度不協調是偶發的，這個要區別開！）。如果永遠無法“追回來”，那么再大的CACHE也會有問題，那么就是設計上的問題，就不是CACHE機制可以解決的。
- 處理節點Px往往速度不同，所以必須用不同算法來安排。比如：
  - 通過編譯器編譯的源碼，會根據OS的不同及其內存頁面調度算法，互相結合，處理好代碼的擺放，并充分考慮到CPU/MEM/DISK/NETWORK的差異；保持MEM代碼段高命中，降低頁丟失中斷，等等。
  - 程序本身也應該充分利用諸如“多線程”，“并發計算”，“分布式計算”等方法，來從宏觀的算法層面，解決掉速度差異，從而適當的利用CACHE來防止偶發的速度不協調，而不是算法本身有永久性的硬傷“速度不匹配”。可以適當的使用一些主流成熟前三名的框架來解決實際問題。
  - 程序終究是要達成業務需要的，也就是完成功能目標（Feature）。而功能和業務本身是有特點的，有時空特性的，是高并發業務？還是隨機業務？業務的時空特性如何？是否和上下班高峰有關？是否和網站的維護周期有關？是否和購物的時間段有關？總之從業務觸發，需要專業的領域知識（行業支持），并且需要深厚的技術功底，這樣的從場景出發的系統分析和系統設計行為，是何其重要！這方面的人才非常緊缺。
CACHE所處理的時空不協調，可能是偶發的，也可能是來自于業務模型；
- 通過上述的不同層次（編譯器，OS，程序，框架類庫，業務場景分析）的討論，基本上能妥善的處理業務，達成場景，使用必要的CACHE結構。但業務模型總是會偶發時空不一致，尤其是在當今多任務的計算機架構（以前主機時代只有大型機是多進程的，現在微機也是多任務并細化到線程）。很容易計算力不夠需要增加更多CPU的core，數據量大沒地方放，就增加MEM，MEM增加后也會導致低速的磁盤IO和網絡IO也變大。
- 另外在對業務模型不斷調優和擴容的過程中，不協調也會自然產生的，而如果程序模型比較優秀，相關必要的地方本來就有CACHE，那么CACHE將為程序運作提供余地。
- 即便是簡單的業務模型，而且調優完成，且一直正常運作。但也可能因為“網絡故障，CPU失效，內存或磁盤損壞，某個計算節點離線”等問題而打破平衡。這時候，甚至連寫LOG日志來記錄狀態也顯得很奢侈或捉襟見肘。此時，如果程序在框架設計上已經未雨綢繆的安排了充分和必要的CACHE，則完全可以提升健壯性，甚至在偶發災難沖擊中堅強運行，恢復運作。
客觀世界和程序世界都是復雜的，而復雜系統經常引發意外和不協調，CACHE則應運而生：
- CPU里面的微指令集中用到了L1，L2，L3，它們就是各級CACHE；
- MEM，DISK，網卡等設備，無論在硬件的接口驅動程序BIOS中，還是在程序員編制的應用程序中，都安排了CACHE，來處理設備受到外界速度不匹配的沖擊。
- 程序設計中很多模式，比如消費者生產者，就必然有CACHE存在，以緩解生產和消費的速度不匹配；
- 真實世界的倉庫存貨，小超市囤貨，高架路上的緊急停車帶，上下岔道區域，展覽會門口的回形排隊護欄，流水線的每個節點的BUFFER緩沖帶等等，都是CACHE的好例子；

只有理解了自然現象，業務規律和程序能力邊界，才能深入體會如何在程序設計中，在什么樣的業務場景下使用怎樣的CACHE設計，以便到達好處和結果。不建議只為了技術用技術，必須明確使用的目的為何，才能正確的使用。

2.CACHE設計一例

這里簡單舉一個例子，還是前幾篇分享的客戶端和服務器，它們是提供GIS地圖服務的服務器和客戶端；而這個提供GIS業務的服務器就用到很多CACHE；撇開客戶端業務展現不說，很多后臺服務是由做GIS業務的應用SERVER提供，簡稱為GS，而GS需要從設備管理平臺，簡稱DS獲取設備信息；

因為DS不提供設備信息的訂閱（很遺憾），則無法使用高效的觀察者模式來獲取設備變更信息，而只能由GS通過階段同步（輪詢模型）來花巨大的代價向DS獲取其實很少變化的設備更新信息。為了階段同步，GS只能在內存（或DB）做了一個CACHE，來存放比如每30分鐘的同步信息；
最先是X分鐘同步，按照經典做法，同步數據放在DB。但為提升速度，解決業務場景的高速要求和DB處理的慢速情況，將DB的數據“上提”到內存的CACHE中，以后做業務直接查CACHE，處理CACHE；這里就自然的引發了一個問題，CACHE的臟數據需要同步回到DB，因為數據存在于兩個地方，一個CACHE是臨時的，一個DB是持久化的，那么它們之間也有同步問題，這是使用CACHE經常要面臨的情況。其實最后因為原來程序框架做的不佳，導致了批量修改完成后，還遺留了不少小尾巴，只能case by case的修復，不細說。
我們GS平臺，還和第三方，比如一個城市的路口卡口管理平臺（簡稱KS）對接，上次講過平臺對接問題了，這里假設順利對接。那么KS的數據，也會階段性的同步到我們GS來。一個典型的應用是GS向KS訂閱了一種“告警A”，當KS發生事件A而發出“告警A”時，將會推送到GS平臺，那么GS平臺分發給客戶端。這里顯然有速度的不協調，如果告警頻繁，GS一時處理不過來，那么就要CACHE，怎么弄？也可以不用自己寫代碼，我們GS和GS的客戶端是通過ActiveMQ的消息中間件來傳遞消息。訂閱之后，不同主題的消息和用戶就會有自己的BUFFER來存放，即便KS平臺突發大量告警A到GS，GS來不及分發，那就放入MQ自己管理的緩存隊列，MQ自己處理。當然這里我們看到了上面討論過的CACHE的幾個問題：
- 如果KS平臺的“告警A”一直高頻持續發送，那么最終GS接收代碼來不急放入MQ，或者來得及放入MQ，但MQ終將崩潰。所以這里就遇到了前幾篇提到的平臺對接中，對兩個有交互的平臺之間的信令和數據的“時空特性”一定要定義清晰，比如我們GS和KS就定義了最高并發不能超過1秒10條（10CAPS），否則GS拒絕而不是通過CACHE盡量容納和處理。萬事都有限度，討論清楚就行！
- 這里還有一個隱蔽問題，大家不知道看出來沒有。這里假設我GS的JAVA接收代碼，從網絡socket套接字獲取的批量字節流，速度極快，放入MQ幾乎不花時間。如果沒有這個假設，而且放入速度的確很慢，那么MQ不會最終“爆炸”，首先奔潰的及時GS的接收代碼片段。這個判斷，一般是根據程序員的經驗和業界的經驗來確定的。它總是非常快，放入message，一般總是比消費處理message快不少。
CACHE也能存在于高層次和高抽象級別的。比如當前的hibernate庫支持對象到DATA MODEL的映射，而業務是針對對象，不是直接赤裸的和數據交互的。針對對象的操作比如func1()也是可以CACHE緩存的，以便第二次同樣的調用func1()的時候，極大的提升速度和效率。這里當然也會看到一個臟數據和失效的問題，不再討論。

END

轉載于:https://www.cnblogs.com/taichu/p/8865853.html

總結

以上是生活随笔為你收集整理的2016-04-25-信息系统实践手记5-CACHE设计一例的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：去哪儿旅行如何取消订单
下一篇： lol小小英雄稀有蛋能开出什么英雄联盟