第八十期:初创公司5大Java服务困局,阿里工程师如何打破?
初創(chuàng)公司遇到的每一個(gè)問(wèn)題都可能攸關(guān)生死。創(chuàng)業(yè)之初更應(yīng)該總結(jié)行業(yè)的常見(jiàn)問(wèn)題,對(duì)比方案尋找最優(yōu)解。
作者:常意
初創(chuàng)公司遇到的每一個(gè)問(wèn)題都可能攸關(guān)生死。創(chuàng)業(yè)之初更應(yīng)該總結(jié)行業(yè)的常見(jiàn)問(wèn)題,對(duì)比方案尋找最優(yōu)解。阿里巴巴地圖技術(shù)專家常意在技術(shù)圈摸爬滾打數(shù)年,接觸了各式各樣的Java服務(wù)端架構(gòu)。服務(wù)端問(wèn)題見(jiàn)得多了,也就更能分辨出各種方案的優(yōu)劣。今天,常意總結(jié)了5大初創(chuàng)公司存在的Java服務(wù)端難題,并嘗試性地給出了一些解決方案,供大家交流參考。
1.系統(tǒng)不是分布式
1.1.單機(jī)版系統(tǒng)搶單案例
// 搶取訂單函數(shù) public synchronized void grabOrder(Long orderId, Long userId) { // 獲取訂單信息 OrderDO order = orderDAO.get(orderId); if (Objects.isNull(order)) { throw new BizRuntimeException(String.format("訂單(%s)不存在", orderId)); } // 檢查訂單狀態(tài) if (!Objects.equals(order.getStatus, OrderStatus.WAITING_TO_GRAB.getValue())) { throw new BizRuntimeException(String.format("訂單(%s)已被搶", orderId)); } // 設(shè)置訂單被搶 orderDAO.setGrabed(orderId, userId); }以上代碼,在一臺(tái)服務(wù)器上運(yùn)行沒(méi)有任何問(wèn)題。進(jìn)入函數(shù)grabOrder(搶取訂單)時(shí),利用synchronized關(guān)鍵字把整個(gè)函數(shù)鎖定,要么進(jìn)入函數(shù)前訂單未被人搶取,從而搶單成功,要么進(jìn)入函數(shù)前訂單已被搶取導(dǎo)致?lián)寙问?#xff0c;絕對(duì)不會(huì)出現(xiàn)進(jìn)入函數(shù)前訂單未被搶取而進(jìn)入函數(shù)后訂單又被搶取的情況。
但是,如果上面的代碼在兩臺(tái)服務(wù)器上同時(shí)運(yùn)行,由于Java的synchronized關(guān)鍵字只在一個(gè)虛擬機(jī)內(nèi)生效,所以就會(huì)導(dǎo)致兩個(gè)人能夠同時(shí)搶取一個(gè)訂單,但會(huì)以最后一個(gè)寫(xiě)入數(shù)據(jù)庫(kù)的數(shù)據(jù)為準(zhǔn)。所以,大多數(shù)的單機(jī)版系統(tǒng),是無(wú)法作為分布式系統(tǒng)運(yùn)行的。
1.2.分布式系統(tǒng)搶單案例
添加分布式鎖,進(jìn)行代碼優(yōu)化:
// 搶取訂單函數(shù) public void grabOrder(Long orderId, Long userId) { Long lockId = orderDistributedLock.lock(orderId); try { grabOrderWithoutLock(orderId, userId); } finally { orderDistributedLock.unlock(orderId, lockId); } } // 不帶鎖的搶取訂單函數(shù) private void grabOrderWithoutLock(Long orderId, Long userId) { // 獲取訂單信息 OrderDO order = orderDAO.get(orderId); if (Objects.isNull(order)) { throw new BizRuntimeException(String.format("訂單(%s)不存在", orderId)); } // 檢查訂單狀態(tài) if (!Objects.equals(order.getStatus, OrderStatus.WAITING_TO_GRAB.getValue())) { throw new BizRuntimeException(String.format("訂單(%s)已被搶", orderId)); } // 設(shè)置訂單被搶 orderDAO.setGrabed(orderId, userId); }優(yōu)化后的代碼,在調(diào)用函數(shù)grabOrderWithoutLock(不帶鎖的搶取訂單)前后,利用分布式鎖orderDistributedLock(訂單分布式鎖)進(jìn)行加鎖和釋放鎖,跟單機(jī)版的synchronized關(guān)鍵字加鎖效果基本一樣。
1.3.分布式系統(tǒng)的優(yōu)缺點(diǎn)
分布式系統(tǒng)(Distributed System)是支持分布式處理的軟件系統(tǒng),是由通信網(wǎng)絡(luò)互聯(lián)的多處理機(jī)體系結(jié)構(gòu)上執(zhí)行任務(wù)的系統(tǒng),包括分布式操作系統(tǒng)、分布式程序設(shè)計(jì)語(yǔ)言及其編譯系統(tǒng)、分布式文件系統(tǒng)分布式數(shù)據(jù)庫(kù)系統(tǒng)等。
分布式系統(tǒng)的優(yōu)點(diǎn):
- 可靠性、高容錯(cuò)性:一臺(tái)服務(wù)器的崩潰,不會(huì)影響其它服務(wù)器,其它服務(wù)器仍能提供服務(wù)。
- 可擴(kuò)展性:如果系統(tǒng)服務(wù)能力不足,可以水平擴(kuò)展更多服務(wù)器。
- 靈活性:可以很容易的安裝、實(shí)施、擴(kuò)容和升級(jí)系統(tǒng)。
- 性能高:擁有多臺(tái)服務(wù)器的計(jì)算能力,比單臺(tái)服務(wù)器處理速度更快。
- 性價(jià)比高:分布式系統(tǒng)對(duì)服務(wù)器硬件要求很低,可以選用廉價(jià)服務(wù)器搭建分布式集群,從而得到更好的性價(jià)比。
分布式系統(tǒng)的缺點(diǎn):
- 排查難度高:由于系統(tǒng)分布在多臺(tái)服務(wù)器上,故障排查和問(wèn)題診斷難度較高。
- 軟件支持少:分布式系統(tǒng)解決方案的軟件支持較少。
- 建設(shè)成本高:需要多臺(tái)服務(wù)器搭建分布式系統(tǒng)。
曾經(jīng)有不少的朋友咨詢我:"找外包做移動(dòng)應(yīng)用,需要注意哪些事項(xiàng)?"
首先,確定是否需要用分布式系統(tǒng)。軟件預(yù)算有多少?預(yù)計(jì)用戶量有多少?預(yù)計(jì)訪問(wèn)量有多少?是否只是業(yè)務(wù)前期試水版?單臺(tái)服務(wù)器能否解決?是否接收短時(shí)間宕機(jī)?……如果綜合考慮,單機(jī)版系統(tǒng)就可以解決的,那就不要采用分布式系統(tǒng)了。因?yàn)閱螜C(jī)版系統(tǒng)和分布式系統(tǒng)的差別很大,相應(yīng)的軟件研發(fā)成本的差別也很大。
其次,確定是否真正的分布式系統(tǒng)。分布式系統(tǒng)最大的特點(diǎn),就是當(dāng)系統(tǒng)服務(wù)能力不足時(shí),能夠通過(guò)水平擴(kuò)展的方式,通過(guò)增加服務(wù)器來(lái)增加服務(wù)能力。然而,單機(jī)版系統(tǒng)是不支持水平擴(kuò)展的,強(qiáng)行擴(kuò)展就會(huì)引起一系列數(shù)據(jù)問(wèn)題。由于單機(jī)版系統(tǒng)和分布式系統(tǒng)的研發(fā)成本差別較大,市面上的外包團(tuán)隊(duì)大多用單機(jī)版系統(tǒng)代替分布式系統(tǒng)交付。
那么,如何確定你的系統(tǒng)是真正意義上的分布式系統(tǒng)呢?從軟件上來(lái)說(shuō),是否采用了分布式軟件解決方案;從硬件上來(lái)說(shuō),是否采用了分布式硬件部署方案。
1.4.分布式軟件解決方案
作為一個(gè)合格的分布式系統(tǒng),需要根據(jù)實(shí)際需求采用相應(yīng)的分布式軟件解決方案。
1.4.1分布式鎖
分布式鎖是單機(jī)鎖的一種擴(kuò)展,主要是為了鎖住分布式系統(tǒng)中的物理塊或邏輯塊,用以此保證不同服務(wù)之間的邏輯和數(shù)據(jù)的一致性。
目前,主流的分布式鎖實(shí)現(xiàn)方式有3種:
1.4.2分布式消息
分布式消息中間件是支持在分布式系統(tǒng)中發(fā)送和接受消息的軟件基礎(chǔ)設(shè)施。常見(jiàn)的分布式消息中間件有ActiveMQ、RabbitMQ、Kafka、MetaQ等。
MetaQ(全稱Metamorphosis)是一個(gè)高性能、高可用、可擴(kuò)展的分布式消息中間件,思路起源于LinkedIn的Kafka,但并不是Kafka的一個(gè)拷貝。MetaQ具有消息存儲(chǔ)順序?qū)憽⑼掏铝看蠛椭С直镜睾蚗A事務(wù)等特性,適用于大吞吐量、順序消息、廣播和日志數(shù)據(jù)傳輸?shù)葓?chǎng)景。
1.4.3數(shù)據(jù)庫(kù)分片分組
針對(duì)大數(shù)據(jù)量的數(shù)據(jù)庫(kù),一般會(huì)采用"分片分組"策略:
分片(shard):主要解決擴(kuò)展性問(wèn)題,屬于水平拆分。引入分片,就引入了數(shù)據(jù)路由和分區(qū)鍵的概念。其中,分表解決的是數(shù)據(jù)量過(guò)大的問(wèn)題,分庫(kù)解決的是數(shù)據(jù)庫(kù)性能瓶頸的問(wèn)題。
分組(group):主要解決可用性問(wèn)題,通過(guò)主從復(fù)制的方式實(shí)現(xiàn),并提供讀寫(xiě)分離策略用以提高數(shù)據(jù)庫(kù)性能。
1.4.4分布式計(jì)算
分布式計(jì)算( Distributed computing )是一種"把需要進(jìn)行大量計(jì)算的工程數(shù)據(jù)分割成小塊,由多臺(tái)計(jì)算機(jī)分別計(jì)算;在上傳運(yùn)算結(jié)果后,將結(jié)果統(tǒng)一合并得出數(shù)據(jù)結(jié)論"的科學(xué)。
當(dāng)前的高性能服務(wù)器在處理海量數(shù)據(jù)時(shí),其計(jì)算能力、內(nèi)存容量等指標(biāo)都遠(yuǎn)遠(yuǎn)無(wú)法達(dá)到要求。在大數(shù)據(jù)時(shí)代,工程師采用廉價(jià)的服務(wù)器組成分布式服務(wù)集群,以集群協(xié)作的方式完成海量數(shù)據(jù)的處理,從而解決單臺(tái)服務(wù)器在計(jì)算與存儲(chǔ)上的瓶頸。Hadoop、Storm以及Spark是常用的分布式計(jì)算中間件,Hadoop是對(duì)非實(shí)時(shí)數(shù)據(jù)做批量處理的中間件,Storm和Spark是對(duì)實(shí)時(shí)數(shù)據(jù)做流式處理的中間件。
除此之外,還有更多的分布式軟件解決方案,這里就不再一一介紹了。
1.5分布式硬件部署方案
介紹完服務(wù)端的分布式軟件解決方案,就不得不介紹一下服務(wù)端的分布式硬件部署方案。這里,只畫(huà)出了服務(wù)端常見(jiàn)的接口服務(wù)器、MySQL數(shù)據(jù)庫(kù)、Redis緩存,而忽略了其它的云存儲(chǔ)服務(wù)、消息隊(duì)列服務(wù)、日志系統(tǒng)服務(wù)……
1.5.1一般單機(jī)版部署方案
架構(gòu)說(shuō)明:只有1臺(tái)接口服務(wù)器、1個(gè)MySQL數(shù)據(jù)庫(kù)、1個(gè)可選Redis緩存,可能都部署在同一臺(tái)服務(wù)器上。
適用范圍:適用于演示環(huán)境、測(cè)試環(huán)境以及不怕宕機(jī)且日PV在5萬(wàn)以內(nèi)的小型商業(yè)應(yīng)用。
1.5.2中小型分布式硬件部署方案
架構(gòu)說(shuō)明:通過(guò)SLB/Nginx組成一個(gè)負(fù)載均衡的接口服務(wù)器集群,MySQL數(shù)據(jù)庫(kù)和Redis緩存采用了一主一備(或多備)的部署方式。
適用范圍:適用于日PV在500萬(wàn)以內(nèi)的中小型商業(yè)應(yīng)用。
1.5.3大型分布式硬件部署方案
架構(gòu)說(shuō)明:通過(guò)SLB/Nginx組成一個(gè)負(fù)載均衡的接口服務(wù)器集群,利用分片分組策略組成一個(gè)MySQL數(shù)據(jù)庫(kù)集群和Redis緩存集群。
適用范圍:適用于日PV在500萬(wàn)以上的大型商業(yè)應(yīng)用。
2.多線程使用不正確
多線程最主要目的就是"最大限度地利用CPU資源",可以把串行過(guò)程變成并行過(guò)程,從而提高了程序的執(zhí)行效率。
2.1一個(gè)慢接口案例
假設(shè)在用戶登錄時(shí),如果是新用戶,需要?jiǎng)?chuàng)建用戶信息,并發(fā)放新用戶優(yōu)惠券。例子代碼如下:
// 登錄函數(shù)(示意寫(xiě)法) public UserVO login(String phoneNumber, String verifyCode) { // 檢查驗(yàn)證碼 if (!checkVerifyCode(phoneNumber, verifyCode)) { throw new ExampleException("驗(yàn)證碼錯(cuò)誤"); } // 檢查用戶存在 UserDO user = userDAO.getByPhoneNumber(phoneNumber); if (Objects.nonNull(user)) { return transUser(user); } // 創(chuàng)建新用戶 return createNewUser(user); } // 創(chuàng)建新用戶函數(shù) private UserVO createNewUser(String phoneNumber) { // 創(chuàng)建新用戶 UserDO user = new UserDO(); ... userDAO.insert(user); // 綁定優(yōu)惠券 couponService.bindCoupon(user.getId(), CouponType.NEW_USER); // 返回新用戶 return transUser(user); }其中,綁定優(yōu)惠券(bindCoupon)是給用戶綁定新用戶優(yōu)惠券,然后再給用戶發(fā)送推送通知。如果隨著優(yōu)惠券數(shù)量越來(lái)越多,該函數(shù)也會(huì)變得越來(lái)越慢,執(zhí)行時(shí)間甚至超過(guò)1秒,并且沒(méi)有什么優(yōu)化空間。現(xiàn)在,登錄(login)函數(shù)就成了名副其實(shí)的慢接口,需要進(jìn)行接口優(yōu)化。
2.2采用多線程優(yōu)化
通過(guò)分析發(fā)現(xiàn),綁定優(yōu)惠券(bindCoupon)函數(shù)可以異步執(zhí)行。首先想到的是采用多線程解決該問(wèn)題,代碼如下:
// 創(chuàng)建新用戶函數(shù) private UserVO createNewUser(String phoneNumber) { // 創(chuàng)建新用戶 UserDO user = new UserDO(); ... userDAO.insert(user); // 綁定優(yōu)惠券 executorService.execute(()->couponService.bindCoupon(user.getId(), CouponType.NEW_USER)); // 返回新用戶 return transUser(user); }現(xiàn)在,在新線程中執(zhí)行綁定優(yōu)惠券(bindCoupon)函數(shù),使用戶登錄(login)函數(shù)性能得到很大的提升。但是,如果在新線程執(zhí)行綁定優(yōu)惠券函數(shù)過(guò)程中,系統(tǒng)發(fā)生重啟或崩潰導(dǎo)致線程執(zhí)行失敗,用戶將永遠(yuǎn)獲取不到新用戶優(yōu)惠券。除非提供用戶手動(dòng)領(lǐng)取優(yōu)惠券頁(yè)面,否則就需要程序員后臺(tái)手工綁定優(yōu)惠券。所以,用采用多線程優(yōu)化慢接口,并不是一個(gè)完善的解決方案。
2.3采用消息隊(duì)列優(yōu)化
如果要保證綁定優(yōu)惠券函數(shù)執(zhí)行失敗后能夠重啟執(zhí)行,可以采用數(shù)據(jù)庫(kù)表、Redis隊(duì)列、消息隊(duì)列的等多種解決方案。由于篇幅優(yōu)先,這里只介紹采用MetaQ消息隊(duì)列解決方案,并省略了MetaQ相關(guān)配置僅給出了核心代碼。
消息生產(chǎn)者代碼:
// 創(chuàng)建新用戶函數(shù) private UserVO createNewUser(String phoneNumber) { // 創(chuàng)建新用戶 UserDO user = new UserDO(); ... userDAO.insert(user); // 發(fā)送優(yōu)惠券消息 Long userId = user.getId(); CouponMessageDataVO data = new CouponMessageDataVO(); data.setUserId(userId); data.setCouponType(CouponType.NEW_USER); Message message = new Message(TOPIC, TAG, userId, JSON.toJSONBytes(data)); SendResult result = metaqTemplate.sendMessage(message); if (!Objects.equals(result, SendStatus.SEND_OK)) { log.error("發(fā)送用戶({})綁定優(yōu)惠券消息失敗:{}", userId, JSON.toJSONString(result)); } // 返回新用戶 return transUser(user); }注意:可能出現(xiàn)發(fā)生消息不成功,但是這種概率相對(duì)較低。
消息消費(fèi)者代碼:
// 優(yōu)惠券服務(wù)類 @Slf4j @Service public class CouponService extends DefaultMessageListener<String> { // 消息處理函數(shù) @Override @Transactional(rollbackFor = Exception.class) public void onReceiveMessages(MetaqMessage<String> message) { // 獲取消息體 String body = message.getBody(); if (StringUtils.isBlank(body)) { log.warn("獲取消息({})體為空", message.getId()); return; } // 解析消息數(shù)據(jù) CouponMessageDataVO data = JSON.parseObject(body, CouponMessageDataVO.class); if (Objects.isNull(data)) { log.warn("解析消息({})體為空", message.getId()); return; } // 綁定優(yōu)惠券 bindCoupon(data.getUserId(), data.getCouponType()); } }解決方案優(yōu)點(diǎn):采集MetaQ消息隊(duì)列優(yōu)化慢接口解決方案的優(yōu)點(diǎn):
3.流程定義不合理
3.1.原有的采購(gòu)流程
這是一個(gè)簡(jiǎn)易的采購(gòu)流程,由庫(kù)管系統(tǒng)發(fā)起采購(gòu),采購(gòu)員開(kāi)始采購(gòu),采購(gòu)員完成采購(gòu),同時(shí)回流采集訂單到庫(kù)管系統(tǒng)。
其中,完成采購(gòu)動(dòng)作的核心代碼如下:
/** 完成采購(gòu)動(dòng)作函數(shù)(此處省去獲取采購(gòu)單/驗(yàn)證狀態(tài)/鎖定采購(gòu)單等邏輯) */ public void finishPurchase(PurchaseOrder order) { // 完成相關(guān)處理 ...... // 回流采購(gòu)單(調(diào)用HTTP接口) backflowPurchaseOrder(order); // 設(shè)置完成狀態(tài) purchaseOrderDAO.setStatus(order.getId(), PurchaseOrderStatus.FINISHED.getValue()); }由于函數(shù)backflowPurchaseOrder(回流采購(gòu)單)調(diào)用了HTTP接口,可能引起以下問(wèn)題:
3.2.優(yōu)化的采購(gòu)流程
通過(guò)需求分析,把"采購(gòu)員完成采購(gòu)并回流采集訂單"動(dòng)作拆分為"采購(gòu)員完成采購(gòu)"和"回流采集訂單"兩個(gè)獨(dú)立的動(dòng)作,把"采購(gòu)?fù)瓿?#34;拆分為"采購(gòu)?fù)瓿?#34;和"回流完成"兩個(gè)獨(dú)立的狀態(tài),更方便采購(gòu)流程的管理和實(shí)現(xiàn)。
拆分采購(gòu)流程的動(dòng)作和狀態(tài)后,核心代碼如下:
/** 完成采購(gòu)動(dòng)作函數(shù)(此處省去獲取采購(gòu)單/驗(yàn)證狀態(tài)/鎖定采購(gòu)單等邏輯) */ public void finishPurchase(PurchaseOrder order) { // 完成相關(guān)處理 ...... // 設(shè)置完成狀態(tài) purchaseOrderDAO.setStatus(order.getId(), PurchaseOrderStatus.FINISHED.getValue()); } /** 執(zhí)行回流動(dòng)作函數(shù)(此處省去獲取采購(gòu)單/驗(yàn)證狀態(tài)/鎖定采購(gòu)單等邏輯) */ public void executeBackflow(PurchaseOrder order) { // 回流采購(gòu)單(調(diào)用HTTP接口) backflowPurchaseOrder(order); // 設(shè)置回流狀態(tài) purchaseOrderDAO.setStatus(order.getId(), PurchaseOrderStatus.BACKFLOWED.getValue()); }其中,函數(shù)executeBackflow(執(zhí)行回流)由定時(shí)作業(yè)觸發(fā)執(zhí)行。如果回流采購(gòu)單失敗,采購(gòu)單狀態(tài)并不會(huì)修改為"已回流";等下次定時(shí)作業(yè)執(zhí)行時(shí),將會(huì)繼續(xù)執(zhí)行回流動(dòng)作;直到回流采購(gòu)單成功為止。
3.3.有限狀態(tài)機(jī)介紹
3.3.1概念
有限狀態(tài)機(jī)(Finite-state machine,FSM),又稱有限狀態(tài)自動(dòng)機(jī),簡(jiǎn)稱狀態(tài)機(jī),是表示有限個(gè)狀態(tài)以及在這些狀態(tài)之間的轉(zhuǎn)移和動(dòng)作等行為的一個(gè)數(shù)學(xué)模型。
3.3.2要素
狀態(tài)機(jī)可歸納為4個(gè)要素:現(xiàn)態(tài)、條件、動(dòng)作、次態(tài)。
現(xiàn)態(tài):指當(dāng)前流程所處的狀態(tài),包括起始、中間、終結(jié)狀態(tài)。
條件:也可稱為事件;當(dāng)一個(gè)條件被滿足時(shí),將會(huì)觸發(fā)一個(gè)動(dòng)作并執(zhí)行一次狀態(tài)的遷移。
動(dòng)作:當(dāng)條件滿足后要執(zhí)行的動(dòng)作。動(dòng)作執(zhí)行完畢后,可以遷移到新的狀態(tài),也可以仍舊保持原狀態(tài)。
次態(tài):當(dāng)條件滿足后要遷往的狀態(tài)。“次態(tài)”是相對(duì)于“現(xiàn)態(tài)”而言的,“次態(tài)”一旦被激活,就轉(zhuǎn)變成新的“現(xiàn)態(tài)”了。
3.3.3狀態(tài)
狀態(tài)表示流程中的持久狀態(tài),流程圖上的每一個(gè)圈代表一個(gè)狀態(tài)。
初始狀態(tài): 流程開(kāi)始時(shí)的某一狀態(tài);中間狀態(tài): 流程中間過(guò)程的某一狀態(tài);終結(jié)狀態(tài): 流程完成時(shí)的某一狀態(tài)。
使用建議:
3.3.4動(dòng)作
動(dòng)作的三要素:角色、現(xiàn)態(tài)、次態(tài),流程圖上的每一條線代表一個(gè)動(dòng)作。
角色: 誰(shuí)發(fā)起的這個(gè)操作,可以是用戶、定時(shí)任務(wù)等;現(xiàn)態(tài): 觸發(fā)動(dòng)作時(shí)當(dāng)前的狀態(tài),是執(zhí)行動(dòng)作的前提條件;次態(tài): 完成動(dòng)作后達(dá)到的狀態(tài),是執(zhí)行動(dòng)作的最終目標(biāo)。
使用建議:
- 每個(gè)動(dòng)作執(zhí)行前,必須檢查當(dāng)前狀態(tài)和觸發(fā)動(dòng)作狀態(tài)的一致性;
- 狀態(tài)機(jī)的狀態(tài)更改,只能通過(guò)動(dòng)作進(jìn)行,其它操作都是不符合規(guī)范的;
- 需要添加分布式鎖保證動(dòng)作的原子性,添加數(shù)據(jù)庫(kù)事務(wù)保證數(shù)據(jù)的一致性;
- 類似的動(dòng)作(比如操作用戶、請(qǐng)求參數(shù)、動(dòng)作含義等)可以合并為一個(gè)動(dòng)作,并根據(jù)動(dòng)作執(zhí)行結(jié)果轉(zhuǎn)向不同的狀態(tài)。
4.系統(tǒng)間交互不科學(xué)
4.1.直接通過(guò)數(shù)據(jù)庫(kù)交互
在一些項(xiàng)目中,系統(tǒng)間交互不通過(guò)接口調(diào)用和消息隊(duì)列,而是通過(guò)數(shù)據(jù)庫(kù)直接訪問(wèn)。問(wèn)其原因,回答道:"項(xiàng)目工期太緊張,直接訪問(wèn)數(shù)據(jù)庫(kù),簡(jiǎn)單又快捷"。
還是以上面的采購(gòu)流程為例——采購(gòu)訂單由庫(kù)管系統(tǒng)發(fā)起,由采購(gòu)系統(tǒng)負(fù)責(zé)采購(gòu),采購(gòu)?fù)瓿珊笸ㄖ獛?kù)管系統(tǒng),庫(kù)管系統(tǒng)進(jìn)入入庫(kù)操作。采購(gòu)系統(tǒng)采購(gòu)?fù)瓿珊?#xff0c;通知庫(kù)管系統(tǒng)數(shù)據(jù)庫(kù)的代碼如下:
/** 執(zhí)行回流動(dòng)作函數(shù)(此處省去獲取采購(gòu)單/驗(yàn)證狀態(tài)/鎖定采購(gòu)單等邏輯) */ public void executeBackflow(PurchaseOrder order) { // 完成原始采購(gòu)單 rawPurchaseOrderDAO.setStatus(order.getRawId(), RawPurchaseOrderStatus.FINISHED.getValue()); // 設(shè)置回流狀態(tài) purchaseOrderDAO.setStatus(order.getId(), PurchaseOrderStatus.BACKFLOWED.getValue()); }其中,通過(guò)rawPurchaseOrderDAO(原始采購(gòu)單DAO)直接訪問(wèn)庫(kù)管系統(tǒng)的數(shù)據(jù)庫(kù)表,并設(shè)置原始采購(gòu)單狀態(tài)為已完成。
一般情況下,直接通過(guò)數(shù)據(jù)訪問(wèn)的方式是不會(huì)有問(wèn)題的。但是,一旦發(fā)生競(jìng)態(tài),就會(huì)導(dǎo)致數(shù)據(jù)不同步。有人會(huì)說(shuō),可以考慮使用同一分布式鎖解決該問(wèn)題。是的,這種解決方案沒(méi)有問(wèn)題,只是又在系統(tǒng)間共享了分布式鎖。
具有數(shù)據(jù)庫(kù)表這樣的強(qiáng)關(guān)聯(lián),無(wú)法實(shí)現(xiàn)系統(tǒng)間的隔離和解耦。
4.2.通過(guò)Dubbo接口交互
由于采購(gòu)系統(tǒng)和庫(kù)管系統(tǒng)都是內(nèi)部系統(tǒng),可以通過(guò)類似Dubbo的RPC接口進(jìn)行交互。
庫(kù)管系統(tǒng)代碼:
/** 采購(gòu)單服務(wù)接口 */ public interface PurchaseOrderService { /** 完成采購(gòu)單函數(shù) */ public void finishPurchaseOrder(Long orderId); } /** 采購(gòu)單服務(wù)實(shí)現(xiàn) */ @Service("purchaseOrderService") public class PurchaseOrderServiceImpl implements PurchaseOrderService { /** 完成采購(gòu)單函數(shù) */ @Override @Transactional(rollbackFor = Exception.class) public void finishPurchaseOrder(Long orderId) { // 相關(guān)處理 ... // 完成采購(gòu)單 purchaseOrderService.finishPurchaseOrder(order.getRawId()); } }其中,庫(kù)管系統(tǒng)通過(guò)Dubbo把PurchaseOrderServiceImpl(采購(gòu)單服務(wù)實(shí)現(xiàn))以PurchaseOrderService(采購(gòu)單服務(wù)接口)定義的接口服務(wù)暴露給采購(gòu)系統(tǒng)。這里,省略了Dubbo開(kāi)發(fā)服務(wù)接口相關(guān)配置。
采購(gòu)系統(tǒng)代碼:
/** 執(zhí)行回流動(dòng)作函數(shù)(此處省去獲取采購(gòu)單/驗(yàn)證狀態(tài)/鎖定采購(gòu)單等邏輯) */ public void executeBackflow(PurchaseOrder order) { // 完成采購(gòu)單 purchaseOrderService.finishPurchaseOrder(order.getRawId()); // 設(shè)置回流狀態(tài) purchaseOrderDAO.setStatus(order.getId(), PurchaseOrderStatus.BACKFLOWED.getValue()); }其中,purchaseOrderService(采購(gòu)單服務(wù))為庫(kù)管系統(tǒng)PurchaseOrderService(采購(gòu)單服務(wù))在采購(gòu)系統(tǒng)中的Dubbo服務(wù)客戶端存根,通過(guò)該服務(wù)調(diào)用庫(kù)管系統(tǒng)的服務(wù)接口函數(shù)finishPurchaseOrder(完成采購(gòu)單函數(shù))。
這樣,采購(gòu)系統(tǒng)和庫(kù)管系統(tǒng)自己的強(qiáng)關(guān)聯(lián),通過(guò)Dubbo就簡(jiǎn)單地實(shí)現(xiàn)了系統(tǒng)隔離和解耦。當(dāng)然,除了采用Dubbo接口外,還可以采用HTTPS、HSF、WebService等同步接口調(diào)用方式,也可以采用MetaQ等異步消息通知方式。
4.3常見(jiàn)系統(tǒng)間交互協(xié)議
4.3.1同步接口調(diào)用
同步接口調(diào)用是以一種阻塞式的接口調(diào)用機(jī)制。常見(jiàn)的交互協(xié)議有:
- HTTP/HTTPS接口;
- WebService接口;
- Dubbo/HSF接口;
- CORBA接口。
4.3.2異步消息通知
異步消息通知是一種通知式的信息交互機(jī)制。當(dāng)系統(tǒng)發(fā)生某種事件時(shí),會(huì)主動(dòng)通知相應(yīng)的系統(tǒng)。常見(jiàn)的交互協(xié)議有:
- MetaQ的消息通知;
- CORBA消息通知。
4.4.常見(jiàn)系統(tǒng)間交互方式
4.4.1請(qǐng)求-應(yīng)答
適用范圍:適合于簡(jiǎn)單的耗時(shí)較短的接口同步調(diào)用場(chǎng)景,比如Dubbo接口同步調(diào)用。
4.4.2通知-確認(rèn)
適用范圍:適合于簡(jiǎn)單的異步消息通知場(chǎng)景,比如MetaQ消息通知。
4.4.3請(qǐng)求-應(yīng)答-查詢-返回
適用范圍:適合于復(fù)雜的耗時(shí)較長(zhǎng)的接口同步調(diào)用場(chǎng)景,比如提交作業(yè)任務(wù)并定期查詢?nèi)蝿?wù)結(jié)果。
4.4.4請(qǐng)求-應(yīng)答-回調(diào)
適用范圍:適合于復(fù)雜的耗時(shí)較長(zhǎng)的接口同步調(diào)用和異步回調(diào)相結(jié)合的場(chǎng)景,比如支付寶的訂單支付。
4.4.5請(qǐng)求-應(yīng)答-通知-確認(rèn)
適用范圍:適合于復(fù)雜的耗時(shí)較長(zhǎng)的接口同步調(diào)用和異步消息通知相結(jié)合的場(chǎng)景,比如提交作業(yè)任務(wù)并等待完成消息通知。
4.4.6通知-確認(rèn)-通知-確認(rèn)
適用范圍:適合于復(fù)雜的耗時(shí)較長(zhǎng)的異步消息通知場(chǎng)景。
5.數(shù)據(jù)查詢不分頁(yè)
在數(shù)據(jù)查詢時(shí),由于未能對(duì)未來(lái)數(shù)據(jù)量做出正確的預(yù)估,很多情況下都沒(méi)有考慮數(shù)據(jù)的分頁(yè)查詢。
5.1.普通查詢案例
以下是查詢過(guò)期訂單的代碼:
/** 訂單DAO接口 */ public interface OrderDAO { /** 查詢過(guò)期訂單函數(shù) */ @Select("select * from t_order where status = 5 and gmt_create < date_sub(current_timestamp, interval 30 day)") public List<OrderDO> queryTimeout(); } /** 訂單服務(wù)接口 */ public interface OrderService { /** 查詢過(guò)期訂單函數(shù) */ public List<OrderVO> queryTimeout(); }當(dāng)過(guò)期訂單數(shù)量很少時(shí),以上代碼不會(huì)有任何問(wèn)題。但是,當(dāng)過(guò)期訂單數(shù)量達(dá)到幾十萬(wàn)上千萬(wàn)時(shí),以上代碼就會(huì)出現(xiàn)以下問(wèn)題:
- 數(shù)據(jù)量太大,導(dǎo)致服務(wù)端的內(nèi)存溢出;
- 數(shù)據(jù)量太大,導(dǎo)致查詢接口超時(shí)、返回?cái)?shù)據(jù)超時(shí)等;
- 數(shù)據(jù)量太大,導(dǎo)致客戶端的內(nèi)存溢出。
所以,在數(shù)據(jù)查詢時(shí),特別是不能預(yù)估數(shù)據(jù)量的大小時(shí),需要考慮數(shù)據(jù)的分頁(yè)查詢。
這里,主要介紹"設(shè)置最大數(shù)量"和"采用分頁(yè)查詢"兩種方式。
5.2設(shè)置最大數(shù)量
"設(shè)置最大數(shù)量"是一種最簡(jiǎn)單的分頁(yè)查詢,相當(dāng)于只返回第一頁(yè)數(shù)據(jù)。例子代碼如下:
/** 訂單DAO接口 */ public interface OrderDAO { /** 查詢過(guò)期訂單函數(shù) */ @Select("select * from t_order where status = 5 and gmt_create < date_sub(current_timestamp, interval 30 day) limit 0, #{maxCount}") public List<OrderDO> queryTimeout(@Param("maxCount") Integer maxCount); } /** 訂單服務(wù)接口 */ public interface OrderService { /** 查詢過(guò)期訂單函數(shù) */ public List<OrderVO> queryTimeout(Integer maxCount); }適用于沒(méi)有分頁(yè)需求、但又擔(dān)心數(shù)據(jù)過(guò)多導(dǎo)致內(nèi)存溢出、數(shù)據(jù)量過(guò)大的查詢。
5.3采用分頁(yè)查詢
"采用分頁(yè)查詢"是指定startIndex(開(kāi)始序號(hào))和pageSize(頁(yè)面大小)進(jìn)行數(shù)據(jù)查詢,或者指定pageIndex(分頁(yè)序號(hào))和pageSize(頁(yè)面大小)進(jìn)行數(shù)據(jù)查詢。例子代碼如下:
/** 訂單DAO接口 */ public interface OrderDAO { /** 統(tǒng)計(jì)過(guò)期訂單函數(shù) */ @Select("select count(*) from t_order where status = 5 and gmt_create < date_sub(current_timestamp, interval 30 day)") public Long countTimeout(); /** 查詢過(guò)期訂單函數(shù) */ @Select("select * from t_order where status = 5 and gmt_create < date_sub(current_timestamp, interval 30 day) limit #{startIndex}, #{pageSize}") public List<OrderDO> queryTimeout(@Param("startIndex") Long startIndex, @Param("pageSize") Integer pageSize); } /** 訂單服務(wù)接口 */ public interface OrderService { /** 查詢過(guò)期訂單函數(shù) */ public PageData<OrderVO> queryTimeout(Long startIndex, Integer pageSize); }適用于真正的分頁(yè)查詢,查詢參數(shù)startIndex(開(kāi)始序號(hào))和pageSize(頁(yè)面大小)可由調(diào)用方指定。
5.4分頁(yè)查詢隱藏問(wèn)題
假設(shè),我們需要在一個(gè)定時(shí)作業(yè)(每5分鐘執(zhí)行一次)中,針對(duì)已經(jīng)超時(shí)的訂單(status=5,創(chuàng)建時(shí)間超時(shí)30天)進(jìn)行超時(shí)關(guān)閉(status=10)。實(shí)現(xiàn)代碼如下:
/** 訂單DAO接口 */ public interface OrderDAO { /** 查詢過(guò)期訂單函數(shù) */ @Select("select * from t_order where status = 5 and gmt_create < date_sub(current_timestamp, interval 30 day) limit #{startIndex}, #{pageSize}") public List<OrderDO> queryTimeout(@Param("startIndex") Long startIndex, @Param("pageSize") Integer pageSize); /** 設(shè)置訂單超時(shí)關(guān)閉 */ @Update("update t_order set status = 10 where id = #{orderId} and status = 5") public Long setTimeoutClosed(@Param("orderId") Long orderId) } /** 關(guān)閉過(guò)期訂單作業(yè)類 */ public class CloseTimeoutOrderJob extends Job { /** 分頁(yè)數(shù)量 */ private static final int PAGE_COUNT = 100; /** 分頁(yè)大小 */ private static final int PAGE_SIZE = 1000; /** 作業(yè)執(zhí)行函數(shù) */ @Override public void execute() { for (int i = 0; i < PAGE_COUNT; i++) { // 查詢處理訂單 List<OrderDO> orderList = orderDAO.queryTimeout(i * PAGE_COUNT, PAGE_SIZE); for (OrderDO order : orderList) { // 進(jìn)行超時(shí)關(guān)閉 ...... orderDAO.setTimeoutClosed(order.getId()); } // 檢查處理完畢 if(orderList.size() < PAGE_SIZE) { break; } } } }粗看這段代碼是沒(méi)有問(wèn)題的,嘗試循環(huán)100次,每次取1000條過(guò)期訂單,進(jìn)行訂單超時(shí)關(guān)閉操作,直到?jīng)]有訂單或達(dá)到100次為止。但是,如果結(jié)合訂單狀態(tài)一起看,就會(huì)發(fā)現(xiàn)從第二次查詢開(kāi)始,每次會(huì)忽略掉前startIndex(開(kāi)始序號(hào))條應(yīng)該處理的過(guò)期訂單。這就是分頁(yè)查詢存在的隱藏問(wèn)題:
當(dāng)滿足查詢條件的數(shù)據(jù),在操作中不再滿足查詢條件時(shí),會(huì)導(dǎo)致后續(xù)分頁(yè)查詢中前startIndex(開(kāi)始序號(hào))條滿足條件的數(shù)據(jù)被跳過(guò)。
可以采用"設(shè)置最大數(shù)量"的方式解決,代碼如下:
/** 訂單DAO接口 */ public interface OrderDAO { /** 查詢過(guò)期訂單函數(shù) */ @Select("select * from t_order where status = 5 and gmt_create < date_sub(current_timestamp, interval 30 day) limit 0, #{maxCount}") public List<OrderDO> queryTimeout(@Param("maxCount") Integer maxCount); /** 設(shè)置訂單超時(shí)關(guān)閉 */ @Update("update t_order set status = 10 where id = #{orderId} and status = 5") public Long setTimeoutClosed(@Param("orderId") Long orderId) } /** 關(guān)閉過(guò)期訂單作業(yè)(定時(shí)作業(yè)) */ public class CloseTimeoutOrderJob extends Job { /** 分頁(yè)數(shù)量 */ private static final int PAGE_COUNT = 100; /** 分頁(yè)大小 */ private static final int PAGE_SIZE = 1000; /** 作業(yè)執(zhí)行函數(shù) */ @Override public void execute() { for (int i = 0; i < PAGE_COUNT; i++) { // 查詢處理訂單 List<OrderDO> orderList = orderDAO.queryTimeout(PAGE_SIZE); for (OrderDO order : orderList) { // 進(jìn)行超時(shí)關(guān)閉 ...... orderDAO.setTimeoutClosed(order.getId()); } // 檢查處理完畢 if(orderList.size() < PAGE_SIZE) { break; } } } }?
總結(jié)
以上是生活随笔為你收集整理的第八十期:初创公司5大Java服务困局,阿里工程师如何打破?的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: Android 第十五课 如何使用Lit
- 下一篇: Android 第十六课 使用LiteP