核心點有很多,為了更貼合實際場景,我從常見的面試問題入手:
當然在剖析這幾個問題之前需要簡單的介紹下什么是消息隊列,消息隊列常見的一些基本術語和概念。 接下來進入正文。 什么是消息隊列來看看維基百科怎么說的,順帶學學英語這波不虧:
翻譯一下:在計算機科學領域,消息隊列和郵箱都是軟件工程組件,通常用于進程間或同一進程內的線程通信。它們通過隊列來傳遞消息-傳遞控制信息或內容,群組通信系統(tǒng)提供類似的功能。 簡單的概括下上面的定義:消息隊列就是一個使用隊列來通信的組件。 上面的定義沒有錯,但就現(xiàn)在而言我們日常所說的消息隊列常常指代的是消息中間件,它的存在不僅僅只是為了通信這個問題。 為什么需要消息隊列從本質上來說是因為互聯(lián)網(wǎng)的快速發(fā)展,業(yè)務不斷擴張,促使技術架構需要不斷的演進。 從以前的單體架構到現(xiàn)在的微服務架構,成百上千的服務之間相互調用和依賴。從互聯(lián)網(wǎng)初期一個服務器上有 100 個在線用戶已經(jīng)很了不得,到現(xiàn)在坐擁10億日活的微信。我們需要有一個「東西」來解耦服務之間的關系、控制資源合理合時的使用以及緩沖流量洪峰等等。 消息隊列就應運而生了。它常用來實現(xiàn):異步處理、服務解耦、流量控制。 異步處理隨著公司的發(fā)展你可能會發(fā)現(xiàn)你項目的請求鏈路越來越長,例如剛開始的電商項目,可以就是粗暴的扣庫存、下單。慢慢地又加上積分服務、短信服務等。這一路同步調用下來客戶可能等急了,這時候就是消息隊列登場的好時機。 調用鏈路長、響應就慢了,并且相對于扣庫存和下單,積分和短信沒必要這么的 '及時'。因此只需要在下單結束那個流程,扔個消息到消息隊列中就可以直接返回響應了。而且積分服務和短信服務可以并行的消費這條消息。 可以看出消息隊列可以減少請求的等待,還能讓服務異步并發(fā)處理,提升系統(tǒng)總體性能。 服務解耦上面我們說到加了積分服務和短信服務,這時候可能又要來個營銷服務,之后領導又說想做個大數(shù)據(jù),又來個數(shù)據(jù)分析服務等等。 可以發(fā)現(xiàn)訂單的下游系統(tǒng)在不斷的擴充,為了迎合這些下游系統(tǒng)訂單服務需要經(jīng)常地修改,任何一個下游系統(tǒng)接口的變更可能都會影響到訂單服務,這訂單服務組可瘋了,真 ·「核心」項目組。 所以一般會選用消息隊列來解決系統(tǒng)之間耦合的問題,訂單服務把訂單相關消息塞到消息隊列中,下游系統(tǒng)誰要誰就訂閱這個主題。這樣訂單服務就解放啦! 流量控制想必大家都聽過「削峰填谷」,后端服務相對而言都是比較「弱」的,因為業(yè)務較重,處理時間較長。像一些例如秒殺活動爆發(fā)式流量打過來可能就頂不住了。因此需要引入一個中間件來做緩沖,消息隊列再適合不過了。 網(wǎng)關的請求先放入消息隊列中,后端服務盡自己最大能力去消息隊列中消費請求。超時的請求可以直接返回錯誤。 當然還有一些服務特別是某些后臺任務,不需要及時地響應,并且業(yè)務處理復雜且流程長,那么過來的請求先放入消息隊列中,后端服務按照自己的節(jié)奏處理。這也是很 nice 的。 上面兩種情況分別對應著生產(chǎn)者生產(chǎn)過快和消費者消費過慢兩種情況,消息隊列都能在其中發(fā)揮很好的緩沖效果。 注意引入消息隊列固然有以上的好處,但是多引入一個中間件系統(tǒng)的穩(wěn)定性就下降一層,運維的難度抬高一層。因此要權衡利弊,系統(tǒng)是演進的。 消息隊列基本概念消息隊列有兩種模型:隊列模型和發(fā)布/訂閱模型。 隊列模型生產(chǎn)者往某個隊列里面發(fā)送消息,一個隊列可以存儲多個生產(chǎn)者的消息,一個隊列也可以有多個消費者,但是消費者之間是競爭關系,即每條消息只能被一個消費者消費。 發(fā)布/訂閱模型為了解決一條消息能被多個消費者消費的問題,發(fā)布/訂閱模型就來了。該模型是將消息發(fā)往一個 其實可以這么理解,發(fā)布/訂閱模型等于我們都加入了一個群聊中,我發(fā)一條消息,加入了這個群聊的人都能收到這條消息。那么隊列模型就是一對一聊天,我發(fā)給你的消息,只能在你的聊天窗口彈出,是不可能彈出到別人的聊天窗口中的。 講到這有人說,那我一對一聊天對每個人都發(fā)同樣的消息不就也實現(xiàn)了一條消息被多個人消費了嘛。 是的,通過多隊列全量存儲相同的消息,即數(shù)據(jù)的冗余可以實現(xiàn)一條消息被多個消費者消費。 這里還能看到假設群聊里除我之外只有一個人,那么此時的發(fā)布/訂閱模型和隊列模型其實就一樣了。 小結一下隊列模型每條消息只能被一個消費者消費,而發(fā)布/訂閱模型就是為讓一條消息可以被多個消費者消費而生的,當然隊列模型也可以通過消息全量存儲至多個隊列來解決一條消息被多個消費者消費問題,但是會有數(shù)據(jù)的冗余。 發(fā)布/訂閱模型兼容隊列模型,即只有一個消費者的情況下和隊列模型基本一致。
接下來的內容都基于發(fā)布/訂閱模型。 常用術語一般我們稱發(fā)送消息方為生產(chǎn)者 消息從 為了提高并發(fā)度,往往發(fā)布/訂閱模型還會引入隊列或者分區(qū)的概念。即消息是發(fā)往一個主題下的某個隊列或者某個分區(qū)中。 例如某個主題下有 5 個隊列,那么這個主題的并發(fā)度就提高為 5 ,同時可以有 5 個消費者并行消費該主題的消息。一般可以采用輪詢或者 與之對應的消費者一般都有組的概念 假設現(xiàn)在有兩個消費組分別是 然后這條消息實際是寫入 在物理上除了副本拷貝之外,一條消息在 來個圖看看應該就很清晰了。 基本上熟悉了消息隊列常見的術語和一些概念之后,咱們再來看看消息隊列常見的核心面試點。 如何保證消息不丟失就我們市面上常見的消息隊列而言,只要配置得當,我們的消息就不會丟。 先來看看這個圖, 可以看到一共有三個階段,分別是生產(chǎn)消息、存儲消息和消費消息。我們從這三個階段分別入手來看看如何確保消息不會丟失。 生產(chǎn)消息生產(chǎn)者發(fā)送消息至 這樣就能保證在生產(chǎn)消息階段消息不會丟失。 存儲消息存儲消息階段需要在消息刷盤之后再給生產(chǎn)者響應,假設消息寫入緩存中就返回響應,那么機器突然斷電這消息就沒了,而生產(chǎn)者以為已經(jīng)發(fā)送成功了。 如果 那假如來個地震機房機子都掛了呢?emmmmmm...大公司基本上都有異地多活。 那要是這幾個地都地震了呢?emmmmmm...這時候還是先關心關心人吧。 ![]() 消費消息這里經(jīng)常會有同學犯錯,有些同學當消費者拿到消息之后直接存入內存隊列中就直接返回給 你需要考慮拿到消息放在內存之后消費者就宕機了怎么辦。所以我們應該在消費者真正執(zhí)行完業(yè)務邏輯之后,再發(fā)送給 所以只要我們在消息業(yè)務邏輯處理完成之后再給 小結一下可以看出,保證消息的可靠性需要三方配合。
但是要注意消息可靠性增強了,性能就下降了,等待消息刷盤、多副本同步后返回都會影響性能。因此還是看業(yè)務,例如日志的傳輸可能丟那么一兩條關系不大,因此沒必要等消息刷盤再響應。 如果處理重復消息我們先來看看能不能避免消息的重復。 假設我們發(fā)送消息,就管發(fā),不管 但是一般情況我們是不允許這樣的,這樣消息就完全不可靠了,我們的基本需求是消息至少得發(fā)到 再看消費者消費的時候,假設我們消費者拿到消息消費了,業(yè)務邏輯已經(jīng)走完了,事務提交了,此時需要更新 可以看到正常業(yè)務而言消息重復是不可避免的,因此我們只能從另一個角度來解決重復消息的問題。 關鍵點就是冪等。既然我們不能防止重復消息的產(chǎn)生,那么我們只能在業(yè)務上處理重復消息所帶來的影響。 ![]() 冪等處理重復消息冪等是數(shù)學上的概念,我們就理解為同樣的參數(shù)多次調用同一個接口和調用一次產(chǎn)生的結果是一致的。 例如這條 SQL 因此需要改造業(yè)務處理邏輯,使得在重復消息的情況下也不會影響最終的結果。 可以通過上面我那條 SQL 一樣,做了個前置條件判斷,即 或者通過數(shù)據(jù)庫的約束例如唯一鍵,例如 或者記錄關鍵的key,比如處理訂單這種,記錄訂單ID,假如有重復的消息過來,先判斷下這個ID是否已經(jīng)被處理過了,如果沒處理再進行下一步。當然也可以用全局唯一ID等等。 基本上就這么幾個套路,真正應用到實際中還是得看具體業(yè)務細節(jié)。 如何保證消息的有序性有序性分:全局有序和部分有序。 全局有序如果要保證消息的全局有序,首先只能由一個生產(chǎn)者往 不過一般情況下我們都不需要全局有序,即使是同步 ![]() 部分有序因此絕大部分的有序需求是部分有序,部分有序我們就可以將 ![]() 圖中我畫了多個生產(chǎn)者,一個生產(chǎn)者也可以,只要同類消息發(fā)往指定的隊列即可。 如果處理消息堆積消息的堆積往往是因為生產(chǎn)者的生產(chǎn)速度與消費者的消費速度不匹配。有可能是因為消息消費失敗反復重試造成的,也有可能就是消費者消費能力弱,漸漸地消息就積壓了。 因此我們需要先定位消費慢的原因,如果是 假如邏輯我們已經(jīng)都優(yōu)化了,但還是慢,那就得考慮水平擴容了,增加 當然你消費者內部是單線程還是多線程消費那看具體場景。不過要注意上面提高的消息丟失的問題,如果你是將接受到的消息寫入內存隊列之后,然后就返回響應給 最后上面的幾個問題都是我們在使用消息隊列的時候經(jīng)常能遇到的問題,并且也是面試關于消息隊列方面的核心考點。今天沒有深入具體消息隊列的細節(jié),但是套路就是這么個套路,大方向上搞明白很關鍵。之后再接著寫有關 我是敖丙,你知道的越多,你不知道的越多,我們下期見。 |
|