您好,登錄后才能下訂單哦!
這篇文章主要講解了“MetaQ的概念是什么”,文中的講解內容簡單清晰,易于學習與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學習“MetaQ的概念是什么”吧!
綜述
消息中間件是一種由消息傳送機制或消息隊列模式組成的最典型的中間件技術。通過消息中間件,應用程序或組件之間可以進行可靠的異步通訊來降低系統之間的耦合度,從而提高整個系統的可擴展性和可用性。
Notify是淘寶自主研發的一套消息服務引擎,是支撐雙11最為核心的系統之一,在淘寶和支付寶的核心交易場景中都有大量使用。消息系統的核心作用就是三點:解耦,異步和并行。下面讓我以一個實際的例子來說明一下解耦異步和并行分別所代表的具體意義吧:
假設我們有這么一個應用場景,為了完成一個用戶注冊淘寶的操作,可能需要將用戶信息寫入到用戶庫中,然后通知給紅包中心給用戶發新手紅包,然后還需要通知支付寶給用戶準備對應的支付寶賬號,進行合法性驗證,告知sns系統給用戶導入新的用戶等10步操作。
那么針對這個場景,一個最簡單的設計方法就是串行的執行整個流程,如圖3-1所示:
這種方式的最大問題是,隨著后端流程越來越多,每步流程都需要額外的耗費很多時間,從而會導致用戶更長的等待延遲。自然的,我們可以采用并行的方式來完成業務,能夠極大的減少延遲,如圖3-2所示。
但并行以后又會有一個新的問題出現了,在用戶注冊這一步,系統并行的發起了4個請求,那么這四個請求中,如果通知SNS這一步需要的時間很長,比如需要10秒鐘的話,那么就算是發新手包,準備支付寶賬號,進行合法性驗證這幾個步驟的速度再快,用戶也仍然需要等待10秒以后才能完成用戶注冊過程。因為只有當所有的后續操作全部完成的時候,用戶的注冊過程才算真正的“完成”了。用戶的信息狀態才是完整的。而如果這時候發生了更嚴重的事故,比如發新手紅包的所有服務器因為業務邏輯bug導致down機,那么因為用戶的注冊過程還沒有完全完成,業務流程也就是失敗的了。這樣明顯是不符合實際的需要的,隨著下游步驟的逐漸增多,那么用戶等待的時間就會越來越長,并且更加嚴重的是,隨著下游系統越來越多,整個系統出錯的概率也就越來越大。
通過業務分析我們能夠得知,用戶的實際的核心流程其實只有一個,就是用戶注冊。而后續的準備支付寶,通知sns等操作雖然必須要完成,但卻是不需要讓用戶等待的。
這種模式有個專業的名詞,就叫最終一致。為了達到最終一致,我們引入了MQ系統。業務流程如下:
主流程如圖3-3所示:
圖3-3-用戶注冊流程-引入MQ系統-主流程
異步流程如圖3-4所示:
圖3-4-用戶注冊流程-引入MQ系統-異步流程
核心原理
Notify在設計思路上與傳統的MQ有一定的不同,他的核心設計理念是
為了消息堆積而設計系統
無單點,可自由擴展的設計
下面就請隨我一起,進入到我們的消息系統內部來看看他設計的核心原理
為了消息堆積而設計系統在市面上的大部分MQ產品,大部分的核心場景就是點對點的消息傳輸通道,然后非常激進的使用內存來提升整體的系統性能,這樣做雖然標稱的tps都能達到很高,但這種設計的思路是很難符合大規模分布式場景的實際需要的。
在實際的分布式場景中,這樣的系統會存在著較大的應用場景瓶頸,在后端有大量消費者的前提下,消費者出現問題是個非常常見的情況,而消息系統則必須能夠在后端消費不穩定的情況下,仍然能夠保證用戶寫入的正常并且TPS不降,是個非常考驗消息系統能力的實際場景。
也因為如此,在Notify的整體設計中,我們最優先考慮的就是消息堆積問題,在目前的設計中我們使用了持久化磁盤的方式,在每次用戶發消息到Notify的時候都將消息先落盤,然后再異步的進行消息投遞,而沒有采用激進的使用內存的方案來加快投遞速度。
這種方式,雖然系統性能在峰值時比目前市面的MQ效率要差一些,但是作為整個業務邏輯的核心單元,穩定,安全可靠是系統的核心訴求。
無單點,可自由擴展的設計
圖3-5展示了組成Notify整個生態體系的有五個核心的部分。
發送消息的集群這主要是業務方的機器,這些APP的機器上是沒有任何狀態信息的,可以隨著用戶請求量的增加而隨時增加或減少業務發送方的機器數量,從而擴大或縮小集群能力。
配置服務器集群(Config server)這個集群的主要目的是動態的感知應用集群,消息集群機器上線與下線的過程,并及時廣播給其他集群。如當業務接受消息的機器下線時,config server會感知到機器下線,從而將該機器從目標用戶組內踢出,并通知給notify server,notify server 在獲取通知后,就可以將已經下線的機器從自己的投遞目標列表中刪除,這樣就可以實現機器的自動上下線擴容了。
消息服務器(Notify Server)消息服務器,也就是真正承載消息發送與消息接收的服務器,也是一個集群,應用發送消息時可以隨機選擇一臺機器進行消息發送,任意一臺server 掛掉,系統都可以正常運行。當需要增加處理能力時,只需要簡單地增加notify Server就可以了
存儲(Storage)Notify的存儲集群有多種不同的實現方式,以滿足不同應用的實際存儲需求。針對消息安全性要求高的應用,我們會選擇使用多份落盤的方式存儲消息數據,而對于要求吞吐量而不要求消息安全的場景,我們則可以使用內存存儲模型的存儲。自然的,所有存儲也被設計成了隨機無狀態寫入存儲模型以保障可以自由擴展。
消息接收集群業務方用于處理消息的服務器組,上下線機器時候也能夠動態的由config server 感知機器上下線的時機,從而可以實現機器自動擴展。
在雙11的整個準備過程中,Notify都承載了非常巨大的壓力,因為我們的核心假定就是后端系統一定會掛,而我們需要能夠承載整個交易高峰內的所有消息都會堆積在數據庫內的實際場景。
在多次壓測中,我們的系統表現還是非常穩定的,以60w/s的寫入量堆積4.5億消息的時候,整個系統表現非常淡定可靠。在真正的大促到來時,我們的后端系統響應效率好于預期,所以我們很輕松的就滿足了用戶所有消息投遞請求,比較好的滿足了用戶的實際需要。
METAQ是一款完全的隊列模型消息中間件,服務器使用Java語言編寫,可在多種軟硬件平臺上部署。客戶端支持Java、C++編程語言,已于2012年3月對外開源,開源地址是:http://metaq.taobao.org/。MetaQ大約經歷了下面3個階段
在2011年1月份發布了MetaQ 1.0版本,從Apache Kafka衍生而來,在內部主要用于日志傳輸。
在2012年9月份發布了MetaQ 2.0版本,解決了分區數受限問題,在數據庫binlog同步方面得到了廣泛的應用。
在2013年7月份發布了MetaQ 3.0版本,MetaQ開始廣泛應用于訂單處理,cache同步、流計算、IM實時消息、binlog同步等領域。MetaQ3.0版本已經開源,參見這里
綜上,MetaQ借鑒了Kafka的思想,并結合互聯網應用場景對性能的要求,對數據的存儲結構進行了全新設計。在功能層面,增加了更適合大型互聯網特色的功能點。
MetaQ簡介
圖3-6-MetaQ整體結構
如圖3-6所示,MetaQ對外提供的是一個隊列服務,內部實現也是完全的隊列模型,這里的隊列是持久化的磁盤隊列,具有非常高的可靠性,并且充分利用了操作系統cache來提高性能。
是一個隊列模型的消息中間件,具有高性能、高可靠、高實時、分布式特點。
Producer、Consumer、隊列都可以分布式。
Producer向一些隊列輪流發送消息,隊列集合稱為Topic,Consumer如果做廣播消費,則一個consumer實例消費* * 這個Topic對應的所有隊列,如果做集群消費,則多個Consumer實例平均消費這個topic對應的隊列集合。
能夠保證嚴格的消息順序
提供豐富的消息拉取模式
高效的訂閱者水平擴展能力
實時的消息訂閱機制
億級消息堆積能力
MetaQ存儲結構
MetaQ的存儲結構是根據阿里大規模互聯網應用需求,完全重新設計的一套存儲結構,使用這套存儲結構可以支持上萬的隊列模型,并且可以支持消息查詢、分布式事務、定時隊列等功能,如圖3-7所示。
圖3-7-MetaQ存儲體系
MetaQ單機上萬隊列
MetaQ內部大部分功能都靠隊列來驅動,那么必須支持足夠多的隊列,才能更好的滿足業務需求,如圖所示,MetaQ可以在單機支持上萬隊列,這里的隊列全部為持久化磁盤方式,從而對IO性能提出了挑戰。MetaQ是這樣解決的
Message全部寫入到一個獨立的隊列,完全的順序寫
Message在文件的位置信息寫入到另外的文件,串行方式寫。
通過以上方式,既做到數據可靠,又可以支持更多的隊列,如圖3-8所示。
圖3-8-MetaQ單機上萬隊列
MetaQ與Notify區別
Notify側重于交易消息,分布式事務消息方面。
MetaQ側重于順序消息場景,例如binlog同步。以及主動拉消息場景,例如流計算等。
Notify 交易消息轉 MetaQ 方案改進
MetaQ 交易集群主要是 Notify 交易消息的一個鏡像,舊有的方案是通過 Notify-Client 訂閱 Notify 交易消息,然后再轉投到 MetaQ 集群,這個方案的缺點:1. 通過消息訂閱的方式給 Notify 集群帶來比較大的壓力 2. 一旦 MetaQ 集群處理不及時會給 Notify 造成消息的堆積,從而帶來連鎖不良效應。新的方案則是從Notify DB直接拉取binlog到MetaQ,它帶來的優勢: 1. 解放 NotifyServer 集群的壓力;2. 通過 binlog 批量處理可以提升系統的吞吐量。
交易集群低延遲優化
天貓直播間,旨在通過實時獲取活動當天的交易數據,通過實時流計算的方式,及時、準確的展示各業務數據。它的特點就是數據全而準確、實時性要求較高。而在全鏈路壓測過程中發現從 Notify Mysql binlog 獲取數據時,出現較大的延遲,最嚴重的延遲高達4h+,這顯然是不合系統需求的。基于這些問題,我們在 Notify Mysql 端做了很多的優化:
Mysql 數據庫實例擴容,從而提高集群的整體吞吐量;
對 binlog 的存放位置進行優化,將數據存儲以及 binlog 存儲進行分離,從而發揮 DB 的最大寫性能;
由于 MySQL 的 binlog 操作存在鎖操作,優化了 MySQL 生成 binlog 的配置,保證了拉 binlog 無延時。
針對不同集群運行參數調優
根據業務的特點,對不同集群的運行參數調優,如批量拉取大小,刷盤方式,數據有效期等等;同時對io調度、虛擬內存等參數進行調優,以提供更為高效的堆積。
監控與實時告警
任何一個值得信賴的系統,最低限度是需要做到及時發現并處理異常,在第一時間排除故障發生的可能,從而提高產品的可用性。在雙十一活動之前,我們實現了由 MetaQ 系統內部,根據集群狀態,各消息的業務數據指標進行監控統計并主動告警,同時還能通過 Diamond 做到動態調整,從而提高監控的及時性以及靈活性。
回顧雙十一活動當日,淘寶消息寫入總量112億,消息投遞總量220億,支付寶消息寫入總量24億,消息投遞總量24億。其中實時直播間集群消息寫入峰值為13.1w,消息投遞峰值為27.8w。
從總體上看,我們的前期準備還是比較充分的,MetaQ 各集群在高峰期表現穩定,全天表現很平穩,個別訂閱組對消息進行重溯,部分消息有少量的堆積,但都沒有對系統造成影響,效果還是非常好的。75%的交易在聚石塔上完成,實時直播間交易統計延遲在1s左右,加減庫存做到零超賣。
目前分布式消息中間件產品已經服務于整個集團,支持了阿里集團各個公司的500多個業務應用系統。每日處理海量消息超350億次,保證所有交易數據高可靠,高性能,分布式事務處理,是中間件團隊最老牌的中間件產品之一。
資料來源:http://club.alibabatech.org/resource_detail.htm?topicId=61
業務操作和消息存儲都在本地事務域進行,不存在跨資源的事務。
提交/回滾消息有可能失敗,系統會處于短暫的不一致狀態
Broker會主動發送Check消息,確認消息是否提交或回滾
最終一致
將分布式事務分解在兩個本地事務中
客戶端需要付出的代價
實現CheckMessageListener接口
原帖鏈接:http://jm-blog.aliapp.com/?p=3405&utm_source=tuicool
雙十二大促是淘寶集市的年終促銷活動,活動當天掃描首頁二維碼贈送一注彩票的活動更是讓大家“玩”了一把。面對瞬間的數倍于往常的峰值,如何讓用戶有一個良好的體驗,如何保證系統的穩定運行,讓我們來揭秘這一切。
歸納一下系統需要做到如下幾點:
RT足夠短
壓力分布均勻
復雜邏輯分離,異步話
系統結構圖
大體分為兩個部分:活動系統,彩票系統,他們之間通過消息驅動。
活動系統里面只更新一個彩票分配的狀態,數據更新成功就返回給用戶,邏輯足夠簡單能保證RT非常短。彩票系統負責真正的彩票出票和更新用戶狀態等一些耗時操作。
用戶在首頁掃描二維碼發起對活動系統的請求,活動系統更新彩票分配狀態,產生一條消息,立即返回并。彩票系統收到這個消息完成后續出票等一些的業務操作。整個過程是通過MetaQ提供的消息服務驅動完成。活動的時候會有大量的請求涌進活動系統,會產生大量的消息,預估qps達到24w;并且消息不可丟失,確保用戶都能領到一注彩票;活動系統,彩票系統業務復雜度相差較大,處理能力也相差較大,可能會出現大量的堆積;為了讓用戶有個較好的體驗,消息的消費也需要足夠的及時。綜上對MetaQ有這么一些挑戰:
高吞吐量
數據可靠
高效堆積
消息投遞足夠低延遲
下面介紹一下MetaQ如何做到這些的。
MetaQ簡介
METAQ是一款完全的隊列模型消息中間件,服務器使用Java語言編寫,可在多種軟硬件平臺上部署。客戶端支持Java、C++編程語言,已于2012年3月對外開源,開源地址。MetaQ的設計目標是高吞吐量,高效堆積。完全的隊列模型還提供了順序消息,消息回溯等一些特性。
基本概念
Topic 消息主題
Partition 分區,代表一個消費隊列 (一個Topic可以劃分為多個分區,分區數越多并行度越大,支持的Qps越高)
Group 消費分組,代表一個消費集群
MetaQ對外提供的是一個隊列服務,內部實現也是完全的隊列模型,這里的隊列是持久化的磁盤隊列,具有非常高的可靠性,并且充分利用了操作系統cache來提高性能。這些特性都源于存儲層的設計。
MetaQ存儲結構
MetaQ的存儲結構是根據阿里大規模互聯網應用需求,完全重新設計的一套存儲結構,使用這套存儲結構可以支持上萬的隊列模型,并且可以支持消息查詢、分布式事務、定時隊列等功能,如圖3所示。
存儲層可以大致分為數據文件(CommitLog)和索引文件兩部分。數據文件保存了所有的消息的內容,索引文件保存了消息所在數據文件的偏移量。消息數據不區分Topic,順序的append到CommitLog,索引文件按照Topic-Partition維度組織,不同分區的消息append到不同索引隊列里面。
消息寫入
客戶端發送一條消息,數據首先會寫到文件緩存中,同時派發一個寫索引請求;異步的構建消息索引。
消息讀取
客戶端讀取消息,根據索引的位置找到需要讀取的消息的物理位置和消息長度,從CommitLog中讀取數據,通過文件緩存來加速消息的讀取。通常熱數據都在緩存中,無需IO操作;非熱數據,會觸發缺頁中斷,數據從磁盤加載到文件緩存中,直接寫到socket緩沖區,避免數據進入Java堆。
數據刷盤
刷盤后數據最終持久化到磁盤。刷盤方式分為兩種方式:同步刷盤,數據寫入緩存后立即刷盤,確保數據落盤后返回客戶端,MetaQ在同步刷盤過程中也做了一定優化避免過多的性能損失;異步刷盤,數據批量定時的刷到磁盤。
數據清理
消息數據按照文件有效期定時做清理。
數據復制
數據可靠性要求很高的應用,可通過數據復制保證數據的可靠。MetaQ提供兩種數據同步的方式:同步雙寫,數寫入到主機后會同時寫到備機,主備都寫成功才返回客戶端成功,主備間數據無延遲,MetaQ有一套自己的主備間高效數據復制方案;異步復制,數據寫到主機后返回客戶端成功,主備間異步同步,主備間存在一定的延遲。
MetaQ單機上萬隊列
MetaQ的大部分功能都是靠隊列來驅動,以文件的方式存儲,通過內存映射對數據進行操作。所有的消息都是順序的寫到數據文件(CommitLog),完全順序的寫入,避免隨機IO;消息索引按照Topic和Partition的維度區分串行的寫到索引文件。通過這種這種組織方式可以實現單機上萬隊列,如圖4所示。
數據流圖
消息數據首先寫入到Java堆,然后在寫入到文件緩存,在根據具體的刷盤策略Flush到磁盤;消費消息的時候如果是熱數據則直接從系統緩存寫到socket發到遠端;如果非熱數據則由系統產生缺頁中斷將數據從磁盤加載到系統緩存在寫到socket,數據不進應用程序內存空間。內存的管理,頁面的換入換出都是由OS來管理的。同時消息的拉取也是批量的,一次處理多條數據,盡量減少往返的時間。
MetaQ性能依賴于系統內存分配,磁盤IO的有效利用,所以我們也對操作系統內存分配,臟頁會寫策略,以及IO調度算法做了一些調優,讓資源的分配耗時趨于平穩,堆積的時候保持較高的吞吐量。
發送端負載
默認發送端通過輪詢的方式向broker寫消息,如圖6所示;也可以自行指定消息發到哪里。
消費端負載
默認是消費集群機器均分所有的消費隊列。余下的部分由靠前的消費者消費,如圖7所示。消費端負載均很也可以定制,如同機房優先等。
感謝各位的閱讀,以上就是“MetaQ的概念是什么”的內容了,經過本文的學習后,相信大家對MetaQ的概念是什么這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關知識點的文章,歡迎關注!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。