hbase針對full gc所做的優化方法是什么

發布時間：2021-12-09 11:59:25 來源：億速云閱讀：211 作者：iii 欄目：大數據

本篇內容主要講解“hbase針對full gc所做的優化方法是什么”，感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷，實用性強。下面就讓小編來帶大家學習“hbase針對full gc所做的優化方法是什么”吧!

1、最原始的HBase CMS GC相當嚴重，經常會因為碎片過多導致Promotion Failure，嚴重影響業務的讀寫請求。
2、分別是針對Memstore所作的兩個優化：Thread-Local Allocation Buffer和MemStore Chunk Pool
3、以及針對BlockCache所作的優化：BucketCache方案。
4、在詳細介紹這幾個優化之前有必要簡單介紹一下HBase GC優化的目標，很直觀的，
5、第一是要盡量避免長時間的Full GC，避免影響用戶的讀寫請求；
6、第二是盡量減少GC時間，提高讀寫性能；
7、接著分別來看HBase針對GC所做的各種優化：

MemStore GC優化一－ Thread-Local Allocation Buffer
回顧hbase數據寫流程
1、HBase數據寫入操作實際上并沒有直接將數據寫入磁盤，
2、而是先寫入內存并順序寫入HLog，
3、之后等待滿足某個特定條件后統一將內存中的數據刷新到磁盤。
4、一個RegionServer通常由多個Region組成，每張Region通常包含一張表的多個列族，而每個列族對應一塊內存區域，這塊內存被稱為MemStore，
5、很顯然，一個RegionServer會由多個Region構成，一個Region會由多個MemStore構成。

老版本hbase中：
1、最原始的HBase版本存在很嚴重的內存碎片，經常會導致長時間的Full GC，其中最核心的問題就出在MemStore這里。
2、因為一個RegionServer由多個Region構成，不同Region的數據寫入到對應Memstore，
3、在JVM看來其實是混合在一起寫入Heap（堆內存）的

為了優化這種內存碎片可能導致的Full GC，HBase借鑒了Arena Allocation內存管理方式，它通過順序化分配內存、內存數據分塊等特性使得內存碎片更加粗粒度，有效改善Full GC情況；

具體實現原理如下：

每個MemStore會實例化出來一個MemStoreLAB
MemStoreLAB會申請一個2M大小的Chunk數組和一個Chunk偏移量，初始值為0
當一個KeyValue值插入MemStore后，MemStoreLAB會首先通過KeyValue.getBuffer()取得data數組，并將data數組復制到Chunk數組中，之后再將Chunk偏移量往前移動data.length
如果當前Chunk滿了之后，再調用new byte[ 2 1024 1024]申請一個新的Chunk

提示：
很顯然，通過申請2M大小的Chunk可以使得內存碎片更加粗粒度，官方在優化前后通過設置 -xx:PrintFLSStatistics = 1
未優化前碎片會大量出現導致頻繁的Full GC，優化后雖然依然會產生大量碎片，但是最大碎片大小一直會維持在1e＋08左右，極大地降低了Full GC頻率。

MemStore GC優化二 – MemStore Chunk Pool
MemStore Chunk Pool的核心思想為：
1、如果這些Chunk能夠被循環利用，系統就不需要申請新的Chunk，這樣就會使得YGC頻率降低，晉升到老生代的Chunk就會減少，CMS GC發生的頻率就會降低。

為什么Chunk不能被循環利用呢？
1、一旦一個Chunk寫滿之后，系統就會重新申請一個新的Chunk，
2、這些Chunk大部分都會經過多次YGC之后晉升到老生代，如果某個Chunk再沒有被引用就會被JVM垃圾回收。
3、很顯然，不斷申請新的Chunk會導致YGC頻率不斷增多，YGC頻率增加必然會導致晉升到老生代的Chunk增多，進而增加CMS GC發生的頻率。

具體實現如下：

系統會創建一個Chunk Pool來管理所有未被引用的chunks，這些chunk就不會再被JVM當作垃圾回收掉了
如果一個Chunk沒有再被引用，將其放入Chunk Pool
如果當前Chunk Pool已經達到了容量最大值，就不會再接納新的Chunk
如果需要申請新的Chunk來存儲KeyValue，首先從Chunk Pool中獲取，如果能夠獲取得到就重復利用，如果為null就重新申請一個新的Chunk

官方針對該優化也進行了簡單的測試，使用jstat -gcutil對優化前后的JVM GC情況進行了統計，具體的測試條件和測試結果如下所示：

測試條件：
HBase版本：0.94
JVM參數：-Xms4G -Xmx4G -Xmn2G
單條數據大小：Row size=50 bytes, Value size=1024 bytes
實驗方法：50 concurrent theads per client, insert 10,000,000 rows
//cdh中參數為：
根據 MSLAB 分配方式分配的塊區大小
hbase.hregion.memstore.mslab.chunksize = 2M
MemStoreChunkPool&MSLAB提升HBASE GC性能 https://blog.csdn.net/map_lixiupeng/article/details/40914567

BlockCache優化－BucketCache方案
1、BucketCache。這種方案還是采用“將小碎片整理為大碎片”的思路，
2、由程序在初始化的時候就申請了很多大小為2M的Bucket，數據Block的Get/Cache動作只是對這片空間的訪問/覆寫，CMS碎片會自然大大降低。

1、其中heap模式表示將數據存儲在JVM堆內存，
2、offheap模式表示將數據Block存儲到操作系統內存，
3、file模式表示將數據Block存儲到類似于SSD的外部高速緩存上；
//很顯然，offheap模式和file模式根本沒有將數據Block存在JVM堆內存，所以幾乎不會出現Full GC，而heap模式即使數據存儲在JVM堆內存，也會因為內存由程序獨立管理大大降低內存碎片。
從結果可以看出，BucketCache大大減少了碎片的產生，而且YGC和FGC時間也極大地得到了改善。

到此，相信大家對“hbase針對full gc所做的優化方法是什么”有了更深的了解，不妨來實際操作一番吧！這里是億速云網站，更多相關內容可以進入相關頻道進行查詢，關注我們，繼續學習！

向AI問一下細節

亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

hbase針對full gc所做的優化方法是什么

猜你喜歡

亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

hbase針對full gc所做的優化方法是什么

猜你喜歡

最新資訊

相關推薦

相關標簽