您好,登錄后才能下訂單哦!
這篇文章主要介紹“Hbase Release怎么使用”,在日常操作中,相信很多人在Hbase Release怎么使用問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”Hbase Release怎么使用”的疑惑有所幫助!接下來,請跟著小編一起來學習吧!
1 : 下載:
Hbase Releases
2:當前我們的穩定的版本為:The 0.98.x series
下載界面如下:
選擇Stable穩定的版本,進行下載:
由于目前 hbase和hadoo的2個重大的分支關系,需要版本之間的匹配。
而 hadoop本身目前已經更新到了最新的hadoop 第二代。
典型的下載地址如下:
http://mirrors.cnnic.cn/apache/hadoop/common/stable/
、
目前選擇的hadoop2的版本為 hadoop-2.5.1.tar.gz
目前安裝的為社區版本的 hadoop2 + hbase0.98 版。 如果你想安裝CHD CLouder 版本的 hadoop +hbase,請參考另外的博文,CDH hadoop系列
在最新的Hbase版本之中,引入了如下的新特性:
性能相關
讀緩存改進: HDFS 將圖片和checksum存儲在不同的block中的,所以每次我們進行讀操作,都需要進行兩次磁盤操作(一次讀數據文件,一次讀checksum所在的文件)。在 HBASE-5074 這個提案中,提出了將checksum存到block 緩存中的想法。在0.94 版本中,這一特性已經是默認開啟的了。
讀文件優化: 在0.94 版本之前,如果一個column family對應了多個StoreFile,那么HBase 會從各個StoreFile中讀取數據進行合并,即使我們需要的數據在最近的數據文件中存在,也會進行這樣的操作。在 HBASE-4465 這個提案中提出了一個叫Lazy Seek的優化,通過先在最近的StoreFile中先讀取數據,再看其它StoreFile是否在這個數據操作時間后有操作,如果沒有,就不對這個StoreFile進行讀取了。這大大減少了對StoreFile的讀操作,這一特性也已經是默認開啟了。
WAL文件優化: WAL是Write Ahead Log的意思,HBase在每次寫操作都會先寫WAL文件,通常WAL文件的寫入速度直接影響到HBase的整體數據吞吐。而且WAL文件還會根據配置同步到多個數據節點上。在提案 HBASE-4608 中,提到了對Hlog數據進行壓縮的想法,同步后的日志文件更小,能夠更快地在數據節點間的同步,從而實現更高的數據吞吐。目前這一優化也是默認開啟。
新特性
急求箱工具增強: 對原來的HBck工具進行了增強,提供了對孤兒region、region空洞、重疊region的修復。見提案 HBASE-5128: “Uber hbck”。
簡化Region Size設置: 通常我們要設置一個region size是很難的,需要考慮很多其它因素。在0.94版本中,按提案 HBASE-4365 的方法,通過動態算法對region size進行制定。
更完整的事務支持: 之前Hbase提供行級的事務,不過每次事務只能執行一個寫操作,比如連續地執行一系列Put,Delete操作,那么這些操作是單獨一個個的事務,其整體并不是原子性執行的。而在0.94版本中,可以實現Put、Delete在同一個事務中一起原子性執行。見提案 HBASE-3584。
實際上上面不過是一些比較大的改進,這一版本共做了140個功能增強,修復了180個bug。在你的安裝包,或則官方的發行記錄中。
到此,關于“Hbase Release怎么使用”的學習就結束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學習,快去試試吧!若想繼續學習更多相關知識,請繼續關注億速云網站,小編會繼續努力為大家帶來更多實用的文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。