亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

基于openLooKeng的交互式分析是怎樣的

發布時間:2021-12-23 18:57:19 來源:億速云 閱讀:198 作者:柒染 欄目:云計算

本篇文章給大家分享的是有關基于openLooKeng的交互式分析是怎樣的,小編覺得挺實用的,因此分享給大家學習,希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。

在這個“信息爆炸”的時代,大數據已經成為這個時代的關鍵詞之一!隨著云計算、物聯網、移動計算、智慧城市、人工智能等領域日新月異的發展,人類社會已經步入了“信息高速路”的行駛軌道,數據量增長迅速,各類應用對大數據處理的需求也發生著變化。

與此同時,“久經沙場”的數據倉庫不再一統江湖,而以實時分析、離線分析、交互式分析等為代表的計算引擎勢頭迅猛。

華為云3年前發布的Serverless大數據分析服務 - 數據湖探索DLI,經過這幾年的迭代升級,已經包含用于實時分析的Flink引擎,用于離線分析的Spark引擎。今年基于華為開源openLooKeng引擎的交互式分析功能,也將于Q4重磅發布,便于用戶構建輕量級流、批、交互式全場景數據湖。

openLooKeng使用了業界著名的開源SQL引擎Presto來提供交互式查詢分析基礎能力,并繼續在融合場景查詢、跨數據中心/云、數據源擴展、性能、可靠性、安全性等方面發展,讓數據治理、使用更簡單。

基于openLooKeng的交互式分析是怎樣的

關鍵特性

1. 毫秒級查詢性能

DLI使用的openLooKeng引擎在內存計算框架的基礎上,還利用許多查詢優化技術來滿足高性能毫秒級的交互式分析的需要。

1.1 索引

openLooKeng提供基于Bitmap Index、Bloom Filter以及Min-max Index等索引。通過在現有數據上創建索引,并且把索引結果存儲在數據源外部,在查詢計劃編排時便利用索引信息過濾掉不匹配的文件,減少需要讀取的數據規模,從而加速查詢過程。

1.2 Cache

openLooKeng提供豐富多樣的Cache,包括元數據cache、執行計劃cache、ORC行數據cache等。通過這些多樣的cache,可加速用戶多次對同一SQL或者同一類型SQL的查詢時延響應。

1.3 動態過濾

所謂的動態過濾是指是在運行時(run time)將join一側表的過濾信息的結果應用到另一側表的過濾器的優化方法,openLooKeng不僅提供了多種數據源的動態過濾優化特性,還將這一優化特性應用到了DataCenter Connector,從而加速不同場景關聯查詢的性能。

1.4 算子下推

openLooKeng通過Connector框架連接到RDBMS等數據源時,由于RDBMS具有較強的計算能力,一般情況下將算子下推到數據源進行計算可以獲取到更好的性能。openLooKeng目前支持多種數據源的算子下推,包括Oracle、HANA等,特別地,針對DC Connector也實現了算子下推,從而實現了更快的查詢時延響應。

2. 高可用

2.1 HA AA雙活

openLooKeng引入了高可用的AA特性,支持coordinator AA雙活機制,能夠保持多個coordinator之間的負載均衡,同時也保證了openLooKeng在高并發下的可用性。

2.2 Auto-scaling

openLooKeng的彈性伸縮特性支持將正在執行任務的服務節點平穩退服,同時也能將處于不活躍狀態的節點拉起并接受新的任務。openLooKeng通過提供“已隔離”與“隔離中”等狀態接口供外部資源管理者(如Yarn、Kubernetes等)調用,從而實現對coordinator和worker節點的彈性擴縮容。

3. 融合場景

實時分析、離線分析、交互式分析這三種場景中在很多實際業務中都是同時存在的,DLI引入openLooKeng引擎之初就考慮了如何跟已有的Spark引擎進行元數據層面的互通,從而實現離線分析結果,免數據搬遷直接就可以用openLooKeng引擎進行交互式分析。Spark和openLooKeng都支持Hive的建表方式,通過這種方式,實現了元數據層面的互通。

4. 統一目錄,跨域跨DC查詢

基于openLooKeng的交互式分析是怎樣的

DLI老用戶使用比較多的功能是跨多種數據源的聯合查詢,用于更全面地對數據進行關聯分析,釋放數據價值。這次引入openLooKeng引擎將跨源查詢的能力進一步延伸,開發了跨域跨DC查詢的DataCenter Connector。通過這個新Connector可以連接到遠端另外的openLooKeng集群,從而提供在不同數據中心間協同計算的能力。 其中的關鍵技術如下:

4.1 并行數據訪問

worker可以并發訪問數據源以提高訪問效率, 客戶端也可以并發從服務端獲取數據以加快數據獲取速度。

4.2 數據壓縮

在數據傳輸期間進行序列化之前,先使用GZIP壓縮算法對數據進行壓縮,以減少通過網絡傳輸的數據量。

4.3 跨DC動態過濾

過濾數據以減少從遠端提取的數據量,從而確保網絡穩定性并提高查詢效率。

以上就是基于openLooKeng的交互式分析是怎樣的,小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

开平市| 浮山县| 呼图壁县| 克什克腾旗| 郎溪县| 忻城县| 合山市| 缙云县| 曲周县| 简阳市| 黎川县| 晋州市| 曲阜市| 新建县| 奇台县| 宁陵县| 达拉特旗| 巴青县| 新闻| 海安县| 普宁市| 阜康市| 四平市| 阳信县| 梅州市| 九台市| 修武县| 东明县| 周宁县| 崇文区| 皮山县| 彭州市| 台山市| 文成县| 闽侯县| 万盛区| 德格县| 杨浦区| 翁牛特旗| 礼泉县| 嘉鱼县|