亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

HIVE有什么用

發布時間:2021-12-13 09:19:44 來源:億速云 閱讀:196 作者:小新 欄目:大數據

這篇文章將為大家詳細講解有關HIVE有什么用,小編覺得挺實用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。

一、HIVE與數據倉庫

             在實際工作中,hive往往被用于建設數據倉庫,所以,在學習HIVE前,你有必要去簡單了解一下數據倉庫的一些基本概念,比如:

1、什么是數據倉庫

2、數據倉庫與數據庫區別 

3、數據倉庫分層架構

      由于這些概念在網上很多,這里就不在介紹了,請自行網上查找。

二、Hive的概念

   1、 Hive是基于Hadoop的一個數據倉庫工具
  • 可以將結構化的數據文件映射為一張數據庫表,并提供類SQL查詢功能。

  • 其本質是將SQL轉換為MapReduce的任務進行運算,底層由HDFS來提供數據的存儲支持,說白了hive可以理解為一個將SQL轉換為MapReduce任務的工具,甚至更進一步可以說hive就是一個MapReduce的客戶端

  HIVE有什么用

2、Hive與數據庫的區別

     HIVE有什么用

  • Hive 具有 SQL 數據庫的外表,但應用場景完全不同。

  • Hive 只適合用來做海量離線數據統計分析,也就是數據倉庫。

3、Hive的優缺點
  • 優點 

  • 操作接口采用類SQL語法,提供快速開發的能力(簡單、容易上手)。

  • 避免了去寫MapReduce,減少開發人員的學習成本。

  • Hive支持用戶自定義函數,用戶可以根據自己的需求來實現自己的函數。

  • 缺點

  • Hive的查詢延遲很嚴重

  • Hive不支持事務

4、Hive架構原理

HIVE有什么用

  • 1、用戶接口:Client

    • CLI(hive shell)

  • JDBC/ODBC(java訪問hive)

  • WEBUI(瀏覽器訪問hive)

  • 2、元數據:Metastore

    • 元數據包括:表名、表所屬的數據庫(默認是default)、表的擁有者、列/分區字段、表的類型(是否是外部表)、表的數據所在目錄等;

  • 默認存儲在自帶的derby數據庫中,推薦使用MySQL存儲Metastore

  • 3、Hadoop集群

  • 使用HDFS進行存儲,使用MapReduce進行計算。

  • 4、Driver:驅動器

    • 解析器(SQL Parser)

      將SQL字符串轉換成抽象語法樹AST

      對AST進行語法分析,比如表是否存在、字段是否存在、SQL語義是否有誤

  • 編譯器(Physical Plan):將AST編譯生成邏輯執行計劃

  • 優化器(Query Optimizer):對邏輯執行計劃進行優化

    • 執行器(Execution):把邏輯執行計劃轉換成可以運行的物理計劃。對于Hive來說默認就是mapreduce任務

HIVE有什么用

關于“HIVE有什么用”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,使各位可以學到更多知識,如果覺得文章不錯,請把它分享出去讓更多的人看到。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

东乡| 嘉禾县| 陇川县| 松原市| 普陀区| 长寿区| 普定县| 峨眉山市| 马尔康县| 湘潭市| 嘉祥县| 育儿| 漳平市| 无极县| 桂林市| 沙湾县| 巢湖市| 长宁县| 台中县| 溧水县| 封丘县| 高州市| 阆中市| 潞西市| 工布江达县| 马公市| 博客| 南郑县| 营山县| 高陵县| 重庆市| 漾濞| 德江县| 古丈县| 通榆县| 金湖县| 景洪市| 滨州市| 昭苏县| 平舆县| 涿州市|