亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

混合數據湖的好處是什么

發布時間:2022-01-15 17:35:06 來源:億速云 閱讀:158 作者:柒染 欄目:大數據

這篇文章主要為大家分析了混合數據湖的好處是什么的相關知識點,內容詳細易懂,操作細節合理,具有一定參考價值。如果感興趣的話,不妨跟著跟隨小編一起來看看,下面跟著小編一起深入學習“混合數據湖的好處是什么”的知識吧。

在存儲大數據時,數據湖和數據倉庫都是既定術語,但是這兩個術語不是同義詞。數據湖是尚未確定用途的大量原始數據。另一方面,數據倉庫是用于特定目的的結構化過濾數據的存儲庫。

共同點

數據倉庫和數據湖代表了一個中央數據庫系統,可以在公司中用于分析目的。該系統從各種異構數據源中提取,收集和保存相關數據,并提供給下游系統。

數據倉庫可以分為四個子過程:

  • 數據獲取:從各種數據存儲庫中獲取和提取數據。

  • 數據存儲:包括長期歸檔在內的數據倉庫中的數據存儲。

  • 數據提供:向下游系統提供所需的數據,提供數據集市。

  • 數據評估:對數據庫存的分析和評估。

差異性

數據倉庫將經典的ETL流程與關系數據庫中的結構化數據結合使用,而數據湖則使用諸如ELT的范式和讀取模式以及經常使用的非結構化數據[2]。

混合數據湖的好處是什么

> Differences Data Warehouse vs. Lake

在上方,您可以看到主要區別。您使用的技術也完全不同。對于數據倉庫,您將使用SQL和關系數據庫,而對于數據湖,您可能將使用NoSQL或兩者的混合。

將兩者結合在混合數據湖中

那么如何將這兩個概念結合起來?在下圖中,您可以從高角度查看架構。

該過程是將非結構化和未轉換的數據加載到數據湖中。從這里,一方面可以將數據用于ML和Data  Science任務。另一方面,數據也可以轉換為結構化形式并加載到數據倉庫中。從這里,可以實現通過數據集市和(自助服務)BI工具進行的經典數據倉庫分發。

混合數據湖的好處是什么

> Hybrid Data Lake Concept — Image from Author

可以用于此體系結構的主要技術例如:

  • 通過talend,Google Dataflow,AWS Data Pipeline進行ELT / ETL流程

  • 通過Data Lake-HDFS,AWS Athena和S3,Google Cloud Storage

  • 數據倉庫通過-Google BigQuery,AWS Redshift,Snowflake

注意:諸如Google的BiqQuery或AWS  Redshift之類的技術通常被視為數據倉庫技術與數據湖技術之間的混合體,因為它們通常已經具有NoSQL的某些特征。

關于“混合數據湖的好處是什么”就介紹到這了,更多相關內容可以搜索億速云以前的文章,希望能夠幫助大家答疑解惑,請多多支持億速云網站!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

闸北区| 乌什县| 张北县| 五华县| 桦川县| 梧州市| 宁武县| 呼伦贝尔市| 富平县| 霍山县| 洛阳市| 漳浦县| 克拉玛依市| 邵阳市| 金平| 南汇区| 德格县| 娄烦县| 基隆市| 雷波县| 苗栗市| 平阳县| 酒泉市| 密山市| 宝山区| 龙口市| 长宁区| 分宜县| 桓台县| 宣恩县| 墨玉县| 江源县| 郯城县| 五寨县| 敦煌市| 舞阳县| 休宁县| 外汇| 利川市| 靖宇县| 武陟县|