您好,登錄后才能下訂單哦!
本篇內容主要講解“Apache Atlas架構原理是什么”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“Apache Atlas架構原理是什么”吧!
在當今大數據的應用越來越廣泛的情況下,數據治理一直是企業面臨的巨大問題。
大部分公司只是單純的對數據進行了處理,而數據的血緣,分類等等卻很難實現,市場上也急需要一個專注于數據治理的技術框架,這時Atlas應運而生。
Atlas官網地址:https://atlas.apache.org/
Atlas是Hadoop的數據治理和元數據框架。
Atlas是一組可擴展和可擴展的核心基礎治理服務,使企業能夠有效,高效地滿足Hadoop中的合規性要求,并允許與整個企業數據生態系統集成。
Apache Atlas為組織提供了開放的元數據管理和治理功能,以建立其數據資產的目錄,對這些資產進行分類和治理,并為數據科學家,分析師和數據治理團隊提供圍繞這些數據資產的協作功能。
Atlas支持各種Hadoop和非Hadoop元數據類型
提供了豐富的REST API進行集成
對數據血緣的追溯達到了字段級別,這種技術還沒有其實類似框架可以實現
對權限也有很好的控制
Atlas包括以下組件:
采用Hbase存儲元數據
采用Solr實現索引
Ingest/Export 采集導出組件 Type System類型系統 Graph Engine圖形引擎 共同構成Atlas的核心機制
所有功能通過API向用戶提供,也可以通過Kafka消息系統進行集成
Atlas支持各種源獲取元數據:Hive,Sqoop,Storm。。。
還有優秀的UI支持
到此,相信大家對“Apache Atlas架構原理是什么”有了更深的了解,不妨來實際操作一番吧!這里是億速云網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續學習!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。