您好,登錄后才能下訂單哦!
這篇文章給大家分享的是有關hadoop大數據平臺架構之DKhadoop的示例分析的內容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。
目前國內的商業發行版hadoop除了大快DKhadoop以外還有像華為云等。雖然發行方不同,但在平臺架構上相似,這里就以我比較熟悉的dkhadoop來介紹。
1、大快Dkhadoop,可以說是集成了整個HADOOP生態系統的全部組件,并對其進行了深度優化,重新編譯為一個完整的更高性能的大數據通用計算平臺,實現了各部件的有機協調。因此DKH相比開源的大數據平臺,在計算性能上有了非常高的提升。這一點也是個人覺得dkhadoop比我之前使用的另外一個商業發行版的要好的,國內的大部分商業發行版hadoop可以說都是二次包裝,dkhadoop做的好的就是敢在原生態的基礎上進行開發。
2、大快DKhadoop中間件技術把大數據集群配置簡化成三種節點,這樣不僅簡化了集群的管理運維,還增強了集群的可用性和穩定性。Dkhadoop中間件集成了apache的很多組件包含了從文件、SQL、日志、消息到爬蟲和流數據以及異構數據的支持;集成了大快的壓縮算法,和數據同步分發技術,實現了數據的導入和減少調動的同時實現,對于有實時數據要求的項目具有不可替代的技術優勢。
3、大快DKhadoop商業發行版還是保持了開源系統的優點的,可以與開源系統100%兼容。對于那些基于開源平臺開發的大數據應用并不需要經過改動同樣可以在dkhadoop上高效運行。
4、DKhadoop一體化開發框架提供了大數據、搜索、自然語言處理和人工智能開發中常用的二十多個類,總計一百余種方法,實現了開發效率的大幅提升。DK.HADOOP整合集成了NOSQL數據庫,簡化了文件系統與非關系數據庫之間的編程;DK.HADOOP改進了集群同步系統,使得HADOOP的數據處理更加高效。
5、DKhadoop的SQL版本,還提供了分布式MySQL的集成,傳統的信息系統,可無縫的實現面向大數據和分布式的跨越。
6、ES:快遞DKhadoop的搜索系統是在開源ES系統上二次開發的,支持完成的全文搜索。整合了對中文搜索的有效支持以及對大快數據同步技術的支持后的高性能版本,DK.ES是DKH的核心組件之一,僅隨DKH集成整合了對中文搜索的有效支持以及對大快數據同步技術的支持后的高性能版本,DK.ES是DKhadoop的核心組件之一。
7、漢語言處理組件:大快的漢語言處理是目前國內使用率最高的開源自然語言處理開發包。
感謝各位的閱讀!關于“hadoop大數據平臺架構之DKhadoop的示例分析”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,讓大家可以學到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。