亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

MapReduce架構簡介

發布時間:2020-07-24 10:04:29 來源:網絡 閱讀:725 作者:wangkunj 欄目:大數據

前言:

MapReduce是用于數據處理的一種編程模型,簡單但足夠強大,專門為并行處理大數據而設計。
MapReduce的處理過程分為兩個步驟:map和reduce。每個階段的輸入輸出都是key-value的形式,key和value的類型可以自行指定。map階段對切分好的數據進行并行處理,處理結果傳輸給reduce,由reduce函數完成最后的匯總。
到了2.0之后,MapReduce可以理解為是一個jar包或一個程序,這個程序要運行在Yarn上面,上面有兩個進程,ResourceManager和NodeManager,ResourceManager里面兩個模塊是什么,Application Manager: 應用程序管理器 和 Scheduler:調度器,NodeManager相當于執行一個容器,這個容器里面有 CPU+Memory,這個容器運行一個封裝的任務,MapTask(映射任務)或者跑ReduceTask(歸約任務)

下面簡單介紹下MapReduce2架構設計或者稱為MapReduce提交到Yarn的工作流程:
MapReduce架構簡介

  • 1:用戶向YARN中提交應用程序,其中包括ApplicationMaster程序、啟動ApplicationMaster的命令、用戶程序等。
  • 2:ResourceManager為該應用程序分配第一個Container,并與對應的Node-Manager通信,要求它在這個Container中啟動應用
    程序的ApplicationMaster。
  • 3:ApplicationMaster首先向ResourceManager注冊,這樣用戶可以直接通過ResourceManage查看應用程序的運行狀態,然后
    它將為各個任務申請資源,并監控它的運行狀態,直到運行結束,即重復步驟4~7。
  • 4:ApplicationMaster采用輪詢的方式通過RPC協議向ResourceManager申請和領取資源。
  • 5:一旦ApplicationMaster申請到資源后,便與對應的NodeManager通信,要求它啟動任務。
  • 6:NodeManager為任務設置好運行環境(包括環境變量、JAR包、二進制程序等)后,將任務啟動命令寫到一個腳本中,并通
    過運行該腳本啟動任務。
  • 7:各個任務通過某個RPC協議向ApplicationMaster匯報自己的狀態和進度,以讓ApplicationMaster隨時掌握各個任務的運行
    狀態,從而可以在任務失敗時重新啟動任務。在應用程序運行過程中,用戶可隨時通過RPC向ApplicationMaster查詢應用程序
    的當前運行狀態。
  • 8:應用程序運行完成后,ApplicationMaster向ResourceManager注銷并關閉自己。
向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

连州市| 廊坊市| 盘锦市| 万盛区| 天镇县| 云林县| 岑溪市| 庆元县| 乡宁县| 开江县| 潮州市| 北宁市| 江川县| 镇江市| 彩票| 衡南县| 宝鸡市| 大安市| 闵行区| 华坪县| 乌鲁木齐县| 武清区| 苍南县| 桂东县| 柳州市| 北海市| 郯城县| 象州县| 永春县| 肇州县| 南汇区| 皋兰县| 中西区| 雷波县| 余江县| 太仆寺旗| 林甸县| 滁州市| 维西| 会同县| 山西省|