亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Spark shuffle和hadoop shuffle的區別是什么

發布時間:2021-12-16 14:26:15 來源:億速云 閱讀:290 作者:iii 欄目:云計算

本篇內容主要講解“Spark shuffle和hadoop shuffle的區別是什么”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“Spark shuffle和hadoop shuffle的區別是什么”吧!

Q1:AppClient和worker、master之間的關系是什么?

  • :AppClient是在StandAlone模式下SparkContext.runJob的時候在Client機器上應       用程序的代表,要完成程序的registerApplication等功能;

  • 當程序完成注冊后Master會通過Akka發送消息給客戶端來啟動Driver;

  • 在Driver中管理Task和控制Worker上的Executor來協同工作;

Q2:Spark的shuffle 和hadoop的shuffle的區別大么?

  • Spark的Shuffle是一種比較嚴格意義上的shuffle,在Spark中Shuffle是有RDD操作的依賴關系中的Lineage上父RDD中的每個partition元素的內容交給多個子RDD;

  • 在Hadoop中的Shuffle是一個相對模糊的概念,Mapper階段介紹后把數據交給Reducer就會產生Shuffle,Reducer三階段的第一個階段即是Shuffle;

Q3:Spark 的HA怎么處理的?

  • 對于Master的HA,在Standalone模式下,Worker節點自動是HA的,對于Master的HA,一般采用Zookeeper;

  • Utilizing ZooKeeper to provide leader election and some state storage, you can launch multiple Masters in your cluster connected to the same ZooKeeper instance. One will be elected “leader” and the others will remain in standby mode. If the current leader dies, another Master will be elected, recover the old Master’s state, and then resume scheduling. The entire recovery process (from the time the the first leader goes down) should take between 1 and 2 minutes. Note that this delay only affects scheduling new applications – applications that were already running during Master failover are unaffected;

  • 對于Yarn和Mesos模式,ResourceManager一般也會采用ZooKeeper進行HA;

到此,相信大家對“Spark shuffle和hadoop shuffle的區別是什么”有了更深的了解,不妨來實際操作一番吧!這里是億速云網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續學習!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

定南县| 怀集县| 荔波县| 河源市| 阜新| 大同县| 蒙山县| 南木林县| 安国市| 伊通| 杂多县| 阳山县| 蕉岭县| 丹东市| 独山县| 抚州市| 芮城县| 牟定县| 望江县| 剑河县| 如东县| 龙里县| 大理市| 哈尔滨市| 蓬安县| 和林格尔县| 英吉沙县| 建德市| 平潭县| 封丘县| 凤冈县| 吴旗县| 平昌县| 平顶山市| 内江市| 富源县| 大关县| 鄄城县| 寿宁县| 柏乡县| 荥经县|