亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Spark工作流程是怎樣的呢

發布時間:2021-12-17 13:41:54 來源:億速云 閱讀:144 作者:柒染 欄目:大數據

本篇文章給大家分享的是有關Spark工作流程是怎樣的呢,小編覺得挺實用的,因此分享給大家學習,希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。

一、Spark架構組成圖:

Spark工作流程是怎樣的呢

Glossary

The following table summarizes terms you’ll see used to refer to cluster concepts:

TermMeaning
Application基于Spark的用戶程序(創建了一個SparkContext).由一個driver 進程和N個executor 進程 on the cluster模式下.
Application jarSpark包含的jar包
Driver program一個Driver進程運行 main()方法,創建一個SparkContext
Cluster manager

提交集群(--master local/standalone/on yarn)模式下的資源管理(提交設置code memory....)

Deploy mode區分Driver進程在什么地方cluster or client,主要區別是Driver在本地還是集群的Container里
Worker node運行Spark代碼的應用程序的節點(standalone模式概念),在(on yarn)模式下是NodeManager
Executor一個Executor進程,運行在Container里,能夠運行我們Task,保存數據到內存里或者磁盤上,每一個應用程序有自己獨立的Executor
Task最小的工作單元,Driver發送代碼到Executor然后Task執行
Job

每一個Action就會產生job(map,conllect)

Stage每個Job被拆成Task集合,遇到shuffle會stage+1

以上就是Spark工作流程是怎樣的呢,小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

嘉义县| 马公市| 平原县| 沙田区| 临汾市| 中阳县| 噶尔县| 景德镇市| 定州市| 阿坝县| 霍林郭勒市| 临城县| 阳东县| 岳普湖县| 南阳市| 南和县| 康保县| 崇文区| 磐石市| 虹口区| 衢州市| 房产| 日喀则市| 屏东县| 裕民县| 江津市| 镇平县| 海城市| 喀什市| 淄博市| 密山市| 纳雍县| 芦溪县| 沙河市| 浏阳市| 榆林市| 安丘市| 霍林郭勒市| 云林县| 灵璧县| 濮阳市|