Spark工作流程是怎樣的呢

發布時間：2021-12-17 13:41:54 來源：億速云閱讀：144 作者：柒染欄目：大數據

本篇文章給大家分享的是有關Spark工作流程是怎樣的呢，小編覺得挺實用的，因此分享給大家學習，希望大家閱讀完這篇文章后可以有所收獲，話不多說，跟著小編一起來看看吧。

一、Spark架構組成圖：

Spark工作流程是怎樣的呢

The following table summarizes terms you’ll see used to refer to cluster concepts:

Term	Meaning
Application	基于Spark的用戶程序(創建了一個SparkContext).由一個*driver* 進程和N個*executor* 進程 on the cluster模式下.
Application jar	Spark包含的jar包
Driver program	一個Driver進程運行 main()方法,創建一個SparkContext
Cluster manager	提交集群(--master local/standalone/on yarn)模式下的資源管理(提交設置code memory....)
Deploy mode	區分Driver進程在什么地方cluster or client,主要區別是Driver在本地還是集群的Container里
Worker node	運行Spark代碼的應用程序的節點(standalone模式概念),在(on yarn)模式下是NodeManager
Executor	一個Executor進程,運行在Container里,能夠運行我們Task,保存數據到內存里或者磁盤上，每一個應用程序有自己獨立的Executor
Task	最小的工作單元,Driver發送代碼到Executor然后Task執行
Job	每一個Action就會產生job(map,conllect)
Stage	每個Job被拆成Task集合,遇到shuffle會stage+1

以上就是Spark工作流程是怎樣的呢，小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注億速云行業資訊頻道。

向AI問一下細節

亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看