亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

如何進行spark on yarn集群調優

發布時間：2021-12-17 10:39:04 來源：億速云閱讀：163 作者：柒染欄目：大數據

今天就跟大家聊聊有關如何進行spark on yarn集群調優，可能很多人都不太了解，為了讓大家更加了解，小編給大家總結了以下內容，希望大家根據這篇文章可以有所收獲。

jar包管理：在spark-default.conf文件中指定Spark.YARN.jars在hdfs上的SPARK需要的jar包。否則每次提交application，spark會將driver端的SPARK_HOE下的jar.node, spark.locality.wait.pack包分發到各節點上。浪費磁盤資源和網絡資源。
yarn隊列資源不足導致的應用運行失敗，這類問題主要針對提交作業的調優：
1.在J2EE中間層，通過線程池技術提交作業，并設置線程池大小為1。
2.若只有一個應用，可以將資源調整到最大
3.若有些spark應用明顯的耗時，可以spark擁有的資源進行分類（耗時任務和快速任務），此時可以使用兩個線程池提交作業，每個線程池大小為1。
數據本地化：分布式存儲是大數據技術的核心，而為了提高大數據計算的效率，使計算靠近數據，減少移動大量數據而產生的網絡io和磁盤io。

spark中的本地級別有：PROCESS_LOCAL(進程本地化，效率最高), NODE_LOCAL（節點本地化）, PACK_LOCAL（機架本地化）, ANY, NO_PREF。在實際運行中我們希望的是大多數計算是進程本地化或節點本地化。
調優方式：1. 優化算法 2. 數據設置合理的副本數 3. 將常用的rdd設置緩存 4. 設置spark相關參數spark.locality.wait，spark.locality.wait.process, spark.locality.wait.node, spark.locality.wait.pack。在client模式下運行，觀察運行日志，使得大多數計算是PROCESS_LOCAL，同時application運行時間減少了，才是有效的優化。為了提升數據計算本地化級別而犧牲application運行時間，是不可取得，這樣也會造成大量資源的閑置和較長的等待時間。

Executor經常被kill掉，出現Container killed by YARN for exceeding memory limits，內存被用完導致此類問題的發生：

移除rdd緩存
spark.storage.memoryFraction：spark數據緩存的的內存占比，默認0.6，即可以使用executor的60%內存持久化數據。在緩存達到臨界值，數據可能不能緩存或寫入到磁盤。當executor經常被kill的時候，應該降低該值。
spark.yarn.Executor.memoryoverhead：該參數是在yarn模式下堆外內存的調節，默認情況下為是每一個executor的內存大小的10%

YARN-Cluster模式下JVM棧內存溢出：

JVM永久代PermGen設置 Spark.Driver.extraJavaOptions="-XX:PermSize=128M -XX:MaxPermSize=256M"(PermGen out of Memory error log)
在spark-sql中將復雜的sql語句簡化為多個簡單的sql進行處理(JVM stack overflow)

看完上述內容，你們對如何進行spark on yarn集群調優有進一步的了解嗎？如果還想了解更多知識或者相關內容，請關注億速云行業資訊頻道，感謝大家的支持。

向AI問一下細節

推薦閱讀：

免責聲明：本站發布的內容（圖片、視頻和文字）以原創、轉載和分享為主，文章觀點不代表本網站立場，如果涉及侵權請聯系站長郵箱：is@yisu.com進行舉報，并提供相關證據，一經查實，將立刻刪除涉嫌侵權內容。

上一篇新聞：
怎么用Ansible部署Kubernetes集群到OpenStack
下一篇新聞：
python匿名函數怎么創建

猜你喜歡

AI
助
手

產品服務

地區劃分

專題活動

幫助支持

關于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關注億速云

億速云公眾號

手機網站二維碼

岢岚县| 五台县| 珲春市| 肇州县| 铜梁县| 望谟县| 道孚县| 太和县| 保靖县| 定远县| 阜康市| 北宁市| 大埔县| 军事| 宁乡县| 张家口市| 夏邑县| 普安县| 金昌市| 芦溪县| 云梦县| 壤塘县| 石首市| 仁寿县| 昭通市| 昌宁县| 汤阴县| 丽江市| 修武县| 东明县| 湖口县| 侯马市| 白玉县| 尚志市| 曲水县| 榆林市| 城口县| 故城县| 罗田县| 同心县| 南宁市|