亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

JVM GC導致的shuffle文件拉取失敗怎么辦

發布時間:2021-12-16 15:01:35 來源:億速云 閱讀:112 作者:iii 欄目:云計算

本篇內容主要講解“JVM GC導致的shuffle文件拉取失敗怎么辦”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“JVM GC導致的shuffle文件拉取失敗怎么辦”吧!

        有時會出現的一種情況,非常普遍,在spark的作業中;shuffle file not found。(spark作業中,非常非常常見的)而且,有的時候,它是偶爾才會出現的一種情況。有的時候,出現這種情況以后,會重新去提交stage、task。重新執行一遍,發現就好了。沒有這種錯誤了。

log怎么看?

  • 用client模式去提交你的spark作業。比如standalone client;yarn client。一提交作業,直接可以在本地看到刷刷刷更新的log。

  • spark.shuffle.io.maxRetries 3
    //意思就是說,shuffle文件拉取的時候,如果沒有拉取到(拉取失敗),最多或重試幾次(會重新拉取幾次文件),默認是3次。
    
    spark.shuffle.io.retryWait 5s
    //意思就是說,每一次重試拉取文件的時間間隔,默認是5s鐘。


  • 默認情況下,假如說第一個stage的executor正在進行漫長的full gc。第二個stage的executor嘗試去拉取文件,結果沒有拉取到,默認情況下,會反復重試拉取3次,每次間隔是五秒鐘。最多只會等待3 * 5s = 15s。如果15s內,沒有拉取到shuffle file。就會報出shuffle file not found。

  • 針對這種情況,我們完全可以進行預備性的參數調節。增大上述兩個參數的值,達到比較大的一個值,盡量保證第二個stage的task,一定能夠拉取到上一個stage的輸出文件。避免報shuffle file not found。然后可能會重新提交stage和task去執行。那樣反而對性能也不好。

    spark.shuffle.io.maxRetries 60
    spark.shuffle.io.retryWait 60s
  • 最多可以忍受1個小時沒有拉取到shuffle file。只是去設置一個最大的可能的值。full gc不可能1個小時都沒結束吧(低概率,沒有絕對)。這樣呢,就可以盡量避免因為gc導致的shuffle file not found,無法拉取到的問題。

    到此,相信大家對“JVM GC導致的shuffle文件拉取失敗怎么辦”有了更深的了解,不妨來實際操作一番吧!這里是億速云網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續學習!

    向AI問一下細節

    免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

    AI

    临邑县| 大新县| 辰溪县| 天祝| 贵溪市| 深泽县| 南郑县| 浠水县| 永济市| 秭归县| 沙河市| 南阳市| 敦化市| 万源市| 洪泽县| 南召县| 乐业县| 咸阳市| 剑川县| 玉门市| 凤冈县| 凤庆县| 榆中县| 新闻| 绥德县| 永顺县| 桂阳县| 福清市| 建宁县| 民丰县| 靖州| 怀柔区| 洪雅县| 婺源县| 华阴市| 赤水市| 呼和浩特市| 区。| 保靖县| 成安县| 潮州市|