亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

(版本定制)第11課:Spark Streaming源碼解讀

發布時間:2020-06-05 21:41:05 來源:網絡 閱讀:290 作者:Spark_2016 欄目:大數據

本期內容:

    1、ReceiverTracker的架構設計

    2、消息循環系統

    3、ReceiverTracker具體實現


上節課講到了Receiver是如何不斷的接收數據的,并且接收到的數據的元數據會匯報給ReceiverTracker,下面我們看看ReceiverTracker具體的功能及實現。

ReceiverTracker主要的功能:

  1. 在Executor上啟動Receivers。

  2. 停止Receivers 。

  3. 更新Receiver接收數據的速度(也就是限流)

  4. 不斷的等待Receivers的運行狀態,只要Receivers停止運行,就重新啟動Receiver,也就是Receiver的容錯功能。

  5. 接受Receiver的注冊。

  6. 借助ReceivedBlockTracker來管理Receiver接收數據的元數據。

  7. 匯報Receiver發送過來的錯誤信息


ReceiverTracker 管理了一個消息通訊體ReceiverTrackerEndpoint,用來與Receiver或者ReceiverTracker 進行消息通信。

在ReceiverTracker的start方法中,實例化了ReceiverTrackerEndpoint,并且在Executor上啟動Receivers。

啟動Receivr,其實是ReceiverTracker給ReceiverTrackerEndpoint發送了一個本地消息,ReceiverTrackerEndpoint將Receiver封裝成RDD以job的方式提交給集群運行。

Receiver啟動后,會向ReceiverTracker注冊,注冊成功才算正式啟動了。

當Receiver端接收到數據,達到一定的條件需要將數據寫入BlockManager,并且將數據的元數據匯報給ReceiverTracker。

/** Store block and report it to driver */
def pushAndReportBlock(
    receivedBlock: ReceivedBlock,
metadataOption: Option[Any],
blockIdOption: Option[StreamBlockId]
  ) {
val blockId = blockIdOption.getOrElse(nextBlockId)
val time = System.currentTimeMillis
val blockStoreResult = receivedBlockHandler.storeBlock(blockId, receivedBlock)
  logDebug(s"Pushed block $blockId in ${(System.currentTimeMillis - time)} ms")
val numRecords = blockStoreResult.numRecords
val blockInfo = ReceivedBlockInfo(streamId, numRecords, metadataOption, blockStoreResult)
trackerEndpoint.askWithRetry[Boolean](AddBlock(blockInfo))
  logDebug(s"Reported block $blockId")
}

當ReceiverTracker收到元數據后,會在線程池中啟動一個線程來寫數據

case AddBlock(receivedBlockInfo) =>
if (WriteAheadLogUtils.isBatchingEnabled(ssc.conf, isDriver = true)) {
walBatchingThreadPool.execute(new Runnable {
override def run(): Unit = Utils.tryLogNonFatalError {
if (active) {
          context.reply(addBlock(receivedBlockInfo)) 
        } else {
throw new IllegalStateException("ReceiverTracker RpcEndpoint shut down.")
        }
      }
    })
  } else {
    context.reply(addBlock(receivedBlockInfo))
  }

數據的元數據是交由ReceivedBlockTracker管理的

數據最終被寫入到streamIdToUnallocatedBlockQueues中,一個流對應一個數據塊信息的隊列。

每當Streaming 觸發job時,會將隊列中的數據分配成一個batch,并將數據寫入timeToAllocatedBlocks數據結構。

下面是簡單的流程圖:

(版本定制)第11課:Spark Streaming源碼解讀

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

郧西县| 山丹县| 嘉黎县| 格尔木市| 湖南省| 郓城县| 武安市| 长武县| 邳州市| 陈巴尔虎旗| 顺义区| 三门县| 高州市| 阳山县| 堆龙德庆县| 黑龙江省| 内江市| 敦煌市| 会宁县| 阳城县| 绩溪县| 南康市| 临高县| 大理市| 小金县| 华容县| 沈阳市| 观塘区| 横山县| 公安县| 视频| 龙山县| 梨树县| 玉屏| 凭祥市| 上栗县| 军事| 肇源县| 吉木乃县| 建瓯市| 安多县|