亚洲激情专区-91九色丨porny丨老师-久久久久久久女国产乱让韩-国产精品午夜小视频观看

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

使用Reactor怎么實現一個Flink操作功能

發布時間:2021-03-01 16:45:17 來源:億速云 閱讀:256 作者:Leah 欄目:開發技術

這篇文章給大家介紹使用Reactor怎么實現一個Flink操作功能,內容非常詳細,感興趣的小伙伴們可以參考借鑒,希望對大家能有所幫助。

實現過程

Flink對流式處理做的很好的封裝,使用Flink的時候幾乎不用關心線程池、積壓、數據丟失等問題,但是使用Reactor實現類似的功能就必須對Reactor運行原理比較了解,并且經過不同場景下測試,否則很容易出問題。

下面列舉出實現過程中的核心點:

1、創建Flux和發送數據分離

入門Reactor的時候給的示例都是創建Flux的時候同時就把數據賦值了,比如:Flux.just、Flux.range等,從3.4.0版本后先創建Flux,再發送數據可使用Sinks完成。有兩個比較容易混淆的方法:

  • Sinks.many().multicast() 如果沒有訂閱者,那么接收的消息直接丟棄

  • Sinks.many().unicast() 如果沒有訂閱者,那么保存接收的消息直到第一個訂閱者訂閱

  • Sinks.many().replay() 不管有多少訂閱者,都保存所有消息

在此示例場景中,選擇的是Sinks.many().unicast()

官方文檔:https://projectreactor.io/docs/core/release/reference/#processors

2、背壓支持

上面方法的對象背壓策略支持兩種:BackpressureBuffer、BackpressureError,在此場景肯定是選擇BackpressureBuffer,需要指定緩存隊列,初始化方法如下:Queues.get(queueSize).get()

數據提交有兩個方法:

  • emitNext 指定提交失敗策略同步提交

  • tryEmitNext 異步提交,返回提交成功、失敗狀態

在此場景我們不希望丟數據,可自定義失敗策略,提交失敗無限重試,當然也可以調用異步方法自己重試。

 Sinks.EmitFailureHandler ALWAYS_RETRY_HANDLER = (signalType, emitResult) -> emitResult.isFailure();

在此之后就就可以調用Sinks.asFlux開心的使用各種操作符了。

在此之后就就可以調用Sinks.asFlux開心的使用各種操作符了。

3、窗口函數

Reactor支持兩類窗口聚合函數:

  • window類:返回Mono(Flux)

  • buffer類:返回List

在此場景中,使用buffer即可滿足需求,bufferTimeout(int maxSize, Duration maxTime)支持最大個數,最大等待時間操作,Flink中的keys操作可以用groupBy、collectMap來實現。

4、消費者處理

Reactor經過buffer后是一個一個的發送數據,如果使用publishOn或subscribeOn處理的話,只等待下游的subscribe處理完成才會重新request新的數據,buffer操作符才會重新發送數據。如果此時subscribe消費者耗時較長,數據流會在buffer流程阻塞,顯然并不是我們想要的。

理想的操作是消費者在一個線程池里操作,可多線程并行處理,如果線程池滿,再阻塞buffer操作符。解決方案是自定義一個線程池,并且當然線程池如果任務滿submit支持阻塞,可以用自定義RejectedExecutionHandler來實現:

 RejectedExecutionHandler executionHandler = (r, executor) -> {
   try {
     executor.getQueue().put(r);
   } catch (InterruptedException e) {
     Thread.currentThread().interrupt();
     throw new RejectedExecutionException("Producer thread interrupted", e);
   }
 };
 
 new ThreadPoolExecutor(poolSize, poolSize,
     0L, TimeUnit.MILLISECONDS,
     new SynchronousQueue<>(),
     executionHandler);

三、總結

1、總結一下整體的執行流程

提交任務:提交數據支持同步異步兩種方式,支持多線程提交,正常情況下響應很快,同步的方法如果隊列滿則阻塞。
豐富的操作符處理流式數據。
buffer操作符產生的數據多線程處理:同步提交到單獨的消費者線程池,線程池任務滿則阻塞。
消費者線程池:支持阻塞提交,保證不丟消息,同時隊列長度設置成0,因為前面已經有隊列了。
背壓:消費者線程池阻塞后,會背壓到buffer操作符,并背壓到緩沖隊列,緩存隊列滿背壓到數據提交者。

2、和Flink的對比

實現的Flink的功能:

  • 不輸Flink的豐富操作符

  • 支持背壓,不丟數據

優勢:

  • 輕量級,可直接在業務代碼中使用

劣勢:

  • 內部執行流程復雜,容易踩坑,不如Flink傻瓜化

  • 沒有watermark功能,也就意味著只支持無序數據處理

  • 沒有savepoint功能,雖然我們用背壓解決了部分問題,但是宕機后開始會丟失緩存隊列和消費者線程池里的數據,補救措施是添加Java Hook功能

  • 只支持單機,意味著你的緩存隊列不能設置無限大,要考慮線程池的大小,且沒有flink globalWindow等功能

  • 需考慮對上游數據源的影響,Flink的上游一般是mq,數據量大時可自動堆積,如果本文的方案上游是http、rpc調用,產生的阻塞影響就不能忽略。補償方案是每次提交數據都使用異步方法,如果失敗則提交到mq中緩沖并消費該mq無限重試。

關于使用Reactor怎么實現一個Flink操作功能就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

永泰县| 隆回县| 肥东县| 景德镇市| 郑州市| 安平县| 天台县| 汨罗市| 驻马店市| 方城县| 开远市| 威宁| 阿坝县| 巴东县| 蛟河市| 墨竹工卡县| 城步| 开鲁县| 开江县| 曲周县| 阿坝| 丹阳市| 黄陵县| 嘉荫县| 灵宝市| 眉山市| 宕昌县| 维西| 榕江县| 张家川| 广平县| 柘城县| 朝阳区| 凌海市| 松原市| 阿拉善盟| 江门市| 衡南县| 大名县| 南平市| 鄂托克旗|