您好,登錄后才能下訂單哦!
這篇文章主要講解了“Flink的SessionWindow怎么用”,文中的講解內容簡單清晰,易于學習與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學習“Flink的SessionWindow怎么用”吧!
sessionWindows會話窗口:按不活躍時間切成不同分區窗口,并進行窗口計算
示例環境
java.version: 1.8.xflink.version: 1.11.1
示例數據源 (項目碼云下載)
Flink 系例 之 搭建開發環境與數據
SessionWindow.java
import com.flink.examples.DataSource; import org.apache.flink.api.common.functions.ReduceFunction; import org.apache.flink.api.java.functions.KeySelector; import org.apache.flink.api.java.tuple.Tuple3; import org.apache.flink.streaming.api.TimeCharacteristic; import org.apache.flink.streaming.api.datastream.DataStream; import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment; import org.apache.flink.streaming.api.functions.source.RichParallelSourceFunction; import org.apache.flink.streaming.api.windowing.assigners.EventTimeSessionWindows; import org.apache.flink.streaming.api.windowing.time.Time; import java.util.List; /** * @Description sessionWindows會話窗口:按不活躍時間切成不同分區窗口,并進行窗口計算 */ public class SessionWindow { /** * 遍歷集合,返回會話滑動窗口下按不活躍時間切分后的,每個窗口下性別分區里最大年齡數據記錄 * @param args * @throws Exception */ public static void main(String[] args) throws Exception { final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment(); //設置流處理時間事件,對于會話窗口必需設置此時間類型,有三種類型: //1.ProcessingTime:以operator處理的時間為準,它使用的是機器的系統時間來作為data stream的時間 //2.IngestionTime:以數據進入flink streaming data flow的時間為準 //3.EventTime:以數據自帶的時間戳字段為準,應用程序需要指定如何從record中抽取時間戳字段 env.setStreamTimeCharacteristic(TimeCharacteristic.IngestionTime); env.setParallelism(4); DataStream<Tuple3<String, String, Integer>> inStream = env.addSource(new MyRichSourceFunction()); DataStream<Tuple3<String, String, Integer>> dataStream = inStream.keyBy((KeySelector<Tuple3<String, String, Integer>, String>) k ->k.f1) //按會話窗口滾動,當2秒之內沒有指定分區數據流,則計算一次 //會話窗口是根據在指定時間之后沒有活躍的數據接入,則認為窗口結束,進行窗口計算 .window(EventTimeSessionWindows.withGap(Time.seconds(2))) .reduce(new ReduceFunction<Tuple3<String, String, Integer>>() { @Override public Tuple3<String, String, Integer> reduce(Tuple3<String, String, Integer> t1, Tuple3<String, String, Integer> t2) throws Exception { //返回年齡最大的 return t1.f2 > t2.f2 ? t1: t2; } }); dataStream.print(); env.execute("flink EventTimeSessionWindows job"); } /** * 模擬數據持續輸出 */ public static class MyRichSourceFunction extends RichParallelSourceFunction<Tuple3<String, String, Integer>> { @Override public void run(SourceContext<Tuple3<String, String, Integer>> ctx) throws Exception { List<Tuple3<String, String, Integer>> tuple3List = DataSource.getTuple3ToList(); for (Tuple3 tuple3 : tuple3List){ ctx.collect(tuple3); //1秒鐘輸出一個 Thread.sleep(2 * 1000); } } @Override public void cancel() { try{ super.close(); }catch (Exception e){ e.printStackTrace(); } } } }
打印結果
2> (張三,man,20) 4> (李四,girl,24) 2> (王五,man,29) 4> (劉六,girl,32) 2> (吳八,man,30)
感謝各位的閱讀,以上就是“Flink的SessionWindow怎么用”的內容了,經過本文的學習后,相信大家對Flink的SessionWindow怎么用這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關知識點的文章,歡迎關注!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。