- 深入理解Flink:實時大數據處理實踐
- 余海峰
- 369字
- 2019-06-19 15:44:27
1.6 思考題
(1)如果有兩個輸入通道的算子從輸入通道
收到了檢查點屏障b,同時,從通道
收到了屬于另一個時刻的檢查點屏障
,那么這種不同步會不會產生一致性錯誤呢?
(2)本章分析了根據事件時間開滾動窗口的情況,怎么分析其他窗口機制呢?例如,根據處理時間開滾動窗口、根據事件時間開會話窗口。
(3)故障恢復后,窗口的運行會出現什么情況?在根據事件時間開滾動窗口的例子中,在處理時間 12:07 時刻系統出現故障,并在兩分鐘后恢復,分析此后的聚合過程。
(4)在嵌入完美水印時,事件不會遲到,窗口能夠及時銷毀;在嵌入啟發式水印早到時,為了確保精準計算,引擎必須延長對應事件時間窗口的生存期,即遲到生存期。既然我們很難生成完美水印,為什么所有窗口都加大遲到生存期,這樣在流式數據架構理論中就不需要水印這個概念了嗎?
(5)實時機器學習會給流式數據架構的設計帶來什么困難?
推薦閱讀
- PyTorch深度學習實戰:從新手小白到數據科學家
- Word 2010中文版完全自學手冊
- Visual Studio 2015 Cookbook(Second Edition)
- Learning Spring Boot
- 數據庫系統原理及應用教程(第4版)
- 3D計算機視覺:原理、算法及應用
- 數據驅動:從方法到實踐
- Python數據分析:基于Plotly的動態可視化繪圖
- 數據庫原理與設計(第2版)
- 數據庫設計與應用(SQL Server 2014)(第二版)
- SQL應用及誤區分析
- Instant Autodesk AutoCAD 2014 Customization with .NET
- 數據庫原理與應用
- HikariCP連接池實戰
- 區塊鏈+:落地場景與應用實戰