Flink学习
Flink 是 Java 生态中非常重要的实时流处理框架。
学习 Flink 不只是掌握 API,更重要的是理解流式计算模型、时间语义、状态管理和实时数仓场景。
专题目录
1. 学习定位
这一组内容用于补充 Java 方向里的实时计算能力。
目标是让你具备理解流处理、实时聚合、状态计算和实时数仓基础方案的能力。
2. 学习重点
- 理解批处理和流处理的差异
- 理解事件时间和水位线的价值
- 理解状态与 checkpoint 如何保障一致性
- 理解 Flink SQL 在数据开发中的角色
- 理解 Flink 在实时业务链路里的位置
3. 建议顺序
- Flink基础架构
- DataStream编程模型
- 窗口与水位线
- 状态管理与Checkpoint
- FlinkSQL与实时数仓
4. 阶段产出
- 一份流式计算基础笔记
- 一份窗口与时间语义总结
- 一份状态管理与容错总结
5. 自测标准
- 能解释 Flink 为什么适合实时处理
- 能说明事件时间和水位线解决什么问题
- 能说明状态和 checkpoint 为什么是 Flink 的核心