Skip to content

Flink学习

Flink 是 Java 生态中非常重要的实时流处理框架。
学习 Flink 不只是掌握 API,更重要的是理解流式计算模型、时间语义、状态管理和实时数仓场景。

专题目录

1. 学习定位

这一组内容用于补充 Java 方向里的实时计算能力。
目标是让你具备理解流处理、实时聚合、状态计算和实时数仓基础方案的能力。

2. 学习重点

  • 理解批处理和流处理的差异
  • 理解事件时间和水位线的价值
  • 理解状态与 checkpoint 如何保障一致性
  • 理解 Flink SQL 在数据开发中的角色
  • 理解 Flink 在实时业务链路里的位置

3. 建议顺序

  1. Flink基础架构
  2. DataStream编程模型
  3. 窗口与水位线
  4. 状态管理与Checkpoint
  5. FlinkSQL与实时数仓

4. 阶段产出

  • 一份流式计算基础笔记
  • 一份窗口与时间语义总结
  • 一份状态管理与容错总结

5. 自测标准

  • 能解释 Flink 为什么适合实时处理
  • 能说明事件时间和水位线解决什么问题
  • 能说明状态和 checkpoint 为什么是 Flink 的核心