文章目录
1 Flink的核心API
Flink提供了两个核心的API来处理流数据和批数据:DataStream API和Table API。它们各有侧重,开发者可以根据需求选择,甚至在同一个程序中混合使用。
1.1 DataStream API精细控制的命令式编程
DataStream API是Flink的核心,它是一个低级别、命令式的API。
1、编程范式:你需要明确地定义每一步的数据处理逻辑,例如使用map、filter、keyBy、window等算子来构建数据处理流水线。
2、适用场景:
(1)需要对时间、状态、窗口等流处理原语进行精细控制的复杂逻辑。
(2)需要实现自定义的低层级操作,如处理定时器、访问底层状态等。
(3)对性能有极致要求,需要手动优化数据流处理过程。
3、优点:灵活性极高,几乎可以实现任何复杂的流处理逻辑。
1.2 Table API结构化数据处理的声明式编程
Table API提供了更高层次的抽象,它是一个声明式的、关系型API。
1、编程范式:你只需关注“想要什么”(即业务逻辑),而不是“如何实现”(即执行细节)。它使用类似SQL的语法来操作数据,例如 select、groupBy、join等。
2、适用场景:
(1)处理结构化数
转载自CSDN-专业IT技术社区
原文链接:https://blog.csdn.net/qq_20466211/article/details/158265382



