Flink 1.11.0 发布,有哪些值得关注的新特性?

云栖号资讯:【点击查看更多行业资讯】
在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来!

Flink 1.11.0 发布,有哪些值得关注的新特性?

阿里妹导读:7 月 7 日,Flink 1.11.0 正式发布。历时近 4 个月,Flink 在生态、易用性、生产可用性、稳定性等方面都进行了增强和改善。Apache Flink PMCt k U } / s、阿里巴巴高级技术专家王治江,同时也是这个版本的 release man? S ~ c N - G dager 之一,将和大家一一分享,并深度剖析 Flink 1.11.0 带来了哪些让大家期待已久的特性,对一些有代表性的 feat` i | . y Xure 从不同维度解读。

在进入深度解读前,我们先| 4 P n : 7 9 y o简单_ ] r了解下社区发布的一F $ 8 v . o @般流程,帮助大家更好的理解和参与 Flink 社区的工作。

首先在每个版本的规划初期,会从志愿者中选出 1-2 名作为 release manager。1.M l a11.0 版i N D Z z ) %7 v + ]我作为中国这边的 release= O = W b f * _ manager,同时还有f G 2 # u V ]一名来自 Ververica 的 Piotr Nowojski 作为德国方的 release manager,这在某种程度上也说明中国的开发者和贡献度在整个社区的占比很重要。

接下来会进行这个版本的 feature kickoF % p E R m 1 hff。在一y : F o些大的方向上,社区的d } J规划周期可能比较久,会分阶段、分步骤跨越多个版本完成,确保质量。每个版本的侧重点也会有所不同,比如前两个版本侧重于批处理的加强,而这个版本更侧重于流处理易c | f _ l D X用性的提升。社区规划的 feature 列表会在l i # F w N .邮件列表中发起讨论,以收集更多的用户/开发者意见和反馈。

一般的开发周期为 2-3 个月时间,提前会明确规划出大概的 feature freeze 时间,之后进行 release candidate 的f d 8 I c #发布和测试、以及 bug fix。一般经过几轮的迭代周期后会正式投票通过一个相对稳定的 candidate 版本,然后基于这个版本正式发布。

Flink 1.11.0 从 3 月初的功能规划到 7 月初的正式发布,历经了差不多 4 个月的时间,对 Flink 的生态、易用性、生产` j G R s g / A c可用性、稳定性等方面都进行了增强和改善,下面将一一跟大家分享。

一 综述

Flink 1.11.0 从 feature 冻结后发布了 4 次 candidate 才最终通过。经统计,一共有 236 个贡献者参与了这次版本开发,解决了 1474 个 jira^ ] 2 ) E 6 问题,涉及 30 多个 FLIP,提交了 2325 个 coQ . p +mmit。

Flink 1.11.0 发布,有哪些值得关注的新特性?

纵观近五次版本发布,可以看出从 1.9.0 Q ` w0 开始 Flink 进入了一个快速发展阶段,各个维度指标相比之前都有了几乎翻倍的5 g ] k 1 _ x x j提高。也是从 1.9.0 开始阿里巴巴内部的 Blink 项目开始被开源 Flin^ + n b m h k X [k 整I # U合,到 1.10.0 经过两个大版本已经全部整合完毕,对 Flink 从生态建设、功能性、性能和生& C g p $ i x产稳定性上都有了大幅的增强。

Flink 1- f g k q.11.0 版本的最初定位是重点解决易用性问题,提升用户业务的生产使用体验,整体上不做大的架构调整和功能开发y d M 6 ),倾向于快速迭代的小版本开发。但是从上面统计的各个指标来看,所谓的“小版本”在各个维度的数据也丝毫不逊色于前两个大版本,$ 7 m h _解决问题的数量和参与的贡献者人数也在持续增加,其中来自中国的贡献者比例达到 62%。

下面我们会深度剖析 Flink 1.11.0 带来了哪些让大家期待已久的特性,从用户直接使* R Y U u qK Z F o ,的 API 层一直到执行引擎层,我们都会选择一些有代表性的 feature 从不同维度解读,更完整的 feature 列表请大家关注发布的 release blog。

二 生态完善和易用性提升

这两+ T h t I 4 B 3 L个维度在某种程度上是相辅相成的,很难严格区分开,生态兼容L O t ] 0 & h 2上的缺失常常造成使用上的不便,提升易用性的过程往往也是不断完善相关生态的过程。在这方面用户感知最明显的应该就是 Table & St u w 0 ?QL API 层面的使用。

1 Table &amM 2 K O W = = ` ~p; SQL 支持 Change Data Capture(CDC)H Q ^ D h | ~ S &

CDC 被广泛使用在复制数据、更新缓存、微服务间同步数据、审计日志等场景,很多公司都在使用开源的 CDC^ h ~ 工具,如 MySQL CDC。通过 Flink 支持在 Table & SQL 中接入和解析 CDC 是一个强需求,在过往的很多讨论中都被提及过,可以帮助用户以实时的方式处理 changelog 流,进一步扩展 Flink 的应用场景,例如把 MySQL 中的数据同步到 PG 或 E# % * J G PlasticSearch 中,低延时的 temC = zporal join 一个 changelog 等。

除了考t F P H I L G 虑到上面的真实需求| 3 p ` Z,Flink 中定义的“Dynamic Table”概念在流上有两种模型:append 模式和 update 模式。通过 appenX t 3 id 模式把流转化为“Dynamic Tab3 j ile”在之前的版本中已经支持,因此在 1.11.0 中进一7 o {步支持 update 模式也从概念层面完整的实现了“Dynamic Table”。

Flink 1.11.0 发布,有哪些值得关注的新特性?

为了支持解析和输出 chang$ = 6 r 8elo# _ c D 4 |g,如何在e + J S O外部系统和 Flink 系统之间编解码这些更新操作是首要解决的w j R $ *问题。考虑到 soX 9 M u urce 和 sink 是衔接外部系统的一个桥梁,因此 FLIP-95 在定义全新的 Table source 和 Table sink 接口时解决了这个问题。

在公开的 CDC 调研报告中,Deb( - ^ B 3 ? # O ~ezium 和 Canal 是用户中最流行使用的 CDC 工具,这两种工具用来同步 changelog 到其R [ { 7它的L M a U $ . K M系统中,如消息队列。据此,FLIP-105 首先G - % . o u / |支持了 Debezium 和 Canal 这两种格式,而且 Kafka source 也已经可以支持解析上述格式并输出更新事件,在后续的版本中会进一步支持 Avro(Debezium) 和 Protobuf(Canal)。

CREATE TABLE my_table (
...) WITH (
'connector'='...', -- e.g. 'kafka'
'format'='debezium-json',
'debezium-json.sG : v 4 O i Jchema-incA 5 nlude'='true' -- de9 - D x mfault: false (Debezium can be configured to include ora t s %  U V a Y excluF : | E 3 , (de the message schema)
'debezium-json.ignoreS = F Z o m #-parse-er^ J j Urors'U ] F D U P `='tT U H # 8 _ F v #ru& + C /e' -- default:e g G 7 0 Y C ) C false
);

2 Table & SQL 支持 JDBC Catal0 g s h Qog

1.11.0 之前,用户如果依R ` u 0 ? w赖 Flink 的t v 4 # * source/sink 读写关系型数据库或读取 changelog 时,必须要手动创建对应的 schema。而且当数据库中的 schemg ! Ya 发生变化时,也需要手动更新对应的 Flink 作~ k I E 3 4 P业以保持一致和类型匹配,任何不匹配都会造成运行时报错使作业失败。用户经常抱怨( ` f ) D = n ; e这个看o B ! 3 B K n a似冗余且繁琐的流程,体验极差。

实际上对于任何和 Flink 连接的外部系统都可能有类似的上述问题,在 1.11.0 中重点解决了和关系型数据库对接的这个问题。FLIP-93 提供了 JDBC cy - 1 j batalog 的基础接口以及 Postgres catalog 的实现,这样方便后续实现与9 / @其它类型的关系型数据库的对接。

1.11& P J.0 版本后,用户使用 Flink SQL 时可以自动获取表的 schema 而不再需要输入 DDL。除此之外,任何 schema 不匹配的错误O _ R都会在编译阶w | ^ 9 a ~ * y段提前进行检查报错,避免了之前运行时报错造成的作业失败。这是提升易用性和用户体验的一个典型例子。

3 Hive 实时数仓

从 1.9.0 版本开始 Flink 从生C 7 F 9 m P态角度致力于集成 Hive,目标打l $ F造批流E c 1 q _ k一体的 Hive 数仓。经过前两个版本的迭代,已经达到了 batch 兼容且生产可用,在 Tu q z b BPC-DS 10T benchmark 下性能达到 Hive 3.0 的 7 倍以上。

1.11.0 在 Hive 生态中重点实现了实时数仓方案,改善了端到端流式 ETL 的用户体验,达到了批流一体 Hive 数仓{ y D t : ( 的目标。同时在兼容性、性能、易用性方面也进一步进M r h N ^ O行了加强。

在实时数仓的解决方案中,凭借 Flink 的流式处理优势做到实时读写 Hive:

  • Hive 写入:FLIP-115 完善扩展了 FileSystem connector 的基础能力和实现,Table/SQL 层的 sif d A ynk 可以支持各种格式(CSV、Json、Avro、Parquet、ORC),而且支持_ m 9 g S o @ M Hive tablez | J w y L c 的所有格式。
  • Partition 支持:数据导入 Hive 引入 partition 提交机制来控制可见性,通过sink.partition-commitQ p M % Q w.trigg5 ~ M C Ser 控制 partition 提交的时机,B ( ?通过 sink.partition-commit.policy.kind 选择提9 y ! -交策略,支持 SUCCw d Y i : }ESS 文件和 metas* I ? ] * q * Qtore 提8 A k X w )交。
  • Hive 读取:实时化的流式读取 Hive,通过监控 parti8 A n D 4 %tion 生成增量读取新 partition,或者监控文件夹内新文件生成来增量读取新文件。

在 Hive 可用性方面的提升:

  • FLIP-123 通过 Hive Dialect 为用户提供语法兼容,这样用户无需在 Flink 和 Hive 的 CLI 之间切换,可以直接迁移 Hive 脚本到 FR W $link 中执行。
  • 提供 Hive 相关依赖的内置支持,避免用户自己下载所需的相关依赖。现在只需要单独下载一个包,配置 HADOOP_CLASSPATH 就可以运行。

在 Hive 性能方面,1.10.0 中已A O ! m 3 ] A j经支持了 ORC(Hive 2+)的向量化读取,1.11.0 中我们补全了所有版本的 Parquet 和 ORC 向量化支持来提升性能。E 2 f 0 ` ^ ( r

4 全新 Source API

前面也提到过,source 和 sink 是 Flink 对接外部系统的一个桥梁,对于完善生态、可用性及端到端的用户体验是很重要的环节。社区早在一年前就已经规划了 source 端的彻底重构,从 FLIP-27 的 ID 就可以看出是很早M c G c的一个 feature。但是由于涉及到很多复杂的` } Y l % M 9 +内部机制和考虑到各种 source connector 的实现,设计上需要考虑5 x & ! P v x !的很全面。从 1.10.0 就开始做 POC 的实现,最终赶上e 4 D : V了 1.11.0 版本的发布。

先简要回顾下 source 之前的主要问题:

  • 对用户而言,在 Flink 中改v t {造已有的 source 或者重 6 m q I C 6 w C新实现一个生产级的 source conn& g Qector 不是一件容易的事情,具体体现在没有公共的代码* V p ^以复用,而且需要理解很多 Flink 内部细节以及实现具体的 event time 分配、watermark 产出、idleness 监测、R M ( 1 H F ~ K线程模型等。
  • 批和流的场景需要实现不同的 source。
  • partitions/splits/shards 概念在接口中没有显式表达,比如 sp- O = ? Ulit 的发现逻辑和数据消费都耦合在 source function 的实现中,这样在实现 Kafka 或 Kinesis 类型的 source 时增加了复杂性。
  • 在 runtime 执行层,checkpoint 锁被 source fu[ ` a / M Q znction 抢占会带来一系列问题,框架很难& | i f i进行n p o ` 9 4 p Y优化。

FLIP-27 在设计时充分考虑了上述的痛点:

Flink 1.11.0 发布,有哪些值得关注的新特性?

首先在 Job Manager 和 Task Manager 中分别引入两种不同的组件 Split Enumerator 和 Source reader,解耦 split 发现和对应的消费处理,同时方便随h ` r @ 6 R _ O b意组合不同的= & v 0 Y 1策略。比如现有的 Kafka connector 中有多种不同的 partition 发现策略和实现耦合在一起,在新的架构下k # K y O,我们只需要实现一种 source reader,就可以适配多种 split enumeraH = K Stor 的实现来对应不同的 partition 发现策略。

在新架构下实现的 source connector 可以做到批流统一,唯一的小区别是对批场景的有限输入,split enumerator 会产出固定数量的 split 集合并K R j o U m且每个 split 都H , f p是有限数据集;对于流场景的无限输入,split enumerator 要么产出无限多的 sC c K K K iplit 或者 split 自身是无限数据集。

复杂的 timestamp assigner 以及 watermark genera9 z K a k & A tor 透明的内置在 source reader 模块内运行,对用户来说& . k R s k 8是无感知的c p f ;。这样用户如果想实现新的 source connector,一般Y D f r不再需要重复实现这部分功能。

目前 Flink 已有的 source connector 会在后续的版本中基于新架构来重新实现,legacy source 也会继续维护几个版本保持兼容性,用户也$ j } T c / R e j可以按照 release 文档中的说明来尝试体验新 source 的开发。

5 PyFlink 生态

众所周知,Python 语言在机器8 q $ 4学习和数据分析领域有着广泛的使用。Flio 1 1 L O @ _nk 从 1.9.0 版本开= [ ; | ; b始发力兼容 Python 生/ & b % d态,Python 和 Flink 合力为 PyFlink,把 Flink 的实时分布W a M a Z = L L式处理能力输出给 Python 用户。前两个Y f S V L R ~ +版本 PyFlink 已经支持了 Python Table API 和 UDF,在 1.11.0 中扩大对 PythonG ~ y r ` o | P 生态库 Pandas 的支持以及和 SQL DDL/Client 的集成,同时 Python UDF 性能有了极大的提升。

具体来说,之前普通的 Python UDF 每次调用只能处理一条数据,而且在 Java 端和 Python 端都需要序列化/反序列化,开销很大。1.11.0 中 Flink 支持在 Table & SQL 作业中自定义和使用向量化 Python UDF,用户只需要在 UDF 修饰中额外增加一个参数 udf_type=“pandas” 即可。这样带来的好处是:

  • 每次调用可以处理 N 条数据。
  • 数据格式基于 Apache Arrow,大大降低了 Java、Python 进程之间的序列o y ( % f :化/反序列化开销。
  • 方便 Python 用户基于 Numpy 和 Pandas 等数据分析领域常用j ^ M f E B 6 &的 Python 库D * ] i,开2 H 1发高性能的 Python UDF。

除此之外,1.11.0 中 PyFlink 还支持:

  • PyFlink table 和 Pandas DataFraT ~ & Z N D ? p Eme 之间无缝切换(FL, t uIP-120),增强 Pandas 生态的易用性和兼容性。
  • Table & SQL 中可以定义和使用 Python UDTF(FLINK-14500),不再必需 Java/Scala UDTF。h q H | p I
  • Cython 优化 PF H ` / vython Ul 5 5 ?DF 的性能(FLIP-121),对比 1.10.0 可以提升 30 倍。
  • Python UDF 中用户自定义 metric(FLIP-112),方便监控和调试 UDF 的执行。

上述解读的都是侧重 API 层面,用户开发作业可以直接感知到的易用性的提升。下面我们看看执行引擎层在 1.11.0 中都有哪些值得关注的变化。

三 生产g v g可用性和稳定性提升

1 支/ R 9持 application 模式和 KubernU : 9 b T 2 ! ?etes 增强

1.11.0 版本前,Flink 主要支持如下两种模式运行:

  • Session 模式:提前启动一个集群,所有作业都共享这个集群的资源运行。优势是避免每个作业单独启动集群带来的额外开销,缺点是隔离性稍差。如果一个作业把某个 Task Manager(TM)容器搞挂,a Q ^会导致这个容器内的所有作业都跟着重启A V R C。虽然每个作业有自己独立的 Job Manager(JM)来管理,但是这些 JM 都运行在一个进程中,容易带来负载上的瓶颈。
  • Per-job 模式:为了解决 session 模式隔离性差的问题,每个作业根据资源需求启动独立的集群,每个作业的 JM 也是运行在独立的进程中,负载相对小p 5 n 2 0 L ! B很多。

以上两种模式的共同问题是需要在客户端执行用户代码,编译生成对应的 Job Graph 提交到集群运行。在这个( e f A过程需要下载相关 jarX } ( $ p f c 包并上传到集群,客户端和网络负载压力容易成为瓶颈,尤其当一个客户端被多个用户共享使用。

1.11.0 中引入了 application 模式(FLIP-85)来解决上述问题,按S y | R E照 application 粒度来启1 N 8 u . d动一个集群` X s,属于这个 a= 2 f TpplicationE ( A 的所有 job 在这个集群中运行。核心是 Job Graph 的生成以及作业的提交不在客户端执行,而是转移到 JM 端执行,这样网络下j h y I载上传的负载也会分散到集M m 3 8 O群中,不再有上述 client 单点上的瓶颈。

用户可以通过 bin/flink run-application 来使用 application 模式,目前 Yarn 和 Kubernetes(K8s)都已经支持这种模式。Yarn application 会在客户端将运行作业需要的依赖都通过 Yarn Local Ref R - |source 传递到 JM。K8s application 允许用户构建包含用户 jar 与依赖的镜像,同时会根据作业自动创建 TMe { ! E % v,并在结束后销毁整个集群,相比 session 模式具有更好的隔离性。K8s 不再有严格意义上的 per-job 模式,a( L Y d ! ~ ~pplication 模式相当于 per-job 在集群进行提交作业的实现。

除了支持 application 模式,Flink 原生 K8s 在 1.11.0 中还完善了很多基础的功能特性(FLINK-14460),以达到生产可用性的标准。例如 Node Selector、Label、Annota1 m O p _ # Vtion、Toleration 等。为了更方便的与 Hadoop 集成,也支持根据环境变量s k J自动挂载 Hadoop 配置的功能。

2 Checkpoint & Savepoint 优化

checkpoint 和 savepoint 机制一直是 Flink 保持先进性的核心竞争力之一,社区在这个领域的改动很谨慎,最近的几个大版本中几乎没有大的功能和架构上的调整。在用户邮件列表中,我们经常能看到用户反馈P P p C C X 2 7和抱怨的相关问题q w | 9 C ! 5 m:比如 checkpoint 长时间做不出来失败u { @ Y M,savep9 j r s * : z Point 在作业重启后不可用等等。1.11.0 有选择的解决了一些这方面的常见问题,提高生产可用性和稳定性。

1.11.0 之前, savepoint 中 meta 数据和 state 数据分别保存在两个不同的目录中,这样如果想迁移 state 目录很难识别这种映射关系,也D , _ / ^ . & C可能导致目录被误删除,对于目录清理也同样有麻烦。1.11.0 把两部分数据整合到一个目录下,这样方便整体转移和复用。另外,之前 meP * b yta 引用 state 采用的是绝对路径,这样 state 目录迁移后路径发生变化也不可用,1.11.0 把 state 引用改成了相对路径解决了这个问题(FLt x 9 , w { {INK-5763),这样 savepoint 的管理维护S h C、复用更加灵活方便。

实际生产环境中,用户经常遭遇 checkpoint 超时失败、长时间不能完成带来的困扰。一旦作业 failover 会造成回放大量的S - ( /历史数据,作业长时间没有进度,端到端的延迟增加。1.11.0 从不同维度对 cc 8 6heckpB G D 7 D Yoint 的优化和提速做了改进,目标实现分钟甚至秒级的轻量型 checkpoinR d z k Ut。

首先,增加了 CheL n }ckpoint Coordinator 通知 task 取消 checkpoint 的机制(FLINK-8871),这样避免 task 端还在执行已经取消的 checkpoint 而对系统带来不必要的压力。同时 task 端放弃已经取消的 checkpoint,可以更快的参与执行 coordinator 新触发的 checkpoint,某种程度上也可以避免新 c. ) , q = EheckpoinP L U V r rt 再次执行超时而失败。这个优化也对r p r 2 % n后面默认开启 local recovery 提供d y m v k C r Z了便利,task 端可以及时清理失效 checkpoint 的资源。

其次,在反压_ f )场景下,整个数据g ] y P w R链路堆积了大量 buffer,导致 checkpoint barrier 排在数据 buffer 后面,不能被 ta~ f 1 } msk 及时处理对齐,也就导致了 checkp) 2 Y [oint 长时间不能执行。1.11.0 中从两个维度对这个问题T , { * b Q [进行解决:

1)尝试减少数据链路中的 buffer 总量(FLINK-16428),这样 checkpoint barrier 可以尽快被处理对齐。

  • 上游输出端控制单个 sub partition 堆积 buZ L C V * Affer 的最大阈值(backlog),避免负载不均场景下单个链路上堆积大量 buffer。
  • 在不影响网络吞吐性能的情况下合理修改上下游默认的 buffer 配置。
  • 上下游数y M A v ) c o据传输的基础协议进行了调整,允许单个数据链路可以配置 0 个独占 buffer 而不死锁/ k 9,这样~ P 6 f W总的 buffer 数量和作业并发规模解耦` Q ! B。根据实际需求在吞吐性能和 checkpoint 速5 W y - 9 c 6 J度两者之间权+ s /衡,自定义 buffer 配比。

这个优化有一部分工作已经在 1.11.0 中完成,剩余部分会在下个版本继续推进完成。

2)实现了全新的 unaligned checkpoint 机制(FLIP-76)从根本上解决了反压场景下 checkpoint barrier 对齐的问题。实际上这个想法早在 1.10.0 版本之前就E k F p 9 a 8开始酝酿设计,由于涉及到G L # s J很多模块的大改动,实现机制和线程模型也很复杂。我们实现了两种不同方案的原型 POC 进行了测试、性能对比,确定了最终的方案,因此直到 1.1I $ i T1.0 才完成了 MVP 版本,这也是 1.11.0 中执行引擎层唯一的一个重量级 feature。其基本思想可g M X以概括为:

  • Check( x % ) 7 f - { Kpoint barrier 跨数据 buffer 传输,不在输入输出队列排U 0 8 B u S }队等待处理,这样就和算子的计算能力解耦,barrier 在节点之间的传输只有网络延时,E d b i可以忽略不计。
  • 每个算子多个输入链路之, j l } 1 g Z # V间不需要等待 barrier 对齐来执行 checkpoint,第一个到的 barrier 就可以提前触发 checkpoint,这样可以进一5 r / F 8步提速 checkpg c ?oint,不会因为个别链路的延迟而影响整体。
  • 为了和之前 aligned checkpoint 的语义保持一致,所有未被处理的输入输出数0 [ D据 buffer 都将作为 channel state 在 checkpoint 执行时进行快照持久化,在 faT : 0 $ 2 Gilover+ ^ V U O 时连同 opeV l lrator state 一同进行恢复。换句话说,aligned 机制保证的是 bU 0 Y 6arrier 前面所有数据必须被处理完,状态实时体现到 op! d N 7 `erator s, # M H Etate 中;而 unaligned 机制把 barrier 前面的未处理数据所反映的 operator state 延后到 failover restart 时通过 channel state 回放进行体现,从状态恢复的角度来说最终都是一致的。注意这里虽然引入了[ ? / l @ o ; _额外的 in-flight buffer 的持久化,但是这个过程实际是在 checkpoint 的异步阶段完成的,同步阶段只是进行了轻量级的 buffer 引用,所以不会过多占用N Y p D m ] o B子的, @ @ t M P 8 | ;计算时间而影响吞吐性能。

Flink 1.11.0 发布,有哪些值得关注的新特性?

Unaligned checkpoint 在反压严重的场景下可以明显加速 checkpoint 的完成时间,因为它不再依赖于整体的计算吞吐能力,而和系统的存储性能更加相关,相当于计算和存储的解耦。但是它的使用也有一定的局限性,它会增加整体 state 的大小,对存储 IO 带来额外的开销,因此在t y ; IO 已经是瓶颈的场景下就不太适合使用 unaligned checkD 5 Tpoin# ~ D e Z M e #t 机制。6 - t H 9 * ! 4 o

1.11.0 中 unaligned checkpoint 还没有作为默认6 z | ? d * 9 ; 0模式,需要用= a ! 0 A m户手动配置来开启,并且只在 exactly-once 模式下生效。但目前还不支持 savepoint 模式,因为 savepoint 涉及到作业的 rescale 场景,channel state 目前还不支持 state 拆分,在后面的版本会进一步支持,所以 savepoint 目前还是会使用之前的 aligned 模式,在反压场景下有可能需要很长时间才能完成。

四 总结

Flink 1.11.0 版本的开发过程中,e w T r |我们看到越来越多来自中国的贡献者参与到核心功能的开发中,见证了 Flin! Z X * 9 g ] F Ak 在中国的生态发展越来越繁荣,比如来自腾讯公司的贡献者参与了 K8s、checkpoint 等功能开发,来p L ( W 0自字节跳动公司的贡献者参与了 Table &1 R j h c D K d SQL 层以及引擎网络层的一些开发@ , c _。希望更多的公司能够参与到 Flink 开源社区中,分享在不同领域的经验,使 Flink 开源技术一直保持先进性,R ! r能够普惠到更多的受众。

经过 1.11.0 “小版本”的短暂调整,Flink 正在酝酿下一个大版本的 feature,相信一定会有很多重量级的特性登场,让我们拭目以待!

【云栖号在线课堂】每天都有产品技术专家分享!
课程地址:https://yqh.aliyun.com/e u 1 B H C . _live

立即加入社群,与专家面对面,及时了解课程最新动态!
【云栖号在线课堂 社群】https://c.tb.cn/F3.Z8gvnK

原文发布时间:2020-07-14
本文作者:王治江(淘江)
本文来自:“阿里技术公众号”,了解相关信息可以关注“阿里技术”