flink
未读
Flink中的数据抽象及数据交换过程
Flink的数据抽象 MemorySegment Flink作为一个高效的流框架,为了避免JVM的固有缺陷(java对象存储密度低,FGC影响吞吐和响应等),必然走上自主管理内存的道路。
flink
未读
Flink滑动窗口原理与细粒度滑动窗口的性能问题
场景描述:Flink的窗口机制是其底层核心之一,也是高效流处理的关键。Flink窗口分配的基类是WindowAssigner抽象类,下面的类图示出了Flink能够提供的所有窗口类型。 Flink窗口分为滚动(tumbling)、滑动(sliding)和会话(session)窗口三大类,本文要说的是滑
flink
未读
Flink CheckPoint奇技淫巧 | 原理和在生产中的应用
Flink本身为了保证其高可用的特性,以及保证作用的Exactly Once的快速恢复,进而提供了一套强大的Checkpoint机制。 Checkpoint机制是Flink可靠性的基石,可以保证Flink集群在某个算子因为某些原因(如异常退出)出现故障时,能够将整个应用流图的状态恢复到故障之前的某一
flink
未读
Flink 网络传输优化技术
http://shiyuquan.cn/archives/flink-shuffleji-zhi-de-chong-gou-yu-you-hua 作为工业级的流计算框架,Flink 被设计为可以每天处理 TB 甚至 PB 级别的数据,所以如何高吞吐低延迟并且可靠地在算子间传输数据是一个非常重要的课题
flink
未读
Flink Back Pressure
1. 什么是 Back Pressure 如果看到任务的背压警告(如 High 级别),这意味着 生成数据的速度比下游算子消费的的速度快。以一个简单的 Source -> Sink 作业为例。如果能看到 Source 有警告,这意味着 Sink 消耗数据的速度比 Source 生成速度慢。Sink
flink
未读
Flink Exactly-Once 投递实现浅析
随着近来越来越多的业务迁移到 Flink 上,对 Flink 作业的准确性要求也随之进一步提高,其中最为关键的是如何在不同业务场景下保证 exactly-once 的投递语义。虽然不少实时系统(e.g. 实时计算/消息队列)都宣称支持 exactly-once,exactly-once 投递似乎是一
flink
未读
Flink结合Kafka实现端到端的一致性语义
本次分享来自阿里巴巴的工程师在Apache Kafka x Apache Flink·北京会议上的分享,关于Apache Flink结合Apache Kafka实现端到端的一致性语义的原理。 2017年12月Apache Flink社区发布了1.4版本。该版本正式引入了一个里程碑式的功能:两阶段提交
flink
未读
Flink CEP:复杂事件处理
0. 本文概述简介 FlinkCEP是在Flink之上实现的复杂事件处理(CEP)库。 它允许你在×××的事件流中检测事件模式,让你有机会掌握数据中重要的事项。 本文描述了Flink CEP中可用的API调用。 首先介绍Pattern API,它允许你指定要在流中检测的模式,然后介绍如何检测匹配事件
flink
未读
Flink DataStream的八种物理分区逻辑
https://mp.weixin.qq.com/s/d_jzHb-b7LEGNz1CN34zMg Spark的RDD有分区的概念,Flink的DataStream同样也有,只不过没有RDD那么显式而已。Flink通过流分区器StreamPartitioner来控制DataStream中的元素往下游