flink
未读
Flink结合Kafka实现端到端的一致性语义
本次分享来自阿里巴巴的工程师在Apache Kafka x Apache Flink·北京会议上的分享,关于Apache Flink结合Apache Kafka实现端到端的一致性语义的原理。 2017年12月Apache Flink社区发布了1.4版本。该版本正式引入了一个里程碑式的功能:两阶段提交
flink
未读
Flink CEP:复杂事件处理
0. 本文概述简介 FlinkCEP是在Flink之上实现的复杂事件处理(CEP)库。 它允许你在×××的事件流中检测事件模式,让你有机会掌握数据中重要的事项。 本文描述了Flink CEP中可用的API调用。 首先介绍Pattern API,它允许你指定要在流中检测的模式,然后介绍如何检测匹配事件
flink
未读
Flink DataStream的八种物理分区逻辑
https://mp.weixin.qq.com/s/d_jzHb-b7LEGNz1CN34zMg Spark的RDD有分区的概念,Flink的DataStream同样也有,只不过没有RDD那么显式而已。Flink通过流分区器StreamPartitioner来控制DataStream中的元素往下游
flink
未读
基于Flink快速开发实时TopN
TopN 是统计报表和大屏非常常见的功能,主要用来实时计算排行榜。流式的TopN可以使业务方在内存中按照某个统计指标(如出现次数)计算排名并快速出发出更新后的排行榜。 flink支持各种各样的流数据接口作为数据的数据源,本次demo我们采用内置的socketTextStream作为数据数据源。 St
bigdata
未读
Impala 和 Kudu
来神策数据后,开始接触到Kudu和Impala两个组件,这两者的结合主要是受到 vertica 提出的 wos 和 ros 概念影响,即 写优化(write optimized store)和 读优化 (read optimized store),这一技术架构本质上就是一种数据的混合存储模型: da