美团点评基于 Flink 的实时数仓建设实践

方案	优势	劣势
MySQL	1. 具有完备的事务功能，可以对数据进行更新。2. 支持 SQL，开发成本低。	1. 横向扩展成本大，存储容易成为瓶颈； 2. 实时数据的更新和查询频率都很高，线上单个实时应用请求就有 1000+ QPS；使用 MySQL 成本太高。
Elasticsearch	1. 吞吐量大，单个机器可以支持 2500+ QPS，并且集群可以快速横向扩展。2. Term 查询时响应速度很快，单个机器在 2000+ QPS时，查询延迟在 20 ms以内。	1. 没有原生的 SQL 支持，查询 DSL 有一定的学习门槛；2. 进行聚合运算时性能下降明显。
Druid	1. 支持超大数据量，通过 Kafka 获取实时数据时，单个作业可支持 6W+ QPS；2. 可以在数据导入时通过预计算对数据进行汇总，减少的数据存储。提高了实际处理数据的效率；3. 有很多开源 OLAP 分析框架。实现如 Superset。	1. 预聚合导致无法支持明细的查询；2. 无法支持 Join 操作；3. Append-only 不支持数据的修改。只能以 Segment 为单位进行替换。
Cellar	1. 支持超大数据量，采用内存加分布式存储的架构，存储性价比很高；2. 吞吐性能好，经测试处理 3W+ QPS 读写请求时，平均延迟在 1ms左右；通过异步读写线上最高支持 10W+ QPS。	1. 接口仅支持 KV，Map，List 以及原子加减等；2. 单个 Key 值不得超过 1KB ，而 Value 的值超过 100KB 时则性能下降明显。

项目/引擎	Storm	Flink	spark-treaming
API	灵活的底层 API 和具有事务保证的 Trident API	流 API 和更加适合数据开发的 Table API 和 Flink SQL 支持	流 API 和 Structured-Streaming API 同时也可以使用更适合数据开发的 Spark SQL
容错机制	ACK 机制	State 分布式快照保存点	RDD 保存点
状态管理	Trident State状态管理	Key State 和 Operator State两种 State 可以使用，支持多种持久化方案	有 UpdateStateByKey 等 API 进行带状态的变更，支持多种持久化方案
处理模式	单条流式处理	单条流式处理	Mic batch处理
延迟	毫秒级	毫秒级	秒级
语义保障	At Least Once，Exactly Once	Exactly Once，At Least Once	At Least Once

- - 美团点评技术团队

近些年，企业对数据服务实时化服务的需求日益增多. 本文整理了常见实时数据组件的性能特点和适用场景，介绍了美团如何通过 Flink 引擎构建实时数据仓库，从而提供高效、稳健的实时数据服务. 此前我们美团技术博客发布过一篇文章《流计算框架 Flink 与 Storm 的性能对比》，对 Flink 和 Storm 俩个引擎的计算性能进行了比较.

flink-watermark

- - ITeye博客

当我们统计用户点击的时候，有时候会因为各种情况数据延迟，我们需要一个允许最大的延迟范围进行统计. 模拟初始数据：早上10:00 11.10 用户点击了一次，但是延迟到10:00 11.15 才发送过来，允许最大延迟5秒， 5秒窗口统计. /** 实际时间-偏移量偏移后的时间*/.

基于 Flink SQL CDC 的实时数据同步方案 (developer.aliyun.com)

- - IT瘾-jianshu

整理：陈政羽（Flink 社区志愿者）. Flink 1.11 引入了 Flink SQL CDC，CDC 能给我们数据和业务间能带来什么变化. 本文由 Apache Flink PMC，阿里巴巴技术专家伍翀 (云邪）分享，内容将从传统的数据同步方案，基于 Flink CDC 同步的解决方案以及更多的应用场景和 CDC 未来开发规划等方面进行介绍和演示.

用Flink SQL CDC + ES实现数据实时化真香！

- -

本人目前参与的项目属于公司里面数据密集、计算密集的一个重要项目，需要提供高效且准确的 OLAP 服务，提供灵活且实时的报表. 业务数据存储在 MySQL 中，通过主从复制同步到报表库. 作为集团级公司，数据增长多而且快，出现了多个千万级、亿级的大表. 为了实现各个维度的各种复杂的报表业务，有些千万级大表仍然需要进行 Join，计算规模非常惊人，经常不能及时响应请求.

基于Flink构建实时数仓实践

- -

随着公司用户增长业务快速发展，陆续孵化出部落、同镇、C 端会员、游戏等非常多的业务板块. 与此同时产品及运营对实时数据需求逐渐增多，帮助他们更快的做出决策，更好的进行产品迭代，实时数仓的建设变得越发重要起来. 本文主要介绍用户增长业务基于 Flink 构建实时数仓的实践之路. 如下图是早期的实时计算架构，实时数据需求较少，架构简单，数据链路少，一路到底的开发模式能很快满足业务需求；.

Flink 如何实时分析 Iceberg 数据湖的 CDC 数据

- - 掘金后端

本文由李劲松、胡争分享，社区志愿者杨伟海、李培殿整理. 主要介绍在数据湖的架构中，CDC 数据实时读写的方案和原理. 文章主要分为 4 个部分内容：. 常见的 CDC 分析方案. 为何选择 Flink + Iceberg. 一、常见的 CDC 分析方案. 我们先看一下今天的 topic 需要设计的是什么.

Flink CDC 如何简化实时数据入湖入仓

- - Jark's Blog

一、Flink CDC 介绍. 从广义的概念上讲，能够捕获数据变更的技术, 我们都可以称为 CDC 技术. 通常我们说的 CDC 技术是一种用于捕获数据库中数据变更的技术. CDC 技术应用场景也非常广泛，包括：. 数据分发，将一个数据源分发给多个下游，常用于业务解耦、微服务. 数据集成，将分散异构的数据源集成到数据仓库中，消除数据孤岛，便于后续的分析.

Flink 零基础实战教程：如何计算实时热门商品

- - Jark's Blog

在上一篇入门教程中，我们已经能够快速构建一个基础的 Flink 程序了. 本文会一步步地带领你实现一个更复杂的 Flink 应用程序：实时热门商品. 在开始本文前我们建议你先实践一遍上篇文章，因为本文会沿用上文的 my-flink-project项目框架. 如何基于 EventTime 处理，如何指定 Watermark.

实时计算框架 Flink 在教育行业的应用实践

- - U刻

如今，越来越多的业务场景要求 OLTP 系统能及时得到业务数据计算、分析后的结果，这就需要实时的流式计算如 Flink 等来保障. 例如，在 TB 级别数据量的数据库中，通过 SQL 语句或相关 API 直接对原始数据进行大规模关联、聚合操作，是无法做到在极短的时间内通过接口反馈到前端进行展示的. 若想实现大规模数据的 “即席查询”，就须用实时计算框架构建实时数仓来实现.

维度数据实时关联的实践（w/ Flink、Vert.x & Guava Cache） - 简书

- -

在流式处理作业（特别是实时数仓ETL作业）中，我们的数据流可以视为无界事实表，其中往往缺乏一些维度信息. 例如，对于埋点日志流而言，为了减少传输冗余，可能只会带有城市ID、商品ID等，如果要映射到对应的名称，就需要与外部存储中的维度表进行关联. 这里的外部存储一般是指适合OLTP场景的数据库，如MySQL、Redis、HBase等.

美团点评基于 Flink 的实时数仓建设实践

引言

实时平台初期架构

实时数据仓库的构建

技术选型

1.存储引擎的调研

2.计算引擎的调研

Flink使用心得

1.维度扩充

2.数据关联

3.聚合运算

实时数仓成果

展望

参考文献

关于作者

招聘信息

相关 [美团 flink 实时] 推荐：