Flink CDC 高频面试 13 问

- - IT瘾-dev

大家好，今天分享一篇土哥的文章. Flink cdc 2.1.1 发布后，更新了很多新功能以及知识点，今天为大家全面总结了 CDC 的知识点如无锁算法及面试高频考点. 2 Flink cdc 2.1.1 新增内容. 获取本文文档，直接在公众号后台回复： CDC，加土哥微信，领取 Flink CDC 2.2.1 总结文档.

Flink CDC 核心：Debezium 1.9.0.Beta1 发布！

- - IT瘾-dev

我很高兴地宣布 Debezium 1.9.0.Beta1的发布. 此版本包括 Debezium Server 的许多新功能，包括 Knative Eventing 支持和使用 Redis 接收器的偏移存储管理、SQL Server 连接器的多分区缩放以及各种错误修复和改进. 总体而言，此版本已修复56 个问题.

基于 Flink SQL CDC 的实时数据同步方案 (developer.aliyun.com)

- - IT瘾-jianshu

整理：陈政羽（Flink 社区志愿者）. Flink 1.11 引入了 Flink SQL CDC，CDC 能给我们数据和业务间能带来什么变化. 本文由 Apache Flink PMC，阿里巴巴技术专家伍翀 (云邪）分享，内容将从传统的数据同步方案，基于 Flink CDC 同步的解决方案以及更多的应用场景和 CDC 未来开发规划等方面进行介绍和演示.

用Flink SQL CDC + ES实现数据实时化真香！

- -

本人目前参与的项目属于公司里面数据密集、计算密集的一个重要项目，需要提供高效且准确的 OLAP 服务，提供灵活且实时的报表. 业务数据存储在 MySQL 中，通过主从复制同步到报表库. 作为集团级公司，数据增长多而且快，出现了多个千万级、亿级的大表. 为了实现各个维度的各种复杂的报表业务，有些千万级大表仍然需要进行 Join，计算规模非常惊人，经常不能及时响应请求.

Flink 如何实时分析 Iceberg 数据湖的 CDC 数据

- - 掘金后端

本文由李劲松、胡争分享，社区志愿者杨伟海、李培殿整理. 主要介绍在数据湖的架构中，CDC 数据实时读写的方案和原理. 文章主要分为 4 个部分内容：. 常见的 CDC 分析方案. 为何选择 Flink + Iceberg. 一、常见的 CDC 分析方案. 我们先看一下今天的 topic 需要设计的是什么.

Flink CDC 如何简化实时数据入湖入仓

- - Jark's Blog

一、Flink CDC 介绍. 从广义的概念上讲，能够捕获数据变更的技术, 我们都可以称为 CDC 技术. 通常我们说的 CDC 技术是一种用于捕获数据库中数据变更的技术. CDC 技术应用场景也非常广泛，包括：. 数据分发，将一个数据源分发给多个下游，常用于业务解耦、微服务. 数据集成，将分散异构的数据源集成到数据仓库中，消除数据孤岛，便于后续的分析.

flink-watermark

- - ITeye博客

当我们统计用户点击的时候，有时候会因为各种情况数据延迟，我们需要一个允许最大的延迟范围进行统计. 模拟初始数据：早上10:00 11.10 用户点击了一次，但是延迟到10:00 11.15 才发送过来，允许最大延迟5秒， 5秒窗口统计. /** 实际时间-偏移量偏移后的时间*/.

本文主要是讲解flink on yarn的部署过程，然后yarn-session的基本原理，如何启动多个yarn-session的话如何部署应用到指定的yarn-session上，然后是用户jar的管理配置及故障恢复相关的参数. flink on yarn的整个交互过程图，如下：. 要使得flink运行于yarn上，flink要能找到hadoop配置，因为要连接到yarn的resourcemanager和hdfs.

Flink SQL 编程实践

- - Jark's Blog

注：本教程实践基于 Ververica 开源的. sql-training 项目. 基于 Flink 1.7.2. 本文将通过五个实例来贯穿 Flink SQL 的编程实践，主要会涵盖以下几个方面的内容. 如何使用 SQL CLI 客户端. 如何在流上运行 SQL 查询. 运行 window aggregate 与 non-window aggregate，理解其区别.

谈谈 Flink Shuffle 演进

- - 时间与精神的小屋

在分布式计算中，Shuffle 是非常关键但常常容易被忽视的一环. 比如著名的 MapReduce 的命名跳过 Shuffle ，只包含其前后的 Map 跟 Reduce. 背后原因一方面是 Shuffle 是底层框架在做的事情，用户基本不会感知到其存在，另一方面是 Shuffle 听起来似乎是比较边缘的基础服务.

Flink CDC 高频面试 13 问

1 cdc 简介

2 Flink cdc 2.1.1 新增内容

2.1 MySQL CDC 连接器改进详解

2.2 新增 Oracle CDC 连接器

2.3 新增 MongoDB CDC 连接器

3 核心知识点解刨

3.1 flink cdc 1.x 加锁设计

3.2 flink cdc 1.x 问题点

3.3 DBlog Paper

3.4 flink cdc 2.x 无锁算法

4 CDC 高频面试题

相关 [flink cdc 高频] 推荐：