Flink 零基础实战教程：如何计算实时热门商品

列名称	说明
用户ID	整数类型，加密后的用户ID
商品ID	整数类型，加密后的商品ID
商品类目ID	整数类型，加密后的商品所属类目ID
行为类型	字符串，枚举类型，包括(‘pv’, ‘buy’, ‘cart’, ‘fav’)
时间戳	行为发生的时间戳，单位秒

- - Jark's Blog

在上一篇入门教程中，我们已经能够快速构建一个基础的 Flink 程序了. 本文会一步步地带领你实现一个更复杂的 Flink 应用程序：实时热门商品. 在开始本文前我们建议你先实践一遍上篇文章，因为本文会沿用上文的 my-flink-project项目框架. 如何基于 EventTime 处理，如何指定 Watermark.

flink-watermark

- - ITeye博客

当我们统计用户点击的时候，有时候会因为各种情况数据延迟，我们需要一个允许最大的延迟范围进行统计. 模拟初始数据：早上10:00 11.10 用户点击了一次，但是延迟到10:00 11.15 才发送过来，允许最大延迟5秒， 5秒窗口统计. /** 实际时间-偏移量偏移后的时间*/.

实时计算框架 Flink 在教育行业的应用实践

- - U刻

如今，越来越多的业务场景要求 OLTP 系统能及时得到业务数据计算、分析后的结果，这就需要实时的流式计算如 Flink 等来保障. 例如，在 TB 级别数据量的数据库中，通过 SQL 语句或相关 API 直接对原始数据进行大规模关联、聚合操作，是无法做到在极短的时间内通过接口反馈到前端进行展示的. 若想实现大规模数据的 “即席查询”，就须用实时计算框架构建实时数仓来实现.

本文主要是讲解flink on yarn的部署过程，然后yarn-session的基本原理，如何启动多个yarn-session的话如何部署应用到指定的yarn-session上，然后是用户jar的管理配置及故障恢复相关的参数. flink on yarn的整个交互过程图，如下：. 要使得flink运行于yarn上，flink要能找到hadoop配置，因为要连接到yarn的resourcemanager和hdfs.

Flink SQL 编程实践

- - Jark's Blog

注：本教程实践基于 Ververica 开源的. sql-training 项目. 基于 Flink 1.7.2. 本文将通过五个实例来贯穿 Flink SQL 的编程实践，主要会涵盖以下几个方面的内容. 如何使用 SQL CLI 客户端. 如何在流上运行 SQL 查询. 运行 window aggregate 与 non-window aggregate，理解其区别.

谈谈 Flink Shuffle 演进

- - 时间与精神的小屋

在分布式计算中，Shuffle 是非常关键但常常容易被忽视的一环. 比如著名的 MapReduce 的命名跳过 Shuffle ，只包含其前后的 Map 跟 Reduce. 背后原因一方面是 Shuffle 是底层框架在做的事情，用户基本不会感知到其存在，另一方面是 Shuffle 听起来似乎是比较边缘的基础服务.

Flink 1.16：Hive SQL 如何平迁到 Flink SQL

- - Jark's Blog

Hive SQL 迁移的动机. Flink 已经是流计算的事实标准，当前国内外做实时计算或流计算一般都会选择 Flink 和 Flink SQL. 另外，Flink 也是是家喻户晓的流批一体大数据计算引擎. 然而，目前 Flink 也面临着挑战. 比如虽然现在大规模应用都以流计算为主，但 Flink 批计算的应用并不广泛，想要进一步推动真正意义上的流批一体落地，需要推动业界更多地落地 Flink 批计算，需要更积极地拥抱现有的离线生态.

Flink Kafka Connector与Exactly Once剖析

- - SegmentFault 最新的文章

Flink Kafa Connector是Flink内置的Kafka连接器，它包含了从Kafka Topic读入数据的 Flink Kafka Consumer以及向Kafka Topic写出数据的 Flink Kafka Producer，除此之外Flink Kafa Connector基于Flink Checkpoint机制提供了完善的容错能力.

Flink在唯品会的实践

- - DockOne.io

唯品会自2017年开始基于Kubernetes深入打造高性能、稳定、可靠、易用的实时计算平台，支持唯品会内部业务在平时以及大促的平稳运行. 现平台支持Flink、Spark、Storm等主流框架. 本文主要分享Flink的容器化实践应用以及产品化经验. 平台支持公司内部所有部门的实时计算应用. 主要的业务包括实时大屏，推荐，实验平台，实时监控和实时数据清洗等.

使用 Kubernetes 部署 Flink 应用

- - 张吉的博客

Kubernetes 是目前非常流行的容器编排系统，在其之上可以运行 Web 服务、大数据处理等各类应用. 这些应用被打包在一个个非常轻量的容器中，我们通过声明的方式来告知 Kubernetes 要如何部署和扩容这些程序，并对外提供服务. Flink 同样是非常流行的分布式处理框架，它也可以运行在 Kubernetes 之上.

Flink 零基础实战教程：如何计算实时热门商品

实战案例介绍

数据准备

编写程序

创建模拟数据源

EventTime 与 Watermark

过滤出点击事件

窗口统计点击量

TopN 计算最热门商品

打印输出

运行程序

总结

相关 [flink 基础计算] 推荐：