Kylin在马蜂窝数据分析团队的应用实战

- -

AI 前线导读：马蜂窝大数据平台自 2017 年下半年引入 Apache Kylin 以来，极大的提升了数据分析师对于数据探索的效率. 因为使用了 Apache Kylin，数据分析师可以直接查询大数据、无需排队、亚秒级响应，整体开发效率提高了 10 倍以上. 更多优质内容请关注微信公众号“AI 前线”（ID：ai-front）.

大数据分析界的“神兽”Apache Kylin有多牛？ – lxw的大数据田地

- -

1.Apache Kylin是什么. 在现在的大数据时代，越来越多的企业开始使用Hadoop管理数据，但是现有的业务分析工具（如Tableau，Microstrategy等）往往存在很大的局限，如难以水平扩展、无法处理超大规模数据、缺少对Hadoop的支持；而利用Hadoop做数据分析依然存在诸多障碍，例如大多数分析师只习惯使用SQL，Hadoop难以实现快速交互式查询等等.

Apache Kylin 性能优化

- - V2EX - 技术

聚合组 Aggregation Groups. Cube Designer 的 Advanced Setting 中可以配置 Aggregation Groups. 理论上 N 维度 Cube 会构建 2^N 个 Cuboid，随着维度的增多，Cuboid 数量会指数增长，存储空间占用增大，构建时间增长.

一文读懂Apache Kylin - 简书

- -

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　—— 中国古谚语. 随着移动互联网、物联网等技术的发展，近些年人类所积累的数据正在呈爆炸式的增长，大数据时代已经来临. 但是海量数据的收集只是大数据技术的第一步，如何让数据产生价值才是大数据领域的终极目标. Hadoop的出现解决了数据存储问题，但如何对海量数据进行OLAP查询，却一直令人十分头疼.

Excel 数据分析

- - ITeye博客

用Excel做数据分析——直方图. 已有 0 人发表留言，猛击->> 这里<<-参与讨论. —软件人才免语言低担保赴美带薪读研.

Kylin：基于Hadoop的开源数据仓库OLAP分析引擎

- - 标点符

Kylin是一个开源、分布式的OLAP分析引擎，它由eBay公司开发，并且基于Hadoop提供了SQL接口和OLAP接口，能够支持TB到PB级别的数据量. OLAP即联机分析处理，它能够帮助分析人员、管理人员或执行人员从多角度快速、一致、交互地存取信息和更加深入的了解信息. OLAP的目标是满足决策支持或者满足在多维环境下特定的查询和报表需求.

以前写过一篇文档讨论MPP DB的发展，《 MPP DB 是大数据实时分析系统未来的选择吗. 》，当时主要是想讨论下Greenplum数据库是否合适做数据存储，以及实时查询. 文章我主要提的MPP DB短板是扩展性和对并发的支持，从目前Pivotal公司主推的HAWK，已经可以清楚的看到，业界主流的思路是SQL onhadoop，用传统引擎的高性能加上hadoop 存储的鲁棒性，来构建大数据实时分析.

基于 Kylin 的推荐系统效果评价系统

- - IT瘾-tuicool

OLAP（联机分析处理）是数据仓库的主要应用之一，通过设计维度、度量，我们可以构建星型模型或雪花模型，生成数据多维立方体Cube，基于Cube可以做钻取、切片、旋转等多维分析操作. 早在十年前，SQL Server、Oracle 等数据库软件就有OLAP产品，为用户提供关系数据库、多维数据集、可视化报表的整套商业智能方案.

Kylin 大数据时代的OLAP利器 - CSDN博客

- -

Olap全称为在线联机分析应用，是一种对于多维数据分析查询的解决方案. 典型的Olap应用场景包括销售、市场、管理等商务报表，预算决算，经济报表等等. 最早的Olap查询工具是发布于1970年的Express，然而完整的Olap概念是在1993年由关系数据库之父 Edgar F.Codd 提出，伴随而来的是著名的“twelve laws of online analytical processing”.

Kylin构建Cube过程详解 - XIAO的博客 - 博客园

- -

下面开始分析cube的build过程. 以手机销售为例，表SALE记录各手机品牌在各个国家，每年的销售情况. 表PHONE是手机品牌，表COUNTRY是国家列表，两表通过外键与SALE表相关联. 这三张表就构成星型模型，其中SALE是事实表，PHONE、COUNTRY是维度表. 现在需要知道各品牌手机于2010-2012年，在中国的总销量，那么查询sql为：.

Kylin在马蜂窝数据分析团队的应用实战

为什么 Apache Kylin 是分析师的标配技能

Kylin 在马蜂窝分析师团队的日常

Kylin 集成到数据平台的经验

1. Kylin 在马蜂窝数据平台的应用

2. Kylin 在马蜂窝数据平台调度流程

3. Kylin 在马蜂窝数据平台上线的标准流程

结语

作者简介

马蜂窝简介

马蜂窝数据团队简介

相关 [kylin 蜂窝数据分析] 推荐：