唯品会海量实时OLAP分析技术升级之路

- - 运维派

本文根据谢麟炯老师在〖DAMS 2017中国数据资产管理峰会〗现场演讲内容整理而成. 谢麟炯，唯品会大数据平台高级技术架构经理，主要负责大数据自助多维分析平台，离线数据开发平台及分析引擎团队的开发和管理工作，加入唯品会以来还曾负责流量基础数据的采集和数据仓库建设以及移动流量分析等数据产品的工作. 海量数据实时OLAP场景的困境.

最火实时大数据OLAP技术原理和实践

- -

Druid在大数据领域已经不是新人了，因此可能很多读者都已经听说过Druid，甚至用过Druid，但是未必每个人都真正清晰地了解Druid到底是什么，以及在什么情况下可以用Druid. 同时，为了避免大家听了半天，却一直陷在各种细节中但仍然不知道到底在听什么东西，我们还是有必要在开始的时候先总体谈一谈Druid到底是什么.

使用ElasticSearch作为大数据平台的实时OLAP框架 – lxw的大数据田地

- -

关键字：elasticsearch、olap. 一直想找一个用于大数据平台实时OLAP（甚至是实时计算）的框架，之前调研的Druid（druid.io）太过复杂，整个Druid由5、6个服务组成，而且加载数据也不太方便，性能一般，亦或是我还不太会用它. 后来发现使用ElasticSearch就可以满足海量数据实时OLAP的需求.

唯品会实时计算平台的演进之路

- -

先介绍一下我们整个平台的现状，按计算的话，分为 Storm、Spark、Flink 三个主要的计算引擎，Flink 相应的应用数量目前少一些，不过按照整个计算引擎的发展方式，后续我们还是希望以 Flink 为主做相应的业务推进. 实时推荐引擎：这块是非常核心的业务，对于大数据来说这些都是个性化推荐、实时推荐；.

多维分析OLAP引擎Mondrian学习

- - Web前端 - ITeye博客

随着信息技术的飞速发展，在电力、电信、金融、大型制造等各个行业ERP、CRM、SCM、OA等越来越多的IT系统得以成功实施，这些分散建设的IT系统为各部门的运营效率提升发挥了很大的作用. 同时，为了满足业务管理和决策的报表系统（包括传统报表、数据仓库、OLAP等）也被创建出来，企业主管通过报表了解企业的总体运行状态.

开源OLAP引擎综评：HAWQ、Presto、ClickHouse

- - InfoQ推荐

谈到大数据就会联想到Hadoop、Spark整个生态的技术栈. 大家都知道开源大数据组件种类众多，其中开源OLAP引擎包含Hive、SparkSQL、Presto、HAWQ、ClickHouse、Impala、Kylin等. 当前企业对大数据的研究与应用日趋理性，那么，如何根据业务特点，选择一个适合自身场景的查询引擎呢.

web-scale OLAP系统应用解决方案

- - 冰火岛

为了支持linkedin在线应用“Who’s Viewed My Profile?” 和 “Who’s Viewed This Job?”等等. 构建OLAP 一个可伸缩和快速的serving system called Avatara to solve this many, small cubes problem.

Kylin：基于Hadoop的开源数据仓库OLAP分析引擎

- - 标点符

Kylin是一个开源、分布式的OLAP分析引擎，它由eBay公司开发，并且基于Hadoop提供了SQL接口和OLAP接口，能够支持TB到PB级别的数据量. OLAP即联机分析处理，它能够帮助分析人员、管理人员或执行人员从多角度快速、一致、交互地存取信息和更加深入的了解信息. OLAP的目标是满足决策支持或者满足在多维环境下特定的查询和报表需求.

MySQL与OLAP：分析型SQL查询最佳实践探索

- - Web前端 - ITeye博客

搞点多维分析，糙快猛的解决方案就是使用ROLAP（关系型OLAP）了. 数据经维度建模后存储在MySQL，ROLAP引擎（比如开源的Mondrian）负责将OLAP请求转化为SQL语句提交给数据库. OLAP计算分析功能导致MySQL需要进行较多复杂SQL查询，性能调优必不可少，本文总结了一些实用原则.

Olap全称为在线联机分析应用，是一种对于多维数据分析查询的解决方案. 典型的Olap应用场景包括销售、市场、管理等商务报表，预算决算，经济报表等等. 最早的Olap查询工具是发布于1970年的Express，然而完整的Olap概念是在1993年由关系数据库之父 Edgar F.Codd 提出，伴随而来的是著名的“twelve laws of online analytical processing”.

唯品会海量实时OLAP分析技术升级之路

本文根据谢麟炯老师在〖DAMS 2017中国数据资产管理峰会〗现场演讲内容整理而成。

讲师介绍

1.海量数据实时OLAP场景的困境

大数据

慢查询

长迭代

2.唯品会大数据实时OLAP升级过程

第0阶段

第1阶段

第2阶段

第3阶段

第3.5阶段

第4阶段

3.唯品会在开源计算引擎上所做的改进

Presto上的改进

Kylin上的改进

4. OLAP方案升级方向

相关 [唯品会实时 olap] 推荐：