Doris 一种实时多维分析的解决方案

ColumnName	Type
user_id	BIGINT
age	INT
message	VARCHAR(100)
maxdwelltime	DATETIME
mindwelltime	DATETIME

ColumnName	Type
user_name	VARCHAR(20)
age	INT
message	VARCHAR(100)
maxdwelltime	DATETIME
mindwelltime	DATETIME

ColumnName	Type
user_id	BIGINT
age	INT
message	VARCHAR(100)
maxdwelltime	DATETIME
mindwelltime	DATETIME

ColumnName	Type
age	INT
user_id	BIGINT
message	VARCHAR(100)
maxdwelltime	DATETIME
mindwelltime	DATETIME

- - IT瘾-dev

Doris 这类 MPP 架构的 OLAP 数据库，通常都是通过提高并发，来处理大量数据的. 本质上，Doris 的数据存储在类似 SSTable（Sorted String Table）的数据结构中. 该结构是一种有序的数据结构，可以按照指定的列进行排序存储. 在这种数据结构上，以排序列作为条件进行查找，会非常的高效.

基于 Doris 的小程序用户增长实践

- - IT瘾-dev

分享嘉宾：赵煜杨百度资深研发工程师. 出品社区：DataFunTalk. 导读：本文的主题为基于Doris的小程序用户增长实践，将从实际案例出发介绍基于 Doris 用户分层解决方案，重点分享了项目中的难点和架构解决方案，以及怎么使用 Doris做用户分层，如何做到秒级的人数预估和快速产出用户包.

Apache Doris是由百度贡献的开源MPP分析型数据库产品，亚秒级查询响应时间，支持实时数据分析；分布式架构简洁，易于运维，可以支持10PB以上的超大数据集；可以满足多种数据分析需求，例如固定历史报表，实时数据分析，交互式数据分析和探索式数据分析等. ClickHouse是俄罗斯的搜索公司Yandex开源的MPP架构的分析引擎，号称比事务数据库快100-1000倍，团队有计算机体系结构的大牛，最大的特色是高性能的向量化执行引擎，而且功能丰富、可靠性高.

深度解析｜Apache Doris 索引机制解析

- - 掘金后端

Apache Doris 存储引擎采用类似 LSM 树的结构提供快速的数据写入支持. 进行数据导入时，数据会先写入 Tablet 对应的 MemTable 中，当 MemTable 写满之后，会将 MemTable 里的数据刷写（Flush）到磁盘，生成一个个不超过 256MB 的不可变的 Segment 文件.

多维分析OLAP引擎Mondrian学习

- - Web前端 - ITeye博客

随着信息技术的飞速发展，在电力、电信、金融、大型制造等各个行业ERP、CRM、SCM、OA等越来越多的IT系统得以成功实施，这些分散建设的IT系统为各部门的运营效率提升发挥了很大的作用. 同时，为了满足业务管理和决策的报表系统（包括传统报表、数据仓库、OLAP等）也被创建出来，企业主管通过报表了解企业的总体运行状态.

Mdrill：来自阿里的多维快速查询工具

- - 标点符

mdrill是阿里妈妈-adhoc-海量数据多维自助即席查询平台下的一个子项目. 旨在帮助用户在几秒到几十秒的时间内，分析百亿级别的任意维度组合的数据. mdrill是一个分布式的在线分析查询系统，基于hadoop,lucene,solr,jstorm等开源系统作为实现，基于SQL的查询语法. mdrill是一个能够对大量数据进行分布式处理的软件框架.

Facebook的实时Hadoop系统

- wangjia - Solrex Shuffling

Facebook 在今年六月 SIGMOD 2011 上发表了一篇名为“Apache Hadoop Goes Realtime at Facebook”的会议论文 (pdf)，介绍了 Facebook 为了打造一个实时的 HBase 系统使用到的独门秘技. 由于该论文提到的应用场景与小弟负责的系统要解决的问题域有相似之处，因而抽时间仔细阅读了这篇论文.

Storm 实时性分析

- - CSDN博客架构设计推荐文章

都说Storm是一个实时流处理系统，但Storm的实时性体现在什么方面呢. 首先有一个前提：这里的实时性和我们通常所说的实时系统（芯片+汇编或C编写的实时处理软件）的实时性肯定是没法比的，也不是同一个概念. 这里的实时性应该是一个相对的实时性（相对于Hadoop之类）. 总结一下，Storm的实时性可能主要体现在：.

storm准实时应用

- - CSDN博客推荐文章

1 应用背景：需要实时统计用户的登陆数，在线人数，活跃时间，下载等指标的数据，或者清洗后移到hdfs上. 1）客户端产生数据---. 2） kafka-生产者实时采集数据（保留7天）-----. 3） storm实时消费数据，处理数据. 4）把实时数据统计结果缓存到memcached 中.

开源的BI交互式多维报表设计和分析工具cboard

- -

Support to connect one of the most popular open source multi-dimensional analysis of products Saiku2, and will be able to selectively create data and graphics.

Doris 一种实时多维分析的解决方案

限制

数据存储结构

Aggregate 模型

Uniq模型

Duplicate 模型

数据模型的选择建议

前缀索引

物化视图（rollup）

ROLLUP 调整前缀索引

ROLLUP 的几点说明

分区和分桶

稀疏索引和 Bloom Filter

Broadcast/Shuffle Join

问题

总结

相关 [doris 实时多维] 推荐：