数据仓库的架构与设计

差异项	数据库	数据仓库
特征	操作处理	信息处理
面向	事务	分析
用户	DBA、开发	经理、主管、分析人员
功能	日常操作	长期信息需求、决策支持
DB设计	基于ER模型，面向应用	星形/雪花模型，面向主题
数据	当前的、最新的	历史的、跨时间维护
汇总	原始的、高度详细	汇总的、统一的
视图	详细、一般关系	汇总的、多维的
工作单元	短的、简单事务	复杂查询
访问	读/写	大多为读
关注	数据进入	信息输出
操作	主键索引操作	大量的磁盘扫描
用户数	数百到数亿	数百
DB规模	GB到TB	`>=`TB
优先	高性能、高可用性	高灵活性
度量	事务吞吐量	查询吞吐量、响应时间

- - CSDN博客推荐文章

公司之前的数据都是直接传到Hdfs上进行操作，没有一个数据仓库，趁着最近空出几台服务器，搭了个简陋的数据仓库，这里记录一下数据仓库的一些知识. 数据仓库多维数据模型的设计. 数据仓库是一个面向主题的、集成的、随时间变化的、但信息本身相对稳定的数据集合，用于对管理决策过程的支持. 这个定义的确官方，但是却指出了数据仓库的四个特点.

数据仓库的设计与开发

- - 数据库 - ITeye博客

数据仓库系统的设计与开发. 1) 收集和分析业务需求. 用户需求，管理人员需求. 2) 建立数据模型和数据仓库的物理设计. 概念模型，逻辑模型，物理模型. 3) 定义数据源. 数据源面向应用，不是面向主题，而且数据源之间存在多个不一致的情况，所以必须在已有的系统中定义记录系统（内容正确，在多个数据源间起决定作用的操作型数据源）.

oracle数据仓库设计指南

- - 数据库 - ITeye博客

ODS（Operational Data Store）是数据仓库体系结构中的一个可选部分，ODS具备数据仓库的部分特征和OLTP系统的部分特征，它是“面向主题的、集成的、当前或接近当前的、不断变化的”数据. 一般在带有ODS的系统体系结构中，ODS都设计为如下几个作用：. 1 ）在业务系统和数据仓库之间形成一个隔离层.

**简介：**分层架构很容易在各种书籍和文档中去理解，但是把建模方法和分层架构放在一起就会出现很多困惑了. 接下来，我会从数据研发与建模的角度，演进一下分层架构的设计原因与层次的意义. 分层架构很容易在各种书籍和文档中去理解，但是把建模方法和分层架构放在一起就会出现很多困惑了. 之所以会有分层架构，最主要的原因还是要把复杂冗长的数据吹流程分拆成一些有明确目的意义的层次，这样复杂就被拆解为一些相对简单小的模块.

美团DB数据同步到数据仓库的架构与实践

- - 美团点评技术团队

在数据仓库建模中，未经任何加工处理的原始业务层数据，我们称之为ODS(Operational Data Store)数据. 在互联网企业中，常见的ODS数据有业务日志数据（Log）和业务DB数据（DB）两类. 对于业务DB数据来说，从MySQL等关系型数据库的业务数据进行采集，然后导入到Hive中，是进行数据仓库生产的重要环节.

【漫谈数据仓库】如何优雅地设计数据分层

- -

本文主要讲解数据仓库的一个重要环节：如何设计数据分层. 其它关于数据仓库的内容可参考之前的文章. 本文对数据分层的讨论适合下面一些场景，超过该范围场景or数据仓库经验丰富的大神就不必浪费时间看了. 数据建设刚起步，大部分的数据经过粗暴的数据接入后就直接对接业务. 数据建设发展到一定阶段，发现数据的使用杂乱无章，各种业务都是从原始数据直接计算而得.

数据仓库

- Ran - Linux@SOHU

翻译：马少兵、曾怀东、朱翊然、林业. 尽管服务器存储、处理能力得到有效的提高，以及服务器价格的降低，让人们能够负担起大量的服务器，但是商业软件应用和监控工具快速的增加，还是使得人们被大量的数据所困扰. 在数据仓库领域中的许多系统管理员、应用开发者，以及初级数据库管理员发现，他们正在处理“海量数据”-不管你准备与否-都会有好多不熟悉的术语，概念或工具.

数据仓库简介、发展、架构演进、实时数仓建设、与离线数仓对比

- - zhisheng的博客

数据仓库也是公司数据发展到一定规模后必然会提供的一种基础服务，数据仓库的建设也是“数据智能”中必不可少的一环. 本文将从数据仓库的简介、经历了怎样的发展、如何建设、架构演变、应用案例以及实时数仓与离线数仓的对比六个方面全面分享关于数仓的详细内容. 原地地址： https://ververica.cn/developers/how-to-do-real-time-counting/.

漫谈数据仓库之拉链表（原理、设计以及在Hive中的实现）

- - IT瘾-bigdata

本文将会谈一谈在数据仓库中拉链表相关的内容，包括它的原理、设计、以及在我们大数据场景下的实现方式. 先分享一下拉链表的用途、什么是拉链表. 通过一些小的使用场景来对拉链表做近一步的阐释，以及拉链表和常用的切片表的区别. 举一个具体的应用场景，来设计并实现一份拉链表，最后并通过一些例子说明如何使用我们设计的这张表（因为现在Hive的大规模使用，我们会以Hive场景下的设计为例）.

数据仓库概念

- - 互联网 - ITeye博客

数据仓库：是一个数据库环境，它提供用户用于决策支持的当前和历史数据，这些数据在传统的数据库中不方便得到. 特点：面向主题，集成的，相对稳定的，反应历史变化的. 组成：数据仓库的数据库，数据抽取工具，元数据，访问工具，数据集市，数据仓库管理，信息发布系统. 数据挖掘：就是从大量数据中获取有效的，新颖的，潜在有用的，最终可理解的模式的过程.

数据仓库的架构与设计

1. 什么是数据仓库

1.1 数据仓库的概念

1.2 数据仓库的用途

1.3 数据库和数据仓库的区别

2. 数据仓库的架构

2.1 当前架构

2.2 理想架构

3. 数据仓库多维数据模型的设计

3.1 基本概念

3.2 数据仓库设计步骤

相关 [数据仓库架构设计] 推荐：