架构师详解：从0-1构建大数据平台

- - IT瘾-tuicool

如今大数据在各行业的应用越来越广泛：运营基于数据关注运营效果，产品基于数据分析关注转化率情况，开发基于数据衡量系统优化效果等. 美图公司有美拍、美图秀秀、美颜相机等十几个 app，每个 app 都会基于数据做个性化推荐、搜索、报表分析、反作弊、广告等，整体对数据的业务需求比较多、应用也比较广泛. 因此美图数据技术团队的业务背景主要体现在：业务线多以及应用比较广泛.

大数据下的数据分析平台架构

- vento - 《程序员》杂志官网

随着互联网、移动互联网和物联网的发展，谁也无法否认，我们已经切实地迎来了一个海量数据的时代，数据调查公司IDC预计2011年的数据总量将达到1.8万亿GB，对这些海量数据的分析已经成为一个非常重要且紧迫的需求. 作为一家互联网数据分析公司，我们在海量数据的分析领域那真是被“逼上梁山”. 多年来在严苛的业务需求和数据压力下，我们几乎尝试了所有可能的大数据分析方法，最终落地于Hadoop平台之上.

腾讯大数据平台质量保障之道

- - 标点符

大数据时代，业界各巨头都在投入重兵打造自己的大数据平台，分析挖掘蕴藏在数据金矿中的价值. 在腾讯数据平台部承建了公司级大数据平台，腾讯的测试团队也有幸一起搭上了大数据的航母. 因为大数据平台的技术复杂度、机器规模、容量、发展速度等都远非传统的后台系统可比，以前积累的测试方法和建设的工具平台很多并不适用于大数据测试，业界也没有很成熟的方法可以借鉴.

如何挑选合适的大数据或Hadoop平台

- - 互联网旁观者

今年，大数据在很多公司都成为相关话题. 虽然没有一个标准的定义来解释何为 “大数据”，但在处理大数据上，Hadoop已经成为事实上的标准. IBM、Oracle、SAP、甚至Microsoft等几乎所有的大型软件提供商都采用了Hadoop. 然而，当你已经决定要使用Hadoop来处理大数据时，首先碰到的问题就是如何开始以及选择哪一种产品.

Ambari 跟 Hadoop 等开源软件一样，也是 Apache Software Foundation 中的一个项目，并且是顶级项目. 目前最新的发布版本是 2.0.1，未来不久将发布 2.1 版本. 就 Ambari 的作用来说，就是创建、管理、监视 Hadoop 的集群，但是这里的 Hadoop 是广义，指的是 Hadoop 整个生态圈（例如 Hive，Hbase，Sqoop，Zookeeper 等），而并不仅是特指 Hadoop.

大数据平台在互联网行业的应用

- - CSDN博客综合推荐文章

本文是58同城信息系统部高级经理余中洋对大数据在互联网行业应用的总结. 以实际经验讲解了大数据从雏形到发展，以及发展过程中传统数据仓库到大数据平台的转化和大数据的可视化应用. 所有公司在一开始时，数据的建设都是比较落后的，但随着互联网的环境推动，以及公司计划2013年在纽约交易所上市，这时候面临一个很大的问题.

浅谈大数据平台基建的逻辑

- - 透明思考

这篇文章主要目的是面向初接触大数据的朋友简单介绍大数据平台基础建设所需要的各个模块以及缘由. 按照 Ralph Hughes的观点，企业数据仓库参考架构由下列几层构成：. 接入层（Landing）：以和源系统相同的结构暂存原始数据. 整合层（Integration）：持久存储整合后的企业数据，针对企业信息实体和业务事件建模，代表组织的“唯一真相来源”.

Uber 大数据平台的演进（2014~2019）

- - IT瘾-dev

也可以到我个人博客阅读（点击下面阅读原文即可） https://www.iteblog.com/archives/2557.html. Uber 致力于在全球市场上提供更安全，更可靠的运输服务. 为了实现这一目标，Uber 在很大程度上依赖于数据驱动的决策，从预测高流量事件期间骑手的需求到识别和解决我们的驾驶员-合作伙伴注册流程中的瓶颈.

架构师详解：从0-1构建大数据平台

美图数据平台整体架构

数据平台的阶段性发展

从 0 到 1

数据开放

总结

相关 [架构师大数据平台] 推荐：