Uber 大数据平台的演进（2014~2019）

- - IT瘾-dev

也可以到我个人博客阅读（点击下面阅读原文即可） https://www.iteblog.com/archives/2557.html. Uber 致力于在全球市场上提供更安全，更可靠的运输服务. 为了实现这一目标，Uber 在很大程度上依赖于数据驱动的决策，从预测高流量事件期间骑手的需求到识别和解决我们的驾驶员-合作伙伴注册流程中的瓶颈.

Uber 是如何利用大数据的

- - 博客 - 伯乐在线

这篇文章概述了 Uber 是如何利用大数据分析实现商业上的成功. 文章首次发表于作者在 Data Science Central 的专栏中. Uber 是一款基于智能手机应用的出租车预定服务，将需要出行的用户和愿意提供驾驶服务的司机联结起来. 由于传统出租车的司机认为这破坏了他们的生计，而且大众对 Uber 对司机在管理上的不足也有所顾虑，这项服务已经引起了巨大的争议.

大数据下的数据分析平台架构

- vento - 《程序员》杂志官网

随着互联网、移动互联网和物联网的发展，谁也无法否认，我们已经切实地迎来了一个海量数据的时代，数据调查公司IDC预计2011年的数据总量将达到1.8万亿GB，对这些海量数据的分析已经成为一个非常重要且紧迫的需求. 作为一家互联网数据分析公司，我们在海量数据的分析领域那真是被“逼上梁山”. 多年来在严苛的业务需求和数据压力下，我们几乎尝试了所有可能的大数据分析方法，最终落地于Hadoop平台之上.

腾讯大数据平台质量保障之道

- - 标点符

大数据时代，业界各巨头都在投入重兵打造自己的大数据平台，分析挖掘蕴藏在数据金矿中的价值. 在腾讯数据平台部承建了公司级大数据平台，腾讯的测试团队也有幸一起搭上了大数据的航母. 因为大数据平台的技术复杂度、机器规模、容量、发展速度等都远非传统的后台系统可比，以前积累的测试方法和建设的工具平台很多并不适用于大数据测试，业界也没有很成熟的方法可以借鉴.

如何挑选合适的大数据或Hadoop平台

- - 互联网旁观者

今年，大数据在很多公司都成为相关话题. 虽然没有一个标准的定义来解释何为 “大数据”，但在处理大数据上，Hadoop已经成为事实上的标准. IBM、Oracle、SAP、甚至Microsoft等几乎所有的大型软件提供商都采用了Hadoop. 然而，当你已经决定要使用Hadoop来处理大数据时，首先碰到的问题就是如何开始以及选择哪一种产品.

Ambari 跟 Hadoop 等开源软件一样，也是 Apache Software Foundation 中的一个项目，并且是顶级项目. 目前最新的发布版本是 2.0.1，未来不久将发布 2.1 版本. 就 Ambari 的作用来说，就是创建、管理、监视 Hadoop 的集群，但是这里的 Hadoop 是广义，指的是 Hadoop 整个生态圈（例如 Hive，Hbase，Sqoop，Zookeeper 等），而并不仅是特指 Hadoop.

大数据平台在互联网行业的应用

- - CSDN博客综合推荐文章

本文是58同城信息系统部高级经理余中洋对大数据在互联网行业应用的总结. 以实际经验讲解了大数据从雏形到发展，以及发展过程中传统数据仓库到大数据平台的转化和大数据的可视化应用. 所有公司在一开始时，数据的建设都是比较落后的，但随着互联网的环境推动，以及公司计划2013年在纽约交易所上市，这时候面临一个很大的问题.

浅谈大数据平台基建的逻辑

- - 透明思考

这篇文章主要目的是面向初接触大数据的朋友简单介绍大数据平台基础建设所需要的各个模块以及缘由. 按照 Ralph Hughes的观点，企业数据仓库参考架构由下列几层构成：. 接入层（Landing）：以和源系统相同的结构暂存原始数据. 整合层（Integration）：持久存储整合后的企业数据，针对企业信息实体和业务事件建模，代表组织的“唯一真相来源”.

Uber 大数据平台的演进（2014~2019）

第一代：Uber 大数据平台的开端

不足

第二代： Hadoop 的引入

不足

第三代：从长远角度重新构建大数据平台

Hudi 介绍

第四代：展望

数据质量

数据延迟

数据效率

扩展性和可靠性

相关 [uber 大数据平台] 推荐：