雅虎考虑剥离Hadoop

标签: yahoo | 发表时间:2011-04-27 14:25 | 作者:blackhat Zhifeng
出处:http://solidot.org/
《华尔街日报》报导,雅虎正考虑剥离旗下知名的Hadoop工程部门,成立一家独立的公司,预计其价值将在10亿美元左右。 从2005年起,雅虎开始开发数据分析软件和分布式文件系统Hadoop。今天,已经有数千家公司使用Hadoop分析大容量数据,其中包括了雅虎、eBay、Facebook、Twitter,以及Visa和IBM等。IBM的Watson问答系统便是使用Hadoop处理数据。WSJ引用熟悉雅虎事务的消息人士的话称,雅虎考虑将Hadoop工程团队剥离出去,成立一家技术公司,继续开发开源软件Hadoop,以及为企业客户提供付费服务。雅虎发言人拒绝对此发表评论。


相关 [雅虎 考虑 hadoop] 推荐:

雅虎考虑剥离Hadoop

- Zhifeng - Solidot
《华尔街日报》报导,雅虎正考虑剥离旗下知名的Hadoop工程部门,成立一家独立的公司,预计其价值将在10亿美元左右. 从2005年起,雅虎开始开发数据分析软件和分布式文件系统Hadoop. 今天,已经有数千家公司使用Hadoop分析大容量数据,其中包括了雅虎、eBay、Facebook、Twitter,以及Visa和IBM等.

使用Hadoop前十项重要考虑

- - 互联网 - ITeye博客
关键字:使用Hadoop前十项重要考虑. 摘要:Hadoop让大数据分析走向了大众化,然而它的部署仍需耗费大量的人力和物力. 在直奔Hadoop之前,是否已经将现有技术推向极限. 这里总结了对Hadoop投资前可以尝试的10个替代方案,省时、省钱、省力,何乐而不为. 让业务搭乘大数据技术确实是件非常有吸引力的事情,而Apache Hadoop让这个诱惑来的更加的猛烈.

为解决扩展性瓶颈雅虎计划重构Hadoop-MapReduce

- 阿贡 - ITeye资讯频道
最近雅虎开发者博客发了一篇介绍Hadoop重构计划的文章. 因为他们发现当集群的规模达到4000台机器的时候,Hadoop遭遇到扩展性的瓶颈,目前他们正准备开始对Hadoop进行重构. Mapreduce面临的瓶颈. 从集群大小和工作量中观察到的趋势是,MapReduce的JobTracker需要彻底改革,以解决其可扩展性,内存消耗,线程模型,可靠性和性能的几个缺陷.

雅虎前CEO塞梅尔建言:不得考虑再聘用巴茨

- 品味视界 - cnBeta.COM
据国外媒体报道,雅虎前CEO特里・塞梅尔(Terry Semel)周一在一次媒体领袖大会上向自己的“老东家”雅虎提出建议,称如果雅虎希望实现“东山再起”目标,就不得考虑再次聘用本月初刚刚被雅虎董事会解雇的前CEO卡罗尔・巴茨(Carol Bartz). 塞梅尔当天在美国媒体网站TheWrap主持召开的2011年度TheGrill媒体领袖大会上作出了上述表示.

雅虎之殇

- ItTalks - 《商业价值》杂志
雅虎在这些年里真正欠缺的不是工程师,不是创新能力,也不是战略方向,而是创始人对公司的掌控力. 9月24日,雅虎董事长罗伊·博斯托克、联合创始人大卫·费罗和杨致远周五共同向员工发出备忘录,称公司顾问已与多方展开接触,公司将在数月内确定战略选择. 备忘录表示,雅虎的战略评估可能会耗时“数月,而非数周”.

Hadoop Streaming 编程

- - 学着站在巨人的肩膀上
Hadoop Streaming是Hadoop提供的一个编程工具,它允许用户使用任何可执行文件或者脚本文件作为Mapper和Reducer,例如:. 采用shell脚本语言中的一些命令作为mapper和reducer(cat作为mapper,wc作为reducer). 本文安排如下,第二节介绍Hadoop Streaming的原理,第三节介绍Hadoop Streaming的使用方法,第四节介绍Hadoop Streaming的程序编写方法,在这一节中,用C++、C、shell脚本 和python实现了WordCount作业,第五节总结了常见的问题.

Hadoop使用(一)

- Pei - 博客园-首页原创精华区
Hadoop使用主/从(Master/Slave)架构,主要角色有NameNode,DataNode,secondary NameNode,JobTracker,TaskTracker组成. 其中NameNode,secondary NameNode,JobTracker运行在Master节点上,DataNode和TaskTracker运行在Slave节点上.

Hadoop MapReduce技巧

- - 简单文本
我在使用Hadoop编写MapReduce程序时,遇到了一些问题,通过在Google上查询资料,并结合自己对Hadoop的理解,逐一解决了这些问题. Hadoop对MapReduce中Key与Value的类型是有要求的,简单说来,这些类型必须支持Hadoop的序列化. 为了提高序列化的性能,Hadoop还为Java中常见的基本类型提供了相应地支持序列化的类型,如IntWritable,LongWritable,并为String类型提供了Text类型.

Hadoop TaskScheduler浅析

- - kouu's home
TaskScheduler,顾名思义,就是MapReduce中的任务调度器. 在MapReduce中,JobTracker接收JobClient提交的Job,将它们按InputFormat的划分以及其他相关配置,生成若干个Map和Reduce任务. 然后,当一个TaskTracker通过心跳告知JobTracker自己还有空闲的任务Slot时,JobTracker就会向其分派任务.

HADOOP安装

- - OracleDBA Blog---三少个人自留地
最近有时间看看hadoop的一些东西,而且在测试的环境上做了一些搭建的工作. 首先,安装前需要做一些准备工作. 使用一台pcserver作为测试服务器,同时使用Oracle VM VirtualBox来作为虚拟机的服务器. 新建了三个虚拟机以后,安装linux,我安装的linux的版本是redhat linux 5.4 x64版本.