为什么很多公司的大数据相关业务都基于 Hadoop 方案？

- - 知乎每日精选

选择Hadoop的原因最重要的就是这三点：1，可以解决问题； 2，成本低； 3，成熟的生态圈. 一，Hadoop帮助我们解决了什么问题. 无论国内还是国外的大公司对于数据都有着无穷无尽的渴望，都会想尽一切办法收集一切数据，. 因为通过信息的不对称性可以不断变现，而大量的信息是可以通过数据分析得到的.

大数据公司Amazon

- - 36氪 | 关注互联网创业

说到 Amazon，它通常给人的印象是一家典型的电商公司——创办于1995年，靠在线书籍销售业务起家，发展至今也已颇具规模. 近日，TechCrunch作者Alex Williams撰文称，Amazon其实并非一家贸易公司，而是一家大数据公司. 联想到Amazon CEO Jeff Bezos曾说过的一句话：“企业家应该愿意在很长一段时间内承受误解的目光.

　　也许你并不需要大数据. 　　2012年“大数据”的发展如火如荼，然而本文的作者，数据分析公司SiSense副总裁BrunoAziza却认为并不是每个人都需要大数据. 从社交媒体初创公司到纽约的中央公园，每个公司似乎都在部署大数据分析. 　　著名数据分析公司Gartner的数据似乎也在证明这一点：最近的一份报告显示，大数据将带动2012年全球280亿美元的IT支出，到2016年这个数字将超过2300亿美元.

大数据排序或取重或去重相关问题

- - 学着站在巨人的肩膀上

给定a、b两个文件，各存放50亿个url，每个url各占64字节，内存限制是4G，让你找出a、b文件共同的url. 方案1：可以估计每个文件安的大小为50G×64=320G，远远大于内存限制的4G. 所以不可能将其完全加载到内存中处理. s 遍历文件a，对每个url求取，然后根据所取得的值将url分别存储到1000个小文件（记为）中.

大数据/数据挖掘/推荐系统/机器学习相关资源

- - 互联网分析沙龙

Share my personal resources，本文贡献者为Zhe Yu. 各种书~各种ppt~更新中~ http://pan.baidu.com/s/1EaLnZ. 机器学习经典书籍小结 http://www.cnblogs.com/snake-hand/archive/2013/06/10/3131145.html.

机器学习及大数据相关面试的职责和面试问题

- - IT瘾-bigdata

· 机器学习、大数据相关岗位的职责. 各个企业对这类岗位的命名可能有所不同，比如推荐算法/数据挖掘/自然语言处理/机器学习算法工程师，或简称算法工程师，还有的称为搜索/推荐算法工程师，甚至有的并入后台工程师的范畴，视岗位具体要求而定. 机器学习、大数据相关岗位的职责. 根据业务的不同，岗位职责大概分为：.

普通程序员，如何转为当前紧缺的大数据相关人才?

- - IT瘾-bigdata

前段时间跟候选人聊天，一个有多年工作经验的资深 iOS 工程师告诉我，他最近正在学习 Machine Learning 相关的知识. 他觉得，对于程序员来说，技术进步大大超过世人的想象，如果你不跟随时代进步，就会落后于时代. 我其实已经听过很多人跟我说过类似的话. 只不过不同人嘴里提到的词汇各有不同——大数据、数据挖掘、机器学习、人工智能…… 这些当前火热的概念各有不同，又有交叉，总之都是推动我们掌控好海量数据，并从中提取到有价值信息的技术.

LinkedIn收购名片扫描公司CardMunch，免费提供相关服务

- 三心 - 36氪

职业社交网站LinkedIn刚刚收购了名片扫描技术公司CardMunch，这家公司的应用可以通过扫描名片，然后通过Mechanical Turk把名片信息转化成手机通讯录. 过去CardMunch的名片扫描服务应用零售价为2.99美元，扫描前十张名片免费，在此基础上每增加一张收费25美分. 现在该服务将免费，而且会给那些用信用卡购买的用户提供退款.

创业公司“猜猜街”引入“游戏化”营销模式，用户猜中与商家相关的问题即有奖

- 高春辉 - 36氪

“游戏化”营销是一个较新的趋势，其最主要的特点是能引起用户的互动和参与. 创业公司“猜猜街”就致力于通过深度整合“游戏化”营销为商家带去巨大的流量. 该网站的主要服务对象是商家和大众消费者. 商家可以在该网站发起一个竞猜活动，比如下图猜对该纽扣的直径即有奖：. 由于答案可以在该商家的店铺内找到，因而许多用户都会点进到商家店铺里去，为商家带去许多流量和关注.

谈大数据(2)

- - 人月神话的BLOG

对于大数据，后面会作为一个系列来谈，大数据涉及的方面特别多，包括主数据，数据中心和ODS，SOA，云计算，业务BI等很多方面的内容. 前面看到一个提法，即大数据会让我们更加关注业务方面的内容，而云平台则更多是技术层面的内容. 对于大数据会先把各个理解的关键点谈完了，再系统来看大数据的完整解决方案和体系化.

为什么很多公司的大数据相关业务都基于 Hadoop 方案？

相关 [公司大数据相关] 推荐：