如何在中国推进大数据服务?英特尔和Cloudera是这样合作的
大数据究竟是什么?在英特尔看来,这是继上一波云计算热潮之后的新热点,而依据在大数据方面有相当杰出表现的企业Cloudera看来,随着计算生活的进一步深入,“人类渴求测量任何可以量度的东西”,让这些数据为未来的生活工作服务,这是大数据的着眼点。
这话讲的还是有些概念化了。小到一家淘宝店主通过大数据分析,可以全盘掌握客流情况,甚至根据时间点、季节性、节庆等差异来调整店内产品布局,达到收益最大化;大到城市生活,比如城市交通,结合天气、地理位置、政策法规等多种因素,对交通具备了预测和指导意义。
今天下午,英特尔和Cloudera一起在上海对大数据这一命题再度进行了探讨。实际在今年3月份的时候,英特尔就已经和Cloudera开始进行合作,英特尔以7.4亿美元投资Cloudera,持股比例达到18%。随后在今年9月份,Cloudera(肯睿)公司完成在中国的注册,正式落户中国。今天的这场沟通会实际也成为Cloudera大中国区的开幕庆典。
英特尔在大数据时代扮演什么角色?
对我们这些普通人来说,很多人可能并不知道类似Cloudera这样的大数据公司究竟做哪些事情,他们所做的除了构建大数据平台,为企业等组织型客户提供大数据服务的基础,另外也做解决方案咨询和认证培训——Cloudera是在2008年创建的大数据公司,主要高层都是来自Facebook、谷歌、雅虎等企业的工程师,比如来到现场的Cloudera公司董事长Mike Olson先前就在甲骨文。这家公司在短短4年时间内,已经达到了10亿美元市值。
(Cloudera公司联合创始人、董事长、首席战略官Mike Olson)
至于英特尔和Cloudera的缘分得从英特尔自家的大数据产品IDH(Intel Apache Hadoop分发版)说起,简单说我们可以将之看做一个平台,需要大数据服务的企业等客户借助这一平台实现大数据服务。在3月份,英特尔在对Cloudera入股后,IDH这套产品就逐步并入到了Cloudera主导的CDH(Cloudera分发版)平台。
如英特尔亚太研发有限公司总经理何京翔所说,英特尔对大数据的关注和投入并不是一蹴而就的,就现在的合作情况来看,英特尔提供了更多包括服务器、存储、网络等硬件基础方面的支持,Cloudera的CDH大数据平台则建基其上,英特尔也正在建议现有的IDH客户全面转至CDH——这两者在构建团队上也有传承性。而且英特尔不光在芯片特性等方面做特别的支持,也会将在中国的ODM人脉贡献出来。
不光是开源 也是开放的标准
说到大数据就不得不谈Hadoop了,普通消费用户大概对Hadoop没有什么认识,要将Hadoop是什么说清楚也实在不是很容易。我们实际可以真正将之看做一个开源的平台,甚至可类比为Linux,是许多大数据服务实现的基础。这个平台在短短几年间就成为了事实上的标准,因为它在集群高速运算和存储方面具备了很多优势。
不过就像何京翔在问答环节说的那样,光有开源的平台还是不行,因为许多企业不可能花大量成本去基于此研发属于自己的大数据产品,而且在遇到问题的时候也无法保证以很快的速度解决。所以CDH即是建基于此,形似将Hadoop打包成企业级的服务,真正提供大数据服务的可靠性。
而且Mike Olson特别强调了,CDH中所有的项目都遵循开放的标准,这话指的是让客户都够在相同开放标准的平台间做选择切换,如果只是代码开源,客户仍有可能被锁定在一个平台上。也就是说,即便客户现在选择了CDH,也不会因为大量服务的依赖性而在将来无法摆脱这一平台。
用Cloudera公司副总裁凌琦的话来说,这就是在“逼迫Cloudera将工作做得更好”了,因为只有这样才能留住客户。这种策略就目前绝大部分提供企业服务的企业来看,还是显得相当有勇气的。
(英特尔亚太研发有限公司总经理何京翔,与Cloudera公司联合创始人、董事长、首席战略官Mike Olson)
有中国特色的大数据解决方案
Cloudera来到中国似乎深谙大数据在中国有自己与众不同的发展方向,而且实际上英特尔前期就已经积累了不少的经验。何京翔特别举例说,早前在国内发布IDH的时间特别做了提前,典型的应用像是电信账单查询,还有包括中国道路交通上的摄像头部署比国外多得多,所以在智能交通方面会有自己与众不同的需求。
而且英特尔也正在积极地与中国本地厂商合作,期望打造整个生态系统,未来Cloudera可以借助英特尔在国内的发展经验,以及积累的合作伙伴人脉做进一步有中国特色的大数据解决方案。
大数据是一个相当大型的命题,这不是一家企业可以独立完成的技术,甚至需要跨行业的合作。随着移动互联网的进一步发展,出现在这个世界上有价值的数据也越来越多,这些海量数据对企业而言是有相当价值的。“将计算带到数据中去”对现如今以应用和计算处理本身为核心的模式的做颠覆。以数据信息为中心的,在数据中创造价值即是Cloudera和英特尔在大数据技术上的方向。而且这些技术最终还是要惠及我们这些普通用户的,即便可能在大数据从英特尔的底层硬件到我们手中时已经辗转了很长的路径。