大数据创业的五点须知

标签: 动态 大数据 mesos 大数据创业 大数据市场 | 发表时间:2013-08-08 08:43 | 作者:Cashcow
出处:http://www.ctocio.com

big data road sign

大数据是当今最热门的科技词汇,同时也是最困难的创业项目。CSC对Infochimps的收购表明,那些无法顺利拿到第二轮融资的大数据创业公司面临着要么关张,要么被人收购的命运,例如Drawn to Scale、Ravel Data和Nodeable等,当然还有很多很多大家没有注意到的大数据创业公司。

Gigaom作者Derrick Harris近日就大数据创业公司的成长和融资问题 撰文指出,大数据创业公司要想生存发展并赢得投资人的芳心必须注意一下几点:明智地选择你的战场和目标用户并围绕你的技术建立社区。大数据需要的不是啦啦队,而是实干家。Harris的观点可以归纳为五点,IT经理网摘译整理如下:

1.基础设施非常难

不仅开发基础设施技术产品很难,销售起来也很难,具体到大数据基础设施工具如Hadoop、NoSQL数据库和流处理系统则更是难上加难。客户需要大量培训和教育,付费哟娜谷需要大量支持和及时跟进的产品开发工作。

这意味着需要大量的资金支持,例如Greenplum在2010年获得1亿美元投资但仍然不足以完成所有工作,最终不得不选择卖给EMC。今天最出名的几家大数据创业公司融的钱更多,例如Cloudera。基础设施类的大数据创业公司通常需要数百万美元种子资金启动,但是A轮融资的道路异常艰辛。

big data VC

新兴的大数据创业公司还必须与那些在客户那里已经有一些知名度甚至合作项目的公司竞争,例如Cloudera、Hortonworks、10gen、亚马逊AWS、IBM、Oracle等。

反观大数据应用创业则相对简单的多,无论面向垂直行业应用还是 数据可视化这样的通用大数据应用都是如此。因为这些大数据应用的价值对于客户来说更为直观,距离业务也更近,进入企业IT系统的摩擦也更小。

 

2.云计算是朋友

无论你是销售大数据基础设施还是应用,云计算都是更有效的业务载体。选择云计算不仅仅是在云端托管,更重要的是通过云计算向客户提供服务。你将拥有更多控制权,同时在有限的资源上优化运行也会让你对产品的理解更加透彻。

云计算也降低了潜在用户试用产品的成本和门槛,从NewRelic到亚马逊AWS都从云计算+大数据模式中获益。

参考阅读: 大数据与云计算是天作之合

3.开发者是朋友

如果你主要从事大数据分析,例如 ClearStory、Platfora或者CRM营销应用,数据分析师就是你的朋友。无论那种情况,最好的办法就是围绕以开发者和市场人员为主的目标受众进行开发和营销工作,CIO反而不是很好的目标受众!

专注CIO而非开发者往往会导致你在实际签约时碰到棘手问题。围绕开发者营销的战术被很多云计算创业公司和纯大数据软件公司所采用,例如Splunk和Tableau。

再比如Infochimps和Continuuity的产品类似(两者都被迫按落云头,迫降在用户数据中心),但Continuuity完全面向开发者,这意味着能积累更多技术粉丝。

4.将数据科学家推向前台中央

这既是市场也是销售策略,数据科学家才是能够展示数据和平台威力的人,他们也是会议上最受欢迎的演讲者。

但大数据科学家也需要慎重选择传播内容。如今大家都接受了Hadoop和NoSQL,所以没必要每次开会言必称4V之类的科普。至于如何配置和集成大数据系统也只能吸引小部分听众,除非你的项目规模超大。

Cloudera比竞争对手出名的原因有很多,但其中Jeff hammerbacher绝对是一位举足轻重的人物。不要空谈大数据大数据的价值和架构,站在听众的立场说说具体能做哪些分析,如何做。

5.开源有多重要,取决于你自己

几乎所有的大数据公司都依赖开源软件,有些是“借”来的,如Hadoop、Storm以及各种数据库,有些是自行开发的,有些则是混合模式,例如在HBase上增加的一些功能应用。这些开源项目如此流行是因为社区的力量。

开源绝不是看起来那么轻松,不是说你在Github上放点代码就谈得上回馈社区了。开源的目的是将使用相同代码的人聚拢成社区,并不断改进代码。这里与第三点中我们提到的吸引开发者有关。只有更多的用户和开发者对你产生兴趣了,在你的产品上花时间和精力了,才有可能最终掏钱。

不计其数的创业公司都将代码开源了,但那些真正能推动项目并建设社区的公司才能脱颖而出。例如Neo Technology的Neo4j、Concurrent的Casading以及10gen的MongoDB。甚至Twitter这样面向大众的公司都开源了Storm和 Mesos等项目。

相关 [大数据 创业] 推荐:

大数据创业的五点须知

- - IT经理网
大数据是当今最热门的科技词汇,同时也是最困难的创业项目. CSC对Infochimps的收购表明,那些无法顺利拿到第二轮融资的大数据创业公司面临着要么关张,要么被人收购的命运,例如Drawn to Scale、Ravel Data和Nodeable等,当然还有很多很多大家没有注意到的大数据创业公司.

互联网大数据时代袭来:蕴藏创业空间待挖掘

- - 行业资讯
  编者按/60秒钟,Flicker上会有3125张照片上传,Facebook上新发布70万条信息,YouTube有200万次观赏. 图片、声音、文字以及这背后用户的习惯和轨迹构成了互联网上的数据资源,大数据时代迎面袭来.   用户的消费习惯、兴趣爱好、关系网络以及整个互联网的趋势、潮流都将成为互联网从业者关注的热点,而这一切的获取和分析都离不开大数据.

听李开复谈趋势:大数据创业,智能电视,企业级产品

- - PingWest
今天在 极客公园的大会上,创新工场CEO李开复和在场的开发者畅谈了对于新一年中国互联网行业发展趋势,和他作为投资人的分享. 我们就截取从中对于开发这里来说值得关注的几个点:. 目前中国智能移动设备已达到2亿,并朝着5亿的方向前进,这里充满了机会. 但同时,竞争也会非常激烈,3大互联网巨头,以及众多互联网公司都在投入更多的精力到移动互联网.

谈大数据(2)

- - 人月神话的BLOG
对于大数据,后面会作为一个系列来谈,大数据涉及的方面特别多,包括主数据,数据中心和ODS,SOA,云计算,业务BI等很多方面的内容. 前面看到一个提法,即大数据会让我们更加关注业务方面的内容,而云平台则更多是技术层面的内容. 对于大数据会先把各个理解的关键点谈完了,再系统来看大数据的完整解决方案和体系化.

大数据之惑

- - 互联网分析
算起来,接触大数据、和互联网之外的客户谈大数据也有快2年了. 也该是时候整理下一些感受,和大家分享下我看到的国内大数据应用的一些困惑了. 云和大数据,应该是近几年IT炒的最热的两个话题了. 在我看来,这两者之间的不同就是: 云是做新的瓶,装旧的酒; 大数据是找合适的瓶,酿新的酒. 云说到底是一种基础架构的革命.

白话大数据

- - 互联网分析
这个时代,你在外面混,无论是技术还是产品还是运营还是商务,如果嘴里说不出“大数据”“云存储”“云计算”,真不好意思在同行面前抬头. 是千万级别的用户信息还是动辄XXXTB的数据量. 其实,大数据在我的眼里,不是一门技术,而是一种技能,从数据中去发现价值挖掘价值的技能. ”当我掷地有声用这句话开场时,正好一个妹子推门而入,听到这句话,微微一怔,低头坐下.

交通大数据

- - 人月神话的BLOG
本文简单谈下智慧交通场景下可能出现的大数据需求和具体应用价值. 对于公交线路规划和设计是一个大数据潜在的应用场景,传统的公交线路规划往往需要在前期投入大量的人力进行OD调查和数据收集. 特别是在公交卡普及后可以看到,对于OD流量数据完全可以从公交一卡通中采集到相关的交通流量和流向数据,包括同一张卡每天的行走路线和换乘次数等详细信息.

全球10大数据库

- - 译言-电脑/网络/数码科技
原文: Fiorenttini   译者: julie20098. [非商业性转载必须注明译者julie20098和相关链接. ,否则视为侵权,追究转载责任. 世界气候数据中心:气候全球数据中心, 220TB 的网络数据, 6PB 的其它数据. 国家能源研究科学计算中心,有 2.8PB 容量.

谈大数据分析

- - 人月神话的BLOG
对于数据分析层,我们可以看到,其核心重点是针对海量数据形成一个分布式可弹性伸缩的,高查询性能的,支持标准sql语法的一个ODS库. 我们看到对于Hive,impala,InfoBright更多的都是解决这个层面的问题,即解决数据采集问题,解决采集后数据行列混合存储和压缩的问题,然后形成一个支撑标准sql预防的数据分析库.

大数据的一致性

- - 阳振坤的博客
看到了一篇关于数据一致性的文章:下一代NoSQL:最终一致性的末日. (  http://www.csdn.net/article/2013-11-07/2817420 ),其中说到: 相比关系型数据库,NoSQL解决方案提供了shared-nothing、容错和可扩展的分布式架构等特性,同时也放弃了关系型数据库的强数据一致性和隔离性,美其名曰:“最终一致性”.