数据分析师的新发现:数据应用催生商业模式

标签: 分析视角 技术前沿 营销观点 | 发表时间:2013-05-08 20:21 | 作者:admin
出处:http://www.datakong.cn

QQ截图20130508202106

与点击广告相比,Jeff Hammerbacher相信,数据应用能够催生更多更好的商业模式。

文|CBN记者 李蓉慧

H= Jeff Hammerbacher Cloudera创始人

C= CBNweekly

C:你的数据挖掘工作始于华尔街投行Bear Stearn,那是怎样一份工作?

H:当时我是固定收益部的数据分析师,主要处理有关债权、抵押以及其他金融衍生工具的事务。我为交易员清理外汇期权的电子数据表。清除完成后,我还要通过复杂的随机微分方程把定价引擎应用到这些期权上。

后来我得根据金融产品价格变动,维护它的固定收入的期限结构模型。期限结构模型是对收益率曲线发展的预测—很复杂的算法,每晚都得运行。我还开发了同步模拟通货膨胀的期限结构模型。

空下来的时候,我会去维基百科管理一下上面的答案。现在我是Quora的活跃分子,就知识交换而言,Quora比维基好得多。

C:从你的工作经历来看,你怎么看待数据应用这个问题?

H:我不是很了解许多大机构的宏伟目标,我只能谈谈我的领域。在我开始为数据应用做贡献前,还有一大堆的知识等着我去消化。我一直试图找出更简洁和更准确的模型来处理那些被筛选出来的重要信息。

曾有一件事,让我真正明白了数据管理和复杂模型的价值。有天,我们丢失了路透社有关交易所的数据反馈,所有的活动都被迫停止。但是负责数据反馈 的那个工程师却外出午饭去了,在他回到座位之前,我们完全束手无策。那时我觉得,没有可靠的数据结构,华尔街赚不了钱,不管它有多少数学博士。

还有另外一件事情让我感到复杂模型的局限性。当时我们的一位交易员决定在某个金融产品上停用我们的模型,原因是模型预测的价格和其他交易员预测的价格有很大差异。这让我明白,所有的模型都必须考虑它所针对的金融工具的背景信息。

C:后来你去了Facebook,还组建数据团队,工作性质变了吗?

H:2006年,我以研究科学家的身份进入Facebook。就在我加入的前几个月,Facebook聘请了他们第一位分析总监。他搭建了 Facebook第一个数据库,加入后的头几个月我都在帮他干这个活。同时,我也会负责一些数据分析项目,尤其是分析在News Feed功能和开放注册推出之后网站访问量的增长情况。

几个月之后,我便清楚我们的增长速度将使得我们的数据结构超出任何当时的商业软件处理能力,于是我便向我的老板,Facebook的CTO Adam D'Angleo建议,我们要有自己的、由结构工程师和研究科学家组成的数据团队。我深刻地觉得,这两种人一起工作对于开发早期数据结构软件太重要了。

此后,我的工作主要就是在世界范围内招聘最出色的数据结构工程师,一起去证明我们的远见。

C:你在那些数据挖掘里发现了什么?

H:这工作感觉太棒了:News Feed发布之后的第二天简直就是疯狂的一天。一整天我都在把Facebook的流量数字更新给马克·扎克伯格,佐证他当时的直觉—不管当时的新闻报道如 何唱衰,News Feed对于用户来说会是个好东西。最让我兴奋的还要数推出平台的那天。在接下来的那个星期,我第一次明白Facebook会成功的,就像它今天一样的成 功。

然而最棒的时刻,是我们终于可以把软件进行开源的那?天。

C:但你后来又离开了,还说“最聪明的人都在让人们把注意力转到点击广告上,真糟糕”。你为什么会这么想?

H:正确的引用应该是:我一代中最聪明的人都在想着怎么让更多人点击广告,这真是糟糕透了。这很容易理解:在线广告已经成为了过去十年财富创造 最可靠的来源。把消费者和销售者配对起来,以及创造新的消费者和销售者,这对于任何市场来说都是最重要的问题。在线浏览和在线购买都变得非常容易估量。当 你有估量方法,你就可以研究科学。在这种情况下,我这一代中最聪明的人则在推动科学的前?进。

但不幸的是,我人生中大部分有朝一日可以被解决的问题,都不会因更精准的广告而迎刃而解。我不确定如何整合我们的社会,才能让致力于解决长期挑战的人觉得自己得到了应得的回报,但是这是一个值得问出口的问题。

当然,广告之外现在已经有了大量的其他数据应用,我现在就能脱口而出那些公司的名字:GitHub让开发开源软件变得更容易;Kickstar 让项目可以更快地获得资金支持;Rock Health和Imagine K-12在教育和资助下一代创业公司应该把更多目光投向医疗和教育领域的实际问题;Sage Bionetworks正在创造一个软件和数据的共享仓库,帮助疾病模型的建立和药品的开发;EyeWire用众包的方式研究大脑结构。有一些在线广告公 司已经开源了工具包,比如Facebook的Open Compute项目就是其中很有意思的一个。

C:你现在工作的Cloudera有什么不一样?

H:Cloudera的特别之处在于,我们的软件可以和任何形式、任何规模的数据匹配,并且是开源的。我们希望可以在数据分析的基础上创造更为开放的平台。

我们的主要产品是Cloudera Enterprise,它是我们的资产管理软件Cloudera Manager最重要的组成部分。它的销售一路走红,让我们得以从小团队成长为200多人的公司,到今年年底可能会超过300人。做一个开源软件还能赚钱 是一个让人兴奋的事情。最近我们新增了一些企业用户功能,比如可以让企业把被毁灭的数据恢复过来。

Cloudera更让人兴奋之处在于,许多公司的成功是建立在我们所提供的平台之上,投资我们的Accel公司很看好这个平台,它催生机遇,目前Accel在各种大数据领域的公司里投资了将近1亿美元。

C:你在硅谷看到数据挖掘的趋势是什么?

H:数据收据和数据挖掘最有趣的部分仍然发生在互联网公司之内,广告是构成这类公司营收最重要的部分。然而,在过去的几年里,这些公司当中有的已经成功地把开源工具商业化,创造了其他高收益的商业模式。我希望未来几年,会有更多的革新出现在这些公司里。

现在发生了很多有趣的事情。在人工智能方面,许多算法已经被隐藏到了开源软件平易近人的交互界面之下,比如Scikit-Learn,它能让用户很方便用各种模型做试验;还有像Vowpal Wabbit、Kaggle等等。

浏览器已经成为了数据可视化最棒的平台。JAVA Script, HIML5和WebGl,还有像D3和Crossfilter等实验室都让数以亿计的数据互动性更强、更可视化。当数据可视化在浏览器上实现了以后,合作 将变得更便利,并随之催生出更多让人兴奋的新技术和工具。

我可以说出许多在数据搜集方面很有意思的工具:LearnStructure、SchemaDictionary、密歇根大学开发的Fisheye,还有斯坦福和伯克利大学合作研发的一个叫Data Wrangler的工具。

C:你现在怎么看待数据的价值?

H:我深信科学是社会一切美好事物的伟大来源。数据则是被科学管理着的世界的代表,因此收集越多的数据,我们就有能力做更多的科学研究。在广告 于过去十年变得无比成熟的同时,许多产业甚至还没有进入数字时代。其中最突出的是医疗产业。我并不认为医疗产业在2030年还会如今天的情况一样驻足不 动。在Cloudera,我们已经有了许多来自医疗行业的客户,同时我也希望我们能在这个进程中保持领先地位,因为医疗数字化这一天一定会到来。

数据分析师的新发现:数据应用催生商业模式,首发于 互联网分析

相关 [数据 分析师 新发现] 推荐:

数据分析师的新发现:数据应用催生商业模式

- - 互联网分析
与点击广告相比,Jeff Hammerbacher相信,数据应用能够催生更多更好的商业模式. H= Jeff Hammerbacher Cloudera创始人. C:你的数据挖掘工作始于华尔街投行Bear Stearn,那是怎样一份工作. H:当时我是固定收益部的数据分析师,主要处理有关债权、抵押以及其他金融衍生工具的事务.

数据分析师的基本素质

- AWard - 小蚊子乐园
摘自《谁说菜鸟不会数据分析》第一章.     Mr.林看到小白斗志昂扬的样子非常高兴:别光说不做啊,要成为一名优秀的数据分析师,并非一件容易的事. 虽然所学的专业与数据分析不相关,但你可以通过工作中的实践学习数据分析,需要付出大量的时间和精力,不经一番寒彻骨,怎得梅花扑鼻香.     下面,我给你介绍一名合格的数据分析师需要具备的五大基本能力和素质.

数据分析师的级别

- - 博客 - 伯乐在线
虽然这个工作的人还不能称作数据分析师,但是往往作这样工作的人还都自称是数据分析师,. 这样的人,只能通过×××系统看到有限的数据,并且很少去处理数据,甚至不理解数据的由来和含义,只是机械的把自己看到的数据拷贝出来,转发给相应的人. 这类人发出来的数据,是否有意义,怎么解读,他自己是不知道的,只能期望收到数据的人了.

Mode:面向数据分析师的“GitHub”

- - IT经理网
从Yammer分析团队出来的三位资深数据分析师最近成立了一家创业公司—— Mode,希望能将其打造成一个面向数据分析师的“GitHub”分享协作平台. Mode目前已经获得55万美元的种子资金,Yammer创始人David Sacks为主要出资人. Mode联合创始人兼首席执行官Derek Steer认为,数据分析领域目前存在一个普遍的问题:.

我的职业理想:成为数据分析师(Z)

- Aaron Xu - 小蚊子乐园
转自:http://bbs.hjcn.com.cn/viewthread.php?tid=39993&extra=page=1. 很不错的文章,建议大家都看看,特别是菜鸟们. 我小时候的理想是将来做一名数学家,可惜长大了发现自己天赋不够,理想渐行渐远,于是开始考虑现实,开始做一些人生规划,我一直在思考将来从事何种职业,专注什么样的领域,重新定义着自己的职业理想.

普通、文艺、二逼数据分析师的区别

- NOir - 小蚊子乐园
普通数据分析师,文艺数据分析师和二逼数据分析师撰写PPT报告的区别.  普通数据分析师,文艺数据分析师和二逼数据分析师绘制数据图表的区别.

如何成为网站数据分析师?

- - 人人都是产品经理
如果你想成为网站分析师!想加入网站分析这个即有前途又有“钱途”的行业,那么你至少需要具备本文所提到的9大本领. Excel是一个最原始而且最容易入手的分析工具之一,如果你有少量的数据进行分析和汇总的话,Excel是你的不二之选,结合丰富的函数与公式,你能轻松的得到你想要的数据,如果你懂得计算机语言,会使用VBA进行编程那就更是如虎添翼了,并且还可以轻松的制作棒图,饼图,折线图等图表.

关于数据分析师职业前景

- - 人人都是产品经理
做数据分析前我们首先要明确分析目的和内容,对于数据分析师而言,他们的进阶需求无外乎是各个企业对数据分析师的职位要求. 在前程无忧、中华英才网以及智联招聘上,我们随便搜索下数据分析的岗位信息,都能找到大量类似于下面的一些职位要求信息:. 别看岗位职责,任职要求这么多,说白了主要就三点要求:. 2)掌握一到二种数据分析工具;.

Twitter 数据分析师独家披露他们的工作内容(上)

- - TECH2IPO创见
Medium  译文创见首发 由 TECH2IPO/创见 花满楼 编译 转载请注明出处. 很多人都在嘴边讨论它们,却没有几个人真正见过它. 这是当下科技行业最为火爆的职位,今天就让我们走进 Twitter 的数据分析世界,看看科技公司对于一个数据分析师的要求是什么. 到了今年 6 月 17 日,Robert Chang 就在 Twitter 工作两年了.

一名网站数据分析师需要具备这9大本领

- - 199IT互联网数据中心
如果你想成为网站分析师!想加入网站分析这个即有前途又有“钱途”的行业,那么你至少需要具备本文所提到的9大本领. Excel是一个最原始而且最容易入手的分析工具之一,如果你有少量的 数据进行分析和汇总的话,Excel是你的不二之选,结合丰富的函数与公式,你能轻松的得到你想要的数据,如果你懂得计算机语言,会使用VBA进行编程那就更是如虎添翼了,并且还可以轻松的制作棒图,饼图,折线图等图表.