大数据分析成功的关键在于真的有用

标签: 互联网 分析视角 营销观点 | 发表时间:2013-07-21 22:29 | 作者:admin
出处:http://www.datakong.cn

大数据比较热。传说中的牛公司都在做大数据。阿里巴巴前不久收购了一家数据分析的公司,最近雅虎也入手一家中国社交数据分析的公司,由此可以看出大数据能力多么的被看重,即便是互联网巨头们也觉得自己囊中羞涩能力欠缺。

不 过,与这股热闹相反的却是大数据应用的乏力,即便是号称数据能力超群的阿里巴巴也几乎没有摸到数据的门槛。可以毫不客气的讲,以目前淘宝上的通过数据分析 展现出来的购物推荐看,这种大数据几乎是被糟蹋了。甚至有微博称,自己仅仅是好奇于朋友说淘宝上卖棺材是免费送货而打开了几个店家的页面看了看,结果,此 后的一周自己的网页上便不厌其烦的开始被推荐各种各样的骨灰盒与棺材,真是让人汗颜。

不管你的数据来自哪里,是来自COOKIE,还是用户 的历史浏览和消费记录,线性的思考方式绝对不适合以人脑思维为基础的客户行为预测,即便号称神经网络等等的非线性分析方法,也很难准确的进行预测评估,归 根结底,人的行为是社会性的,人的决策也非完全理性的,更不要说毫无提前量的人云亦云的乱推荐。

大数据确实给分析人员提供了更好的基础,IT技术的发展也让人们有了更方便的分析工具,但却导致了越来越多的分析过程被机械化的技术专业人士们主导,喜欢遨游在编程海洋中的技术天才们多数都是不食人间烟火的科技疯子,就数据论数据的方式严重制约了数据分析结果的使用价值。

因此,大数据分析的成功不仅仅在于应用,更在于能够有价值的应用,粗制滥造的去应用很可能导致彻底的失败。

做大数据分析,至少要做到以下几点:

1、虽然你关注相关性,但这种相关性也应该在一定程度上被验证因果,毫无因果可言的相关也许是暗含与宇宙黑洞的秘密,至少现在对人类用处不大。

2、先进的分析技术和高级的程序员都只是数据分析中的工具和操作手,都只能是作为决策的辅助,参谋不能带长,只会写报表的参谋永远不能当参谋长,更不能去当指挥战争的参谋总长。

3、组织各个领域的专家委员会,让消费者研究专家们看那些似是而非的结论,然后根据发现的可能亮点再去有针对性的发掘,漫无目的或者成规制的出报表只适合绩效考核。

4、让那些分析网络访问量、用户来自哪里、喜欢看什么网页等等的传统互联网分析理念远离消费推荐领域,用那些为了网站运营而去分析的套路去看待消费者行为是刻舟求剑,驴唇不对马嘴。

5、忘掉那些高深的术语,被用专业门槛将公司里面的需求者阻挡在豪门之外,数据分析没那么神奇,即便多了一个大。

6、数据也会说假话,片面相信数据的结果是彻底的教条主义,任何看似非常科学的结论都有可能是你自己的分析方法导致的。

7、大数据当然有用,但要掌握在有用的人手里,更要掌握在会用的手里,更更需要掌握在不乱用的人手里。

8、让机器替代人脑,认为机器可以替代人脑,只要傻子才这样想,至少在人类文明的现阶段是傻子。

9、根据客户行为做推荐的时候多设置几道识别好不好,特别不靠谱的给拦住,即便不能给客户提供帮助,也别给人家添堵。

10、做好大数据,先从小数据开始吧,虽然你可以说大数据可不仅仅是个大,但任何的大都是从小来的,不积小流无以成大海,不积跬步不能走千里啊。

最终,谦虚使人进步,骄傲使人落后,大数据的专家们共勉。

 

钻探都督府:基本上是垃圾。我太太曾经用我的帐号买过一次胸罩,结果我的屏幕上总是向我炫耀新式胸罩;我曾经给我儿子买过一次外交官旅行箱,从此总要我买旅行箱。 他们对业务分析的水平太低了。从数据到数据,是数据科学的粪坑,但是阿里的数据分析人员总在粪坑边淘金。

@徽剑:目前国内数据分析本身就走入了一个误区,重数据,轻建模;重技术,轻人文。一个好的数据分析体系,首先得有一个良好的理论模型,用它去指导分析,然后通过数据不断修正它,任何把数据分析当数学和代码来搞的最后肯定闹笑话。

哈哈笑的狗:别信啥数据建模,还是经验最可靠,数据分析的过程就是在总结人手工分析数据的过程

社会学吧:基于假设的模型建构是数据分析的基础,只可惜大部分专业不教建模的。但是大数据的特性决定了一部分无模型探索分析的存在,以及不基于假设的机器学习的模型的产生。

上帝-偶卖糕的:啥是大数据?跟现在的已有形式有什么区别?是概念上的忽悠?还是事实上的扯淡?也许根本就没几个人搞得清楚,大多是人云亦云罢了!以前”云“概念出来的时候,我就说了,没必要吹得那么神乎其神,纯粹就是”皇帝的新衣“嘛,要是嘴里不蹦点啥云啊、啥大数据啊,还真对不起这张脸

艾瑞-王亚谦:数据挖掘/分析、大数据都是商业概念,受预算约束。商业决策的核心是人,数据只起辅助作用。任何把数据学术化、技术化都是错误的

刘丰奎:他们的数据记录是准确无误的,这个不需要质疑僵尸数据公司的能力,但是分析逻辑和草率的结论可笑至极!!这不会被推荐而购买,而是带给客户更不好的感受,如果说好处……那唯一好处就是提醒对这种网站不反感的用户,该去看看X宝、京X最近的优惠了!

来自:http://mrpad.i.sohu.com/blog/view/271820414.htm

大数据分析成功的关键在于真的有用,首发于 互联网分析

相关 [大数据 分析 成功] 推荐:

大数据分析成功的关键在于真的有用

- - 互联网分析
阿里巴巴前不久收购了一家数据分析的公司,最近雅虎也入手一家中国社交数据分析的公司,由此可以看出大数据能力多么的被看重,即便是互联网巨头们也觉得自己囊中羞涩能力欠缺. 不 过,与这股热闹相反的却是大数据应用的乏力,即便是号称数据能力超群的阿里巴巴也几乎没有摸到数据的门槛. 可以毫不客气的讲,以目前淘宝上的通过数据分析 展现出来的购物推荐看,这种大数据几乎是被糟蹋了.

谈大数据分析

- - 人月神话的BLOG
对于数据分析层,我们可以看到,其核心重点是针对海量数据形成一个分布式可弹性伸缩的,高查询性能的,支持标准sql语法的一个ODS库. 我们看到对于Hive,impala,InfoBright更多的都是解决这个层面的问题,即解决数据采集问题,解决采集后数据行列混合存储和压缩的问题,然后形成一个支撑标准sql预防的数据分析库.

大数据分析的5个方面

- - ITeye资讯频道
越来越多的应用涉及到大数据,不幸的是所有大数据的属性,包括数量、速度、多样性等等都是描述了数据库不断增长的复杂性. 那么大数据给我们带来了什么好处呢. 大数据最大的好处在于能够让我们从这些数据中分析出很多智能的、深入的、有价值的信息. 下面我总结了分析大数据的5个方面. Analytic Visualizations(可视化分析).

大数据分析最佳实践

- - 互联网分析
   转自:TTNN   Q先生杰作. 大概是从今年开始,big data一词逐渐成为术语,这跟整个世界的数据爆发当然有关系. 以前,人们喜欢用海量数据这个词,large-scale. 这看上去还是显得有点学术气, 像是BI人自己关起门来说自己的宝贝. 而big data更显通俗,在各行各业都显现出的一种势头,于是产生这个更加简单的词汇,大数据.

大数据分析的分类-转载

- - 人月神话的BLOG
原文:http://www.csdn.net/article/2011-08-15/303101. Hadoop平台对业务的针对性较强,为了让你明确它是否符合你的业务,现粗略地从几个角度将大数据分析的业务需求分类,针对不同的具体需求,应采用不同的数据分析架构. 按照数据分析的实时性,分为实时数据分析和离线数据分析两种.

下一代大数据分析技术

- - Parallel Labs
原文发表于《程序员》杂志2013年第2期.. 随着以Hadoop为代表的大数据分析技术的普及,大数据的商业价值得到深入挖掘,并开始在互联网、零售、医疗、物联网等多个行业里成为商业变革的主导力量. Facebook最近就发布了名为Graph Search的新型社交搜索产品,基于海量的社交关系网络及“Likes”行为数据,为用户提供个性化的社交搜索服务,该产品被认为将是Google搜索业务的重要竞争对手.

基于mdrill的大数据分析

- - CSDN博客云计算推荐文章
     数据越来越多,传统的关系型数据库支撑不了,分布式数据仓库又非常贵. 几十亿、几百亿、甚至几千亿的数据量,如何才能高效的分析. mdrill是由阿里妈妈开源的一套数据的软件,针对TB级数据量,能够仅用10台机器,达到秒级响应,数据能实时导入,可以对任意的维度进行组合与过滤.     mdrill作为数据在线分析处理软件,可以在几秒到几十秒的时间,分析百亿级别的任意组合维度的数据.

大数据分析查询引擎Impala

- - 标点符
Impala是Cloudera公司主导开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据. 已有的Hive系统虽然也提供了SQL语义,但由于Hive底层执行使用的是MapReduce引擎,仍然是一个批处理过程,难以满足查询的交互性. 相比之下,Impala的最大特点也是最大卖点就是它的快速.

成功大数据团队的“三驾马车”

- - IT经理网
对于那些着手尝试大数据应用的企业来说,成败的关键是组建一个优秀的大数据团队,但是不要指望一个“ 首席数据官(CDO)”或者数据科学家搞定所有的事情,成功的大数据团队需要三驾马车:一位业务分析师、一位机器学习专家和一位数据工程师. 随着大数据企业应用的火热开展,数据科学家正在闹人才荒,可谓一将难求,但是Lithium公司的首席科学家Michael Wu博士在接受IW 采访时表示:数据科学家的人才荒是因为人们对数据科学家的期望值过高,希望他即懂业务也懂最先进的大数据技术,这样的人才自然是奇货可居,而且不是每个企业有钱就能招募到的.

大数据下的数据分析平台架构

- vento - 《程序员》杂志官网
随着互联网、移动互联网和物联网的发展,谁也无法否认,我们已经切实地迎来了一个海量数据的时代,数据调查公司IDC预计2011年的数据总量将达到1.8万亿GB,对这些海量数据的分析已经成为一个非常重要且紧迫的需求. 作为一家互联网数据分析公司,我们在海量数据的分析领域那真是被“逼上梁山”. 多年来在严苛的业务需求和数据压力下,我们几乎尝试了所有可能的大数据分析方法,最终落地于Hadoop平台之上.