掘金还是积肥?大数据处理能力将决定微博进化成败

标签: 社交 观点 微博 社交网络 腾讯 | 发表时间:2013-05-25 14:20 | 作者:信海光
出处:http://www.tmtpost.com
微博大战,大数据决定谁能赢

微博大战,大数据决定谁能赢

(原文标题:《数据变革: 腾讯 微博的社交媒体进化论》)

5月21日,近来比较平静的腾讯微博在工体唐廊举办了一个业内研讨会,就腾讯微博新版改版方向以及大数据挖掘与业内进行了分享和交流,从中可以看出腾讯微博近期的一些探索以及未来用力的方向。

微博未来与大数据挖掘

腾讯微博这次改版的一个关键词是大数据挖掘。微圈、微热点、微频道、微博管家这四个新上线的功能都与大数据发掘有关联。微圈是通过对用户关系数据和兴趣数据的分析、挖掘来实现好友自动分组的功能;微热点则是依托后台数据与语义分析技术,将用户的微博内容与当前热点事件做即时匹配,动态生成的热点事件全脉络发展页面。微频道和微博管家也有类似的技术运用。

大数据是近年来比较流行的一个概念,而其与微博紧密绑定也从Twitter就已经开始。

对于微博来说,大数据既是一种机遇也是一种挑战。微博用户、微博内容及其复杂性的持续增加,使微博本身成为大数据的载体,拥有大数据就相当于拥有一座金矿,这是微博的机遇。以腾讯微博为例,尽管还不算国内最大,但平台上已经有超过5亿个注册用户,289条社交关系,154000亿条路径,每天300G存储量,每天1千亿次服务调用,每天5万亿次计算量。

而大数据给微博带来的挑战则是,运营方有没有利用好大数据的能力?有能力,从大数据这座金矿里挖出来就是金子,而没有能力,则只能挖出垃圾,带来负价值。在大数据挖掘过程中,只有精准度在85%以上时,才具备实现产品化的条件,如果精准度达不到,结果就是挖的越多,错的越多。

从这个角度说,腾讯微博敢于把大数据挖掘结果用于微圈这样的特定产品,是需要一定的技术底蕴为支持的。

微博发展到今天,在产品上其实依然大同小异,都还没有脱离Twitter最初塑造的范畴,如果有哪一家在大数据的利用上有颠覆性的开拓,一定会使整个竞争格局翻盘。

掘金还是积肥?

目前,微博对大数据的挖掘其实可以分为两个不同的维度,我将之称为掘金式利用和积肥式利用。

所谓掘金,就是立足于高效、准确、快速,从现有的海量微博内容中挖掘出具有商业价值的数据结果。一个经典的案例来自Twitter,华尔街有家公司利用电脑程序分析当时全球3.4亿微博账户留言判断民众情绪 ,再以1到50分为其打分,根据分数高低处理手中股票。原则就是:多数人表现兴奋就买入,表现的焦虑就抛售,结果出乎意料,这样的经营模式为其第一季度创造了7%的收益率。真正实现了数据创造价值。

现在微博平台上的风云榜、微数据、微报告,以及餐客等第三方微博数据挖掘,都是基于微博内容对海量数据进行挖掘和价值提炼的典型应用。但从目前看,至少在中国的微博圈里,还没有出现一个大数据掘金的经典案例。 国内企业的大数据处理能力是限制掘金的最大瓶颈。

而积肥,则是指在产品内部把大数据的作用尽量发挥出来,先不求最大商业价值,而是通过对大数据的开发为用户体验服务,将数据分析进行产品化,着力去解决“信息碎片化”、“信息过载”、“垃圾内容影响价值信息获取”等问题,从而提升用户的活跃度与黏性,为微博运营助力。腾讯微博现在的做法就是典型的积肥式,以留住用户、刺激用户,做大数据金矿为目的。至于商业价值开发的事情,则留待以后解决。

这是个先有鸡还是先有蛋的问题,至少从目前看,腾讯微博选择的路径应该是正确的。腾讯微博现在的主要任务是把新浪微博掀翻在地,然后才考虑如何掘金。

与新浪微博相比,腾讯微博尽管体量仍旧不足,但它没有包袱,没有新浪微博那么大的压力,而且,腾讯有钱,有实力强大的技术团队,它做得起水磨功夫,说不定能走出一条新路。

在掘金和积肥方面,新浪微博其实是最好的前车之鉴。新浪微博近期遇冷,有各种原因,但用户体验降低肯定是其中最重要原因之一,信息过载、营销泛滥、个体迷失等等,而新浪微博又由于经营压力而将注意力过度集中于如何商业化,“一只本能生金蛋的鸡,因为长期食用不健康的饲料,已经失去了生蛋的机能”,这确实是一定程度上新浪微博的写照。

微博能否取代新闻门户

腾讯微博这次改版的另外一个特色是“微热点”和“微频道”,这涉及到大数据的运用,但更多的显示出腾讯微博的另一个诉求:资讯化与媒体化。

这当然有弥补腾讯微博短板的需要,外界不是一直在说,新浪微博媒体属性强,腾讯微博社交属性强?但对于观察者来说,腾讯微博尝试能否成功,关系到这么一个疑问:微博能否取代新闻门户?

包括作者在内,很多人在微博兴起后,就大大减少了访问门户网站的频次,这使得微博也成为新浪的一把双刃剑,但如果微博能够在社交的同时实现新闻阅读的功能,岂不两全其美?毕竟,人的时间与精力是有限的,如何使更多的需求能够一站式解决,是任何产品所奢望。

按照介绍,腾讯微博的微热点是依托后台数据与语义分析技术,将用户的微博内容与当前热点事件做即时匹配,动态生成的热点事件全脉络发展页面。其实质是将资讯阅读融入到微博阅读之中。这一实验如果能够成功,或许就是个杀手级的应用,因为它对现有微博形态是一种颠覆,同时,对现有资讯获取模式也是一种颠覆。

当然,微博取代新闻门户,这种想法还是有过于大胆。在中国,尽管微博的媒体属性比美国更浓,但它的基因依旧是社交为主,很难变身或者取代媒体。不过,这一野望即便不能成功,对腾讯微博来说,也无伤大雅,法乎其上,得乎其中,只要媒体功用得到加强一点,腾讯微博的短板就能弥补一点。

相关 [掘金 大数据 微博] 推荐:

掘金还是积肥?大数据处理能力将决定微博进化成败

- - 钛媒体网
(原文标题:《数据变革: 腾讯 微博的社交媒体进化论》). 5月21日,近来比较平静的腾讯微博在工体唐廊举办了一个业内研讨会,就腾讯微博新版改版方向以及大数据挖掘与业内进行了分享和交流,从中可以看出腾讯微博近期的一些探索以及未来用力的方向. 腾讯微博这次改版的一个关键词是大数据挖掘. 微圈、微热点、微频道、微博管家这四个新上线的功能都与大数据发掘有关联.

企业掘金大数据的两种选择

- - IT技术博客大学习
    究竟如何才能把数据转化为利润呢. 对大多数公司来说, 有两种选择, 一是数据导向的流程, 二是数据导向的产品.    如今,你到哪儿都能听到大数据. 别说是亚马逊这样的公司,现在就是一个小的Startup, 每天也能有几个G的数据量. 而像Instagram 这样的照片分享网站,每天轻松就能产生出500T的数据量.

谈大数据(2)

- - 人月神话的BLOG
对于大数据,后面会作为一个系列来谈,大数据涉及的方面特别多,包括主数据,数据中心和ODS,SOA,云计算,业务BI等很多方面的内容. 前面看到一个提法,即大数据会让我们更加关注业务方面的内容,而云平台则更多是技术层面的内容. 对于大数据会先把各个理解的关键点谈完了,再系统来看大数据的完整解决方案和体系化.

大数据之惑

- - 互联网分析
算起来,接触大数据、和互联网之外的客户谈大数据也有快2年了. 也该是时候整理下一些感受,和大家分享下我看到的国内大数据应用的一些困惑了. 云和大数据,应该是近几年IT炒的最热的两个话题了. 在我看来,这两者之间的不同就是: 云是做新的瓶,装旧的酒; 大数据是找合适的瓶,酿新的酒. 云说到底是一种基础架构的革命.

白话大数据

- - 互联网分析
这个时代,你在外面混,无论是技术还是产品还是运营还是商务,如果嘴里说不出“大数据”“云存储”“云计算”,真不好意思在同行面前抬头. 是千万级别的用户信息还是动辄XXXTB的数据量. 其实,大数据在我的眼里,不是一门技术,而是一种技能,从数据中去发现价值挖掘价值的技能. ”当我掷地有声用这句话开场时,正好一个妹子推门而入,听到这句话,微微一怔,低头坐下.

交通大数据

- - 人月神话的BLOG
本文简单谈下智慧交通场景下可能出现的大数据需求和具体应用价值. 对于公交线路规划和设计是一个大数据潜在的应用场景,传统的公交线路规划往往需要在前期投入大量的人力进行OD调查和数据收集. 特别是在公交卡普及后可以看到,对于OD流量数据完全可以从公交一卡通中采集到相关的交通流量和流向数据,包括同一张卡每天的行走路线和换乘次数等详细信息.

从盗墓到掘金

- banpao - 白板报
从外表来看,徐磊跟普通的商人没什么两样,一米八的大个,穿着松松垮垮的7分裤和T恤衫,脸上带着睡不醒的倦意,仿佛刚打完一夜麻将并被别人连庄连和. 但是,一谈起文学,他眼里就开始发出光,像一件保存完好的青铜器从墓穴里取出来,突然放到日光之下. 提起他的笔名,网络上无人不晓,他就是《盗墓笔记》的作者南派三叔.

微博

- qianlaohu - 独立思考
无论名人在微博上讲什么,都能引起很大的“互动”. 王力宏说:“2011年过去一半了,7月了. 感觉就是这几百万人一起围在那里,紧张专注地看着,名人的微博一更新,至少挤在前排的几万人就激动拥抱:“动了. 说微博的迅速崛起会影响媒体,影响门户网站,影响SNS,其实都不对. 它首先威胁到蜡像馆,因为你在蜡像馆只能掏钱看不会动的,而在微博,不用掏钱都能看到会动的.

全球10大数据库

- - 译言-电脑/网络/数码科技
原文: Fiorenttini   译者: julie20098. [非商业性转载必须注明译者julie20098和相关链接. ,否则视为侵权,追究转载责任. 世界气候数据中心:气候全球数据中心, 220TB 的网络数据, 6PB 的其它数据. 国家能源研究科学计算中心,有 2.8PB 容量.

谈大数据分析

- - 人月神话的BLOG
对于数据分析层,我们可以看到,其核心重点是针对海量数据形成一个分布式可弹性伸缩的,高查询性能的,支持标准sql语法的一个ODS库. 我们看到对于Hive,impala,InfoBright更多的都是解决这个层面的问题,即解决数据采集问题,解决采集后数据行列混合存储和压缩的问题,然后形成一个支撑标准sql预防的数据分析库.