豆瓣现在到底怎么样?让我们用数据来说话

标签: 豆瓣 怎么样 数据 | 发表时间:2014-12-22 22:22 | 作者: 黑板报值日生
出处:http://www.geekpark.net/
作者: 黑板报值日生

编者注:本文转载于豆瓣日志,作者 维舟授权极客公园发布,原标题为《 从数据看豆瓣兴衰》。


从 2005 年 3 月 6 日正式上线算起,豆瓣诞生已将十年,此时稍作回顾或许也正合宜。在这十年间,对豆瓣自不免有许多批评和质疑(这些声音恐怕大多来自它的用户),但不可否认,它堪称创造了历史。豆瓣的模式在中国迄今没有哪家能完全复制(在这一意义上,它是没有竞争对手的),它属于那种「只发生一次」的历史事件。不论好坏,它的出现,为广大文艺青年、普通青年及若干二逼青年提供了一个交流分享阅读、电影、音乐等体验的公共平台,不夸张地说, 如果没有这样一个巨大的虚拟咖啡馆,我们这个时代的精神生活可能会贫瘠许多——至少我本人是这样。

在豆瓣出现之前,中国自然已经有网络媒体,但早年的网站,互动性并不强,当时的代表是门户和垂直网站,而它们的信息发布其实和传统媒体是一样的,即从信息源到用户是「一对多」,一个单一的信息源发布信息给无数潜在受众。随后在 2003 年左右兴起了第一代 web 2.0 模式的网站,其模式是「多对多」的,即网站只是一个平台,而由用户自发生产内容(UGC, user generate content)。博客在当时热火了一阵,但最终人们发现,媒体要更进一步社交化才能完成这一使命。从这一意义上说, QQ、微博、淘宝、微信都是同类:媒体都是「多对多」的平台;但与这些网站相比,豆瓣在内容上明显要长尾得多,因为它其中涉及的大量书籍、电影、音乐的内容都是相当小众的,这在商业上就意味着潜在目标人群的高度分化(fragmenting),较难以广告投放等方式变现。

虽然豆瓣受众时常争吵、互相拉黑,一怒注销者有之,盗号者亦有之,但从数据来看,总体上豆瓣的用户粘性(每周登录次数、每次停留时长及浏览页面数等等),在同类网站中都是不低的。不仅如此,它在这过往的近十年间,维持了相对平稳的发展——请注意「相对」这个修饰语,因为互联网是一个特别容易骤兴骤衰的行业,有时简直是过山车一样的变化。在这一意义上说, 豆瓣的成功之一不在于它比同行「跑得快」,而在于它「死得慢」。

从百度搜索指数来看,这是非常明显的(考虑到百度在 PC 端的搜索中占了 70% 以上的份额,它的搜索指数可以作为一般网民对许多词的关注程度,之所以用 PC 端是因为 2011 年起才有移动端监测数据):最近一周平均指数与历史最高点相比,豆瓣下降了 41.3%,但开心网下降了 99.3%、人人网下降了 87.6%、新浪微博则下降了 82.0%:

(百度搜索指数 2006-2014,豆瓣,PC 端)

(百度搜索指数 2006-2014,人人网,PC 端)

(百度搜索指数 2006-2014,开心网,PC 端)

(百度搜索指数 2006-2014,新浪微博,PC 端)

以上指数所折射出来的媒体兴衰,可以从两方面加以印证:

  • 一是个人体验,以我个人来说,我是 2007-7-12 加入豆瓣的,刚好是在我写博客三年之后,但当时只是用来查找一些书籍和电影信息,直到 2010 年 9 月为怕博客崩溃,才开始在豆瓣上备份,随后 2011 年才算真正用起豆瓣来,也正逢上豆瓣最繁盛的时期;新浪微博的指数最高峰出现在 2011 年 7 月 31 这一周,而也正是在这一年春夏,我屡屡受到周围许多人询问「你为什么还不用微博」,这种压力随着新浪微博的衰落已大大减轻。最明显的是开心网,它的高峰出现在 2009 年 7 月 26 日这一周,在此之前,我身周的同事、朋友几乎一窝蜂地在注册开心网。
  • 第二点可资印证的是这些网站的媒体政策。通常而言,当一个媒体走强时,对外的广告政策是非常强硬的,如开心网在 2009 初蹿红时,单笔 60 万起做——那时这笔钱足够欧莱雅等广告主一波完整的 4 周广告,投好几个媒体,不少媒体 5 万也接;人人网一度广告政策也非常强硬,配送比例卡得很紧,但 2012 年 6 月,一位与他们有密切关系的业内前辈告知,人人网的政策已有所松动,可以从 1:1.8 谈到 1:2.2 乃至 1:2.5,这正是其开始衰落的时刻。广告政策因为密切和利益相关,对媒体的强弱而言是晴雨表,也最难在数据上作假,因为有大量第三方监测公司、代理公司、广告主虎视眈眈地审查你这家媒体的真实价值。

社交网站往往要蹿红不难,但难在如何留住人。开心网最高点(出现在 2009/7/26 这周)百度搜索指数高达 833,378,这是相当惊人的(淘宝的历史最高点也只有 113 万),但大家都是成年人,「偷菜」什么的,毕竟很容易玩腻掉,真正能长久的,必须和现实中的人际网络、人的兴趣需求贴得更近才行。当用户粘性变差时,失败是不可避免的。2011 年,在开心网已显露出明显衰落征象时,其 CEO 程炳皓曾在一次高峰论坛上提出 social marketing 的概念,意即通过人际推荐的方式来推动营销,但在中国社会中,这种熟人推荐方式往往会破坏而非增进人际关系,此事不久遂不了了之。

要留住用户,很重要的一点是用户体验,而这有时却又是和广告收入相冲突的。据说马化腾在面对广告部门提出在 QQ 上多开广告位时,常会说:「要注意用户体验。」这算是业内有名的段子,有时也用以说明广告部门在腾讯内部的弱势,因为广告只占其收入来源的十分之一强,常常说不上话。豆瓣现在也常有人觉得广告太多(当然,这种抱怨有时是针对用户发的垃圾广告,不是豆瓣自身发布的),环境不好,但凭良心说,横向对比着看,豆瓣在广告这方面是做得相当克制的。 根据业内最权威的网络广告监测软件 iAdTracker 的数据,截止 12 月 22 日,豆瓣今年的广告收入为 4157.2 万,去年全年 4200.08 万,再往前一年 2012 年则为 3507.65 万,2011 年仅 335.81 万,更早的监测数据为 0。以我所知,豆瓣开始派销售在代理公司中接洽生意,是在 2012 年春;当时其华东区销售总监原在手机网站做时认识我(不过他当然不知道我也是豆瓣用户),当时还曾苦着脸说老板对广告有许多限制——例如,豆瓣的页面迄今没有动画、flash 或 rich media 的广告形式,更不用说弹出窗口,其实只是图片,形式单一,广告位也非常少,这些都是广告主和代理公司不能满意的。虽然很多人动辄骂阿北,但至少就广告环境而言,也算得是业界良心了。

从艾瑞的数据看,在交友社区类网站中,豆瓣的日均用户覆盖人数排列第三,仅次于新浪微博和人人网,而月度覆盖甚至超过人人网,遥遥领先于其它各家:

(交友社区类网站排名,iUserTracker,2014/10)

然而如以广告收入计算,豆瓣的表现则相当之差。和它在用户覆盖数上最接近的是人人网,但豆瓣今年全年截止到 12/22 的监测广告收入,还不及人人网近 3 个月(5357.1 万,高出豆瓣全年 28.9%)。人人网今年全年已收获 22,672.46 万广告费,而在 2012 年高峰时更高达 42,955.9 万,是豆瓣的 12 倍之多。这也就是说,从商业的角度来看,豆瓣未能找到和竞争对手一样有效的盈利模式,或是不愿、或是不能,总之未能将巨大的用户数和内容予以变现。这其中有很多原因: 豆瓣用户的碎片化和敏感(恐怕比人人网用户更讨厌广告吧);用户的人口统计学特征(多学生,消费多倾向于文艺用品);海外流量的无效(有些广告主只想定向投放国内市场的消费者),而豆瓣用户似有不少在海外。

从豆瓣和人人网 2014 年前十广告主来看:

(豆瓣与人人网 Top10 广告主,iAdTracker,2014)

可以得出几个明显的结论:

  1. 豆瓣更依赖于少数几个广告主(前十就贡献了近一半),人人网的广告主数量也是豆瓣的 2 倍多;
  2. 豆瓣前十品牌大多是相对高端的品牌,而人人网的广告主多大众消费品;
  3. 人人网几个广告主的投放天数明显要长得多,意味着用户要观看更多天数的广告。

办媒体不是慈善事业。豆瓣变现的压力,可想是肯定存在的,因为任何风投都不能无限制地烧钱。豆瓣如何赚钱,这似乎是个老问题,虽然我们这种普通用户犯不着为阿北操心,但这毕竟是个很现实的问题。就目前而言,一般的网络媒体有几种收入来源:

  1. 广告,所谓「广告是媒体的血液」;
  2. 用户付费,像现在很多视频网站的节目都要付费才能观看了,不要小看,这是相当强大的收入来源,一个视频网站的白银卡用户每月付 4.99 元,一年就是 60 元,160 万用户就能产生 1 亿收入!而豆瓣月度覆盖 8434 万人,一年广告收入也才 4100 万而已,相当于每个用户只贡献了 5 毛钱(汗,这数字真是不吉利)而已。但在所有付费形式中,用户付费意愿最强的,要么是游戏,要么就是黄赌毒(比如彩票网站、赌球网站,视频聊天的主播这种网站,据业内估计平均每个受众每年平均付出 380 元!这是相当高的数字),所以难怪去年艾瑞高峰论坛上,一位 digital 业界的 CEO 高呼:「得屌丝者得天下!」
  3. 内容输出,这在视频网站最常见,将独家的片子分销,或自制剧卖出去,豆瓣的出书什么也许可以归入此类,但这个路径要赚大钱,恐怕是很难的。

在豆瓣上,还时常有人嘲讽(或哀叹)豆瓣成了一个交友、约炮网站,这从数据来看,是不符合事实的。还是看百度指数,其「需求图谱」表明:

(百度指数,豆瓣需求图谱,2014/12/15-21)

其中可见,豆瓣用户需求最强的是电影,其次是音乐、租房等等,「妹子」还排在「读书」后面,且呈现环比下降趋势,至于「约炮」就更后面了。从同期的热门搜索词看,豆瓣用户感兴趣的话题大多与豆瓣有关,且较为文艺:

(百度指数,豆瓣用户热门搜索词,2014/12/15-21)

从热门搜索来看,知乎更可能对豆瓣造成较大威胁。如果和陌陌对比,情况是明显不同的,陌陌用户除了关心上市、下载/注销/注册/会员等基本功能,在意的便是「约炮」:

(百度指数,陌陌需求图谱,2014/12/15-21)

在陌陌近期上市利好驱动下的新一轮高峰(陌陌主要在移动端,故需要不断推进下载和预安装)之前,这一点原本更为明显。不过目前对陌陌的发展还需要再加评估——现在移动端的广告监测很不完善,iAdTracker 中便没有陌陌的广告监测数据。

从数据来看,豆瓣未来的机会点应该在移动端。很多品牌和媒体的搜索曲线都可看出,PC 端的高峰大抵在 2012 年底前达到高峰,再往后往往呈下降趋势,而与此同时,移动端则多呈现快速攀升。这一用户的变化,已在广告收入中呈现出来,国内一些视频网站 2014 年的移动端广告收入增速,远远超过 PC 端(当然移动端原本基数也低)。但豆瓣移动端用户虽然呈现一定增长:

(百度搜索指数,豆瓣移动端,2011-2014)

但今年的增长却并不快,最近 30 天同比甚至出现了 17% 的负增长。从近半年的数据看,豆瓣用户已呈现一个明显的行为习惯规律,即 weekday 期间 PC 端高,周末则移动端高:

(百度搜索指数,豆瓣 PC 端,2014 年下半年)

(百度搜索指数,豆瓣移动端,2014 年下半年)

最一目了然的是十一国庆节期间,PC 端曲线下凹,而移动端则攀高。这种现象在豆瓣上特别明显,但像澎湃新闻则没有这类现象,它在 PC 端和移动端几乎都是在 7 月 22 日正式上线这天达到顶峰,随后渐渐趋于稳定,周末与平时也无明显的波峰低谷交叉:

(百度搜索指数,澎湃新闻 PC 端,2014 年下半年)

(百度搜索指数,澎湃新闻移动端,2014 年下半年)

这都意味着,不管从用户体验还是自身经营出发,豆瓣理应赶紧狠抓移动端开发,但从目前来看,豆瓣的移动端状况不佳,以豆瓣一刻为例,数据显示它从 6 月上线以来,月度覆盖人数最高的就是第一个月:

(豆瓣一刻,月度趋势,mUserTracker,2014 年)

作为一个普通用户的体验来说,用移动端使用豆瓣常觉不便,最基本的,每次都要求我重新登录,非常不便。新开发的 App 则功能拆分太多,而像豆瓣一刻的开发,在某种程度上丧失了原来的社交属性。在移动端的方面,豆瓣体现出一个原本基于 PC 端的媒体,在转向移动时所遇到的一些问题,这些在一开始就用移动端的陌陌、微信之类的媒体上则是没有的。

当然,媒体如人,都有自己的生命周期。豆瓣不论怎么说,已坚持(或维持)了很多年;很多 web2.0 的网站,到后来没几年都面目全非,要么是大起大落,早先热火过的已没人玩了;要么违背了 UGC 的初始设想,到最后开始自己生产内容(视频网站最明显,如土豆、优酷)。有兴趣的人不妨预测下微信朋友圈,能维持多久?从这一点来看, 豆瓣这些年看似变化少,但变化多也未必好,它的存在已相当不易,作为一个普通用户,我只期望它至少慢慢挺过去。

相关 [豆瓣 怎么样 数据] 推荐:

豆瓣现在到底怎么样?让我们用数据来说话

- - 极客公园-GeekPark
作者: 黑板报值日生 编者注:本文转载于豆瓣日志,作者 维舟授权极客公园发布,原标题为《. 从 2005 年 3 月 6 日正式上线算起,豆瓣诞生已将十年,此时稍作回顾或许也正合宜. 在这十年间,对豆瓣自不免有许多批评和质疑(这些声音恐怕大多来自它的用户),但不可否认,它堪称创造了历史. 豆瓣的模式在中国迄今没有哪家能完全复制(在这一意义上,它是没有竞争对手的),它属于那种「只发生一次」的历史事件.

ES数据插入和查询流程是怎么样的?

- -
ES集群的状态有哪些,为什么主分片数目是固定的,副本分片却能动态调节,快看看这些关于ES的问题你都知道吗?. green 最健康的状态,说明所有的分片包括备份都可用. yellow 基本的分片可用,但是备份不可用(或者是没有备份). red 部分的分片可用,表明分片有一部分损坏. 此时执行查询部分数据仍然可以查到,遇到这种情况,还是赶快解决比较好.

Java豆瓣电影爬虫——抓取电影详情和电影短评数据

- - ImportNew
采集豆瓣电影数据包括电影详情页数据和电影的短评数据. 需要保存这些详情字段如导演、编剧、演员等还有图中右下方的标签. 需要保存的字段有短评所属的电影名称,每条评论的详细信息如评论人名称、评论内容等. 有了如上的需求,需要设计表,其实很简单,只需要一张电影详情表movie和一张电影短评表comments,另外还需要一张存储网页提取的超链接的记录表record.

豆瓣显示

- frank - 读库情报站

豆瓣的初衷

- Alex Yu - 豆瓣blog
六年前,我开始写豆瓣第一行代码的时候,是想做一个关于生活发现的服务. 也就是说,豆瓣想帮人发现真实生活里的好东西. 今天豆瓣有一百多人的团队了,我们依然在做一个关于生活发现的服务. 这个想法可以在2005年以来一直没有改动过的一个页面里看到,就是”关于豆瓣“. “豆瓣的发起者发现,对多数人做选择最有效的帮助其实来自亲友和同事.

今天过的怎么样?

- yesno - 玩意儿
365天的表情,再每天结束,可以在上面画上自己的表情(非常好,好,正常,差,很差)五种形状,可以统计自己这365天的喜怒哀乐. 这几日,心情差,不停断电中,不知道这个时刻为什么还没有停. © 玩意儿 ┊ 原文链接 ┊ 新浪微博 ┊ 点击访问我们的淘宝店.

OSD Lyrics + 豆瓣电台

- 培培 - 画猫不成反类虎
现在已经可以试用了,参见wiki页面安装0.5版,然后按照README文件的说明使用浏览器扩展. OSD Lyrics 0.5计划中的一项新特性就是提供一个HTTP Player接口,使得可以方便地实现网络播放器支持. 作为其副产品之一,豆瓣电台的支持已经初步实现了. 代码库在 https://github.com/osdlyrics/osdlyrics-doubanfm.

豆瓣的基础架构

- - 博客园_知识库
  本文根据InfoQ中文站对豆瓣洪强宁(@hongqn)的沟通交流整理而成. 洪强宁介绍了豆瓣的架构和组件,并分享了豆瓣基础平台部的一些团队经验. 文中截图来自洪强宁在2013年CTO俱乐部中的分享.   豆瓣整个基础架构可以粗略的分为在线和离线两大块.   BeansDB项目可以说是一个简化版的AWS DynamoDB,该项目在2008年启动,2009年开源,第⼀版使⽤tokyo cabinet作为存储引擎,2010年使⽤bitcask存储格式重写了存储引擎,性能更好.

2015年豆瓣高分榜

- - 豆瓣blog
在过去的一年里,豆瓣用户有了更丰富的生活,标记了更多项目,包括图书、电影、音乐、东西、小组等. 我们根据这些标记,整理了2015年口碑最好的兴趣榜单. 在这里,你也许会发现:今年最爱的书 《你今天真好看》也受到了大家的欢迎;你和友邻一直都在共同关注着 “我不知道该如何像正常人那样生活”专栏;原来电影 《心迷宫》有那么多人看过并给了高分;那张被友邻们念叨了好久的 《敷衍》你一直没来得及听…….