互联网时代,依赖人肉样本库的内容分析是极度不靠谱的

标签: 我看互联网 | 发表时间:2012-05-04 22:44 | 作者:排头兵
出处:http://www.paitoubing.cn/blog

最近半年陆续接触数据分析工作,对于广告行业,有点感悟.
广告行业很认可建立样本库来推导整个市场的情况,来支持其购买媒介资源的依据.
这是有历史原因的,早期的电视,户外广告等都是单向传播的媒体.
早期电视媒体及户外广告,媒介售卖的其实是时间长度价值,
电视台媒体的播出时间资源总和其实是有限的.毕竟用户总要从中选择一个节目观看.
在计算样本库最小基数时 电视的总播出时间和用户的基数可以认为是不变的.
在电视机时代,样本库的调研方式是很有效的,至于样本库如何选择,最终采样的细节,我这里不探讨.
但样本库的基数需要参考整个市场的基数,电视面对的个体是家庭,国内有多少家庭,那么采用最少的样本库的规模,大致是多少.
样本库的方式有哪些缺陷?
样本库的方式对于大流量精品内容的分析,是可行的.但对长尾的检测对象的分析会有很大的问题.
这个和alexa的原理是一样的,往往alexa排名对于大站是比较靠谱的,网友可以找找相关文章.

我们看到国内几个做数据检测的公司,都依赖于样本库的方式来做推导.
比如admaster,秒针等公司分析的 广告既得流量,这些流量的量,远大于受众轮廓分析维度(地域,年龄,职业),不管怎么分配,都能得出大部分的流量归属. 这种样本库的分析方法是可行的.

而同时我看到一家神奇的公司,艾瑞同学,通过样本库(20W)的方式 可以神乎其技的调研各种(长尾)内容,品牌的数据调研报告.我个人认为是有很大的问题的.逻辑上是行不通的.

对于互联网数据检测这一块,秒针,admaster,GA的分析都是比较合理,逻辑上可行的.原因上面已经阐述过.

互联网的内容分析,能不能通过样本库的方式来做? 答案是 大流量内容的可以,长尾流量的内容是行不通的.除非样本库规模足够大.
互联网的内容 每年呈几何级数的爆炸式增长,用户与内容之间的距离越来越远,在用户周围充斥各种内容.也正是web2.0的这种大环境下,google,百度公司的价值凸显出来的原因,在早期内容不足的情况下,网友只需关注门户网站就好了.
互联网的视频内容,网友可以随意点播.用户对于互联网的使用对象 是整个互联网网站+客户端,或单机客户端。摆在用户前面的是海量的内容,及有限的时间. 简单的通过(1000W以下)人为协商安装软件样本库去分析长尾内容是极度不靠谱的.

在理论层面,网络的、数据传播,在主干线路,电信、移动运营商平台,走海底光缆各种途径.可以设置种种的检测关卡,都可以监控所有HTTP请求的数据,然后统一分析内容的欢迎程度,这也是极度靠谱的,Google做DNS解析,恐怕也是想知道什么内容好,什么内容差吧。

对于用户的分析,依赖于 平台级的互联网产品,比如百度,腾讯庞大的用户群,依赖于用户行为的分析,可以分辨出用户的属性.
这种方式获得数据,也远好于样本库的分析用户。

因此某家公司依赖于样本库的数据检测公司,全网检测数据,发布各种长尾内容数据分析报告.这种数据是极度不靠谱的. 如果是大流量的精品内容数据,这家公司又是没有价值的,因为百度指数,google trends比他们好N倍,样本库 尼玛呀。

所以 我力劝这种公司早点关闭这种不靠谱的部门,做咨询公司该干的事情吧.

在互联网文字时代,判断内容的优劣,做的最好的是搜索引擎,百度与google.其他公司都是纸老虎.
至于在视频和图片时代,google 公司也是牛B的一塌糊涂,百度是纸老虎.

相关 [互联网 时代 样本] 推荐:

互联网时代,依赖人肉样本库的内容分析是极度不靠谱的

- - 排头兵 @ Talk
最近半年陆续接触数据分析工作,对于广告行业,有点感悟. 广告行业很认可建立样本库来推导整个市场的情况,来支持其购买媒介资源的依据. 这是有历史原因的,早期的电视,户外广告等都是单向传播的媒体. 早期电视媒体及户外广告,媒介售卖的其实是时间长度价值,. 电视台媒体的播出时间资源总和其实是有限的.毕竟用户总要从中选择一个节目观看.

互联网时代的应用设计

- james - 所有文章 - UCD大社区
在互联网时代如何开发一个成功的应用. 先发放一万份调查问卷,找几十个人关在黑屋子里花两年时间研发,然后期待着一旦推出就颠覆整个互联网. 我不得不抱歉地说,以这样一种方式研发一款互联网应用,在互联网时代已经不太适用. 互联网应用单纯地从和传统应用的运行环境下的不同所带来的差异就足够决定互联网应用并不是把传统应用简单地搬到网上.

几款移动互联网时代的本地化应用

- WanZheng - 爱范儿 · Beats of Bits
从未想到基于手机的生活方式会变成这样,也没想到手机会变成如此的重要. 变化如此之快,真的难以想象,这就是移动互联网时代的移动生活. 大家都知道移动互联网是一座金矿,而且很多的互联网从业者或者是爱好者已经投入到挖矿过程当中. 在这样的时代背景下不断产生很多有价值的商业模式和很 Cooool 的产品,而且它们在不断融入到我们的生活当中.

移动互联网时代的本质与机会

- 彭全兵 - 互联网的那点事...
在2008年,2009年的系列前文《Web3.0:呼唤虚拟机器人时代的到来》,《心理学与SNS:观察与实践》,从信息与信任的角度,辨析了Web的下一步发展方向,并为互联网界的同仁引入一个社会网络分析的视角. 今天,继续心理学的视角,从物理计算与心智计算的交互角度,探讨移动互联网时代的本质与投资机会,同样,希望为新时代来临而兴奋的各位提供一个计算心理学的视角.

互联网时代里的用户模型

- xcv58 - 微软亚洲研究院
编者按:还记得在电影《黑客帝国》里,人们生活在一个虚拟的世界中,每个人都只是一段程序,一个模型. 当然,现在的科技还不具有这么大的能力. 在如今的互联网时代里,有很多网站、计算机都在试图去建立用户模型,理解个人的行为和想法,甚至试图去预测人们的意图. 或许有一天,会有那么一个模型出现开启了一个崭新的世界.

马化腾:互联网新时代的晨光

- 品味视界 - cnBeta.COM
不管已经出现了多少大公司,人类依然处于互联网时代的黎明时分,微微的晨光还照不亮太远的路. 在这个行当里,不管一家公司的赢利状况有多么喜人,也都随时面临着被甩出发展潮流的风险.

互联网时代,数字遗产何处以安?

- - FeedzShare
来自: tech2ipo - FeedzShare  . 发布时间:2012年04月18日,  已有 2 人推荐. 数字化时代来临之前,死亡还是一个简单问题,人们的财产可以按照其遗愿分配. 但这些财产都是物质财产,比如汽车、房屋、珠宝等等. 而现在,Facebook、PayPal、邮箱、网游帐号等这些数字财产的处置却成了棘手的问题.

马化腾:移动互联网时代的机遇

- - 行业资讯
  【创业邦讯】2012全球移动互联网大会(GMIC)今日上午9时将在北京拉开帷幕,为期三天的本届大会以跨界、融合、变革为主题,通过全球移动互联网产业的巅峰对话、G20闭门峰会等多个单元,探讨移动互联网领域的趋势与机遇. 腾讯CEO马化腾出席大会并发表演讲,他表示应用、数据流,搜索和安全是移动互联网时代充满机遇和挑战.

互联网时代如何处理信息过剩

- - 海涛戏说
总结了一下,主要由于以下几个原因造成的:. 1.整体的目标不是很明确的,虽然说大的方向很明确了,但是没有细化,因此也就造成了收集了很多与此相关的资料,我的理想是做培训,但是在培训行业里面又有很多小的板块,但是具体去做哪一块,到目前为止还没能够确定下来,并且在培训这一块,资料是最多最杂的,各种文档,PPT,pdf文件,各类视屏,音频文件等等,所以收集了大量这种资料,每一个板块都有,所以造成资料量信息量非常大.