漫谈在线广告:靠大数据扭转形象
这也许是互联网上第一个横幅广告
“系统会分析文档,得出相关的一个或多个主题,并根据主题投放相应广告。”——Google Adsense 专利文件上如是说,这份专利文件的提交日期是 2002 年 9 月,至今已有十多年。
根据 IAB 互联网广告行业盈利 报告,2012 年美国互联网广告行业总利润为 365.7 亿美元,相比 2011 年上升了 15%。其中移动广告占 34 亿美元,相比上升了 111%。这是个被寡头垄断的行业,年利润排名前十的公司在 2012 年第四季度行业总利润中占 72%。
互联网广告形式有多种,以搜索广告和横幅广告为主;能够为互联网广告公司带来收入的行业,以零售、金融为主。
Google 是业内当之无愧的第一,公司有超过 95% 利润来自广告,根据 Google 官方财报,2013 年广告收入为 505.78 亿美元(扣除成本前),年增长率达到 16%。
Google 盈利模式较为简单,一句话就能概括: “Google 投放广告,保证点击真实有效,企业为广告点击付费。”
具体是这样,企业在 AdWords 上购买关键词,用户进行搜索时,关键词对应广告便会出现在结果上方,一般按照点击次数付费。关键词重合的时候,就看竞价高低了;Adsense 是 AdWords 的进化版,适用范围更广,个人博客主便能挂上 Adsense 广告代码,能从点击中获得分红,为自己挣外快。广告内容会根据结合博客文章内容而生成,与阅读者兴趣相符。
这便是一般广告系统的原理,想方设法获取用户信息,投其所好放广告。
Google 目的是让用户尽量多的点击,而与广告系统类似的推荐系统,更注重的是帮助用户快速找到商品。
例如亚马逊会根据用户浏览和购买记录推荐同类商品,网站提供多种推荐信息,“查看此商品的顾客也查看了”、“购买了您最近浏览过的商品的顾客同时购买了”、“看过此商品后顾客买的其它商品”,它们出现在首页和商品页面,人情味比较浓,给人一种“我也可能有这方面需求”的感觉。界面简洁,同时也很简单,因为一个商品只有一个链接,有时首页底部根据浏览记录产生的推荐信息没法占满几个格子,亚马逊会翻出更早的浏览记录。
淘宝整个首页充满了推荐,在成功通过删除按钮解决“两周内自动登录”问题后,一般人直接进淘宝首页,看到的并不是个性化的推荐,但是登录后就不一样了,淘宝会根据浏览行为、购买记录提供相应商品。
搜索结果右侧有“掌柜热卖”栏,浏览衣服时,会有一定参考价值,并带来一定的撞衫几率,但在搜索电子产品、虚拟物品时,这一栏基本是垃圾信息,低质量商品和骗子居多。相对于亚马逊,淘宝商品种类和数量都更加可观,质量也层次不齐,这孕育了一种购买模式:在淘宝浏览商品和评价后,Google 或百度一翻,然后考虑到质量问题去亚马逊或京东购买,实在不行就海淘。
在广告的轰炸下,许多人已经养成了一双习惯性过滤广告的眼睛,Adblock Plus 也成了最受欢迎的浏览器插件之一。以至于笔者刚刚才意识到要解开 Adblock Plus,才对 Adsense 和其他效果进行测试。在随意浏览了一些网站后,粗略测试效果还是差强人意的:搜索 vpn,搜索结果上方的广告会根据 ip 地址,但是打开一个英文的 vpn 排行榜,出现了关节炎、VPS 服务器出租、中国代购;连开两个编程语言排行榜,都出现了 Johns Hopkins 大学的课程证书广告……倒也说得过去。
技术因素对广告效果影响匪浅,以网速为例,Forrester 的 研究表明,网页加载时间每增加一秒,广告转化率就降低 7%,对于一个日均收益 5000 美元的站点,这一秒导致的损失是每年 12.78 万美元。
我国平均网速为……有多种说法,0.81Mbps、1.6Mbps、2.93Mbps、3.14Mbps,但公认的事实是,不同运营商之间有天堑,网站访问不通畅,并不能达到理想网速和响应速度,笔者的铁通 2M 访问天涯、淘宝、微博的首页这类较为复杂的页面,至少要 15 秒才能够加载出足够正常浏览的数据,运气好时 30 秒能够加载完毕,不过通常 Chrome 的圈是永远转不完的。
而网页编程技术和浏览器的发展,远远地把平均网速甩在了身后,各种大图、“分享至”按钮、第三方网页整合,都是流量大户。新技术并没有改变网页的实质,只是增加了界面友好程度,而界面友好程度与浏览体验好坏的函数,理应呈自然对数模样,但加上带宽影响,就成顶点在上的二次函数了。
技术因素只是表象,更重要的,还是广告文案和产品本身。
Kindle 广告版就评价不错,“经常会给出很厚道的促销优惠码,优惠码运用得当甚至可能抵消掉购买广告版 Kindle 的成本。”甚至还有人研究出普通版转化为广告版的 方法。
Kindle 只是个例,更多人认为“羊毛出在羊身上”:广告中的商品,如果不是骗子,那它投入在广告中的钱,也许要从用户身上赚回来,所以还不如自己去找——这是个朴素而又充满着假设的理论。所以在价格和质量间进行取舍时,他们更愿意相信自己眼睛,忽略了“大数据能够提供靠谱商品”的可能性,这从根本上消除了一部分广告点击量。
在广告还局限于广而告之、人人平等、愿者上钩的时代,广告坑人的形象就已经深入人心,Facebook 也不能幸免,不少媒体人看到 Facebook 广告效率差而受批评的新闻时,第一反应就是,“嘿,真有人去点啊?”
最有代表性的是国内页游推广横幅,多以三国演义、西游记、老婆/室友不在时必须玩(实质是传奇)为题材,游戏质量差、同质化严重,关键还没有那些必须玩的东西。
“从目前的推广形式看,主要存在色情以及欺骗两种现象。首先,一些运营商通过带有情色性质的广告内容引起用户关注和点击,增加了注册机会;第二,广告内容与游戏内容不符,甚至毫无关联。”——《中国网页游戏市场研究报告》
以及众所周知的一个 例子——
这就构成了三星在线下进行垄断,而小米在线上构成独霸的局面…上网只上 QQ 和看网络小说的群体,这样的一批人才是构成消费的主体,他们主要的消费渠道还是通过一些实体店的柜台或者是知名的一些门户 IT 网站如中关村太平洋一类的网站进行手机选购,这样来看的话,三星小米垄断前十一也就不难解释了。渠道和营销的对传统市场的影响有时候真的远远超出我们的想象,而不是我们以 geek 的眼光单纯的去看产品参数和产品体验。
说明小米在互联网上广告的精准投放非常好,尤其是在女性用户非常多的 QQ 空间等社交网站。而且社交网络上非常多的关于手机的“伪发烧友”和一些著名科技网站进行推波助澜,小米的曝光率一直是居高不下,这样也许对女性的直接影响很小,但是影响了很多女性周围存在的很多“伪发烧友”,他们的资讯也大部分就是从这些官方媒体得来,绝大部分也是所谓的“键盘党”…而大多数女性周围就会存在这样的一些所谓“伪发烧友”来极力推荐小米,很多部分女性就会因此去选择小米而不是其他曝光率偏低的“中华酷联”了。
正如 Coursera 《内容策略》课程对于创造有效内容总结的 3 条规律所述:
-
信息会持续爆炸式增长。
-
每人每天的 1440 分钟都很宝贵。
-
如果你能提供比他们时间价值更高的内容,就能吸引注意力。
这些广告传播迅速,并且能利用消费者懒得去了解、低价就算质量有问题也合理的心理,抓住信息不对称,让人觉得“买就获得了更高的价值”,所以成功了,毫无疑问这属于“不浪费任何口水和金钱的精准营销。”
这和 Kindle 广告版一样,亦是个例,大数据时代的广告发展趋势与此本质不同,一个极端的情况是 基因信息销售市场,创业公司 Miinome 打算采取会员制,如果用户愿意把自己 DNA 数据用于营销,就能获得免费测序,“由用户来决定自己基因数据的去留和使用情况…可以把这些数据用在慈善、学术上,帮助福利机构和研究机构进行科学研究,降低科学研究成本。”
根据“你可能认识的人”发明团队管理者 DJ Patil 总结,著名的数据驱动型公司都有以下特征——‘
-
尽可能多的检测和收集数据,不论是在设计产品还是改善商业模式,如果不收集数据,就不会有头绪。
-
主动而有规律的进行收集工作,量化战略和产品的成功程度。
-
整理数据,让更多的人看到以发现问题,“群众的眼睛是雪亮的”。
-
深入分析数据变化的原因,以及数据不变化的原因。
《LinkedIn 首席科学家:创业公司如何善用数据,加入下一个千亿美元市场?》, 《还不会用“大数据”创业?盘点引领未来的 10 大初创企业》, 《1GB 隐私数据卖接近 2000 多块人民币》……随着这类新闻渐渐不再算是“新”闻,大数据的概念也渐渐深入人心,在根据数据和算法提高普遍意义上的广告效果基础上,个性化似乎成了各大广告系统和推荐系统的主要目标。
所有公司都在朝个性化方向搜刮隐私,只是定位有所差异:淘宝亚马逊之类,收集的是已经满足和尚未满足的需求,收藏、评价、购物车,主要是生活方面,衣食住行,除了房子所有人都无能为力之外,不少人都依赖网购,有了这些信息,定位一个人所属层次和群体,再根据热门购买推荐“你可能喜欢”,甚至发现整个群体的需求,也是很有可能的,只是需要的不仅是大数据科学家,还得人类学家、社会学家、心理学家…和一些失败的尝试。
Google 就没什么侧重了,只是细想起来非常可怕,假设 Google 没节操:Youtube 视频观看历史可以反应一个人的爱好,Android 手机的 GPS、短信、通话记录、程序数据(淘宝、微博、布卡漫画等等)和通讯录,Gmail 的邮件通讯,Play Store 里的信用卡信息,街景和无人驾驶车,Chrome 用户浏览内容和搜索记录,日历,网页索引后的分析,所有 Twitter 上的推文,DNS 服务器的解析记录统计,Google 翻译……
而实际上,官方有一份“我很严肃至于你信不信”的 隐私权政策,产品开发也受到了监管机构严格的审查,Google Now 的打造过程就 异常艰苦,一度遭到。(但是搭顺风车的一些所谓手机安全公司就难说了)
真正的大数据,应该是从不同维度,不同途径过来的各种格式数据碎片,并不限于文字/视频/声音/位置/图片等。只有将不同维度的数据放在一起判断,得出来的趋势才有可能更真实。雷同的数据积累的再多,超过某一个限度之后,我们再从新样本上获得的有用信息就越来越少,就如同经济学上的边际效应递减一样。而用简单点儿的话解释就是如果你已经交往过五个 IT 码农,那么第六个其实也不会新鲜到哪里去,倒不如重新调整方向,换个高富帅找点儿不同的刺激。 —— 《白话大数据》
在大数据这个工具的作用下,广告的职能正在从“单纯的促销”,渐渐转变成信息流通渠道之一。可以大胆预测,在不久的未来消费者会渐渐接受和依赖广告,因为只要动了购买某样甚至某类产品的心思,无处不在的广告就能为你介绍合适产品。
就像这样——
刀老师,听了你的大数据分享,我是否可以这么理解?大数据就是系统根据一个屌丝的年龄/身高/体重/穿衣风格/购物倾向等基本资料,加上以前看A片的频率/主演/风格/时长/快进次数,并且综合参考跟我一样的屌丝群体的女神/播放格式/地区等因素,当我打开电脑,自动给我推荐一部最合适我的 A 片?