Facebook的神秘武器:A/B测试和离站数据

标签: facebook 武器 测试 | 发表时间:2014-04-25 23:43 | 作者:柯基小虫
出处:http://tech2ipo.com/feed

很多人都以为 Facebook 已经没以前那么 cool 了。

然而 Mark Zuckerberg 并不想让你有这样的想法。他们周三宣布了刚 过去季度的财报,看来他们的在用户中的好感度还是维持得不错的。Zuckerberg 透露,平均每天,Facebook 的 12.8 亿名用户中的 63% 都要 至少登陆网站一次。而在财报发布前过去的一个星期中,有 6 天至少 50% 的用户登陆了 Facebook。

那么,是什么让 Facebook 反而变得更流行了,而不是我们以为的“更无聊”了呢?

因为 Facebook 正在学习你的喜好,并且在为了你而变得更好。


尽管 Facebook 一直在 提取你的数据信息来进行更精准的广告投放,至少他们也在利用机器学习来了解你的喜好,了解哪些好友的帖子是你打开应用时更想要看到的。广告商是 Facebook 想要吸引的人,但只有巩固更高的用户活跃度才能为 Facebook 带来广告或是其他方面的收入。

失用户者,失天下。

那么 Facebook 是如何学会我们的喜好的呢?Facebook 的 news feed 产品团队领导 Will Cathcart 表示,答案并不简单,而是存在于算法、机器学习,乃至更宽泛的互联网中。


Facebook 2006 年推出了 news feed,然而一年后推出了“ 赞”(like)按钮——有了赞,Facebook 才开始基于你和你朋友以及朋友的朋友的喜好,学习倒你可能喜欢看到什么样的帖子。从 8 年前,到现在,news feed 已经从简单的时间逻辑排列的帖子列表,逐渐演化成了机器学习的产物(为什么我的 feed 还是 James Franco 在刷屏?坑爹!)。在这个 feed 中,所有的帖子按照时间顺序,并基于你可能的喜好程度进行排列。News Feed 的最终目标,举个例子,你打开页面的时候能够先看到你的大学室友生了个宝宝,而不是你远方表哥的天天酷跑成绩。

曾几何时,Facebook 中的点赞,以及其他的分享、评论,甚至只是点击,都被作为 Facebook 重要的用户活跃度指标。然而,Cathcart 表示,这个逻辑并不严谨。工作人员逐渐发现了越来越多的弊端:一张搞笑的 Imgur 图片,可能会在发送数分钟内收获几千个赞,而一篇富有深度的乌克兰局势分析,可能会因为机器学习的短处,不能获得较高的权重,而大大减少被人们浏览到的机会。最终的结果就是:人们的 feed 上充斥着垃圾内容,而并非人们真正“like”的故事。

这还不是最烂的事。Facebook 的用户还会发现,成千上万人们点赞的帖子,却是其他人们讨厌的帖子。比如那些用引人瞩目的标题,诱导别人点赞或分享的无聊文章,或是干脆使用假标题和图片,实际内容却是含有病毒或垃圾广告的网站。而 Facebook 却并未为这类内容设计一个“讨厌”(Dislike)按钮。Facebook 引以为豪的算法,并不能学习哪些内容是令用户感到厌烦的……直到一年之前,Facebook 才 正视自己内容质量严重下滑的问题

Facebook 上的诱导行为

这并不是 Facebook 一家的问题,而是所有采用算法、机器学习来进行功能级决策的社交网站,乃至所有互联网公司所面临的问题。该怎样解决?有人认为,在机器学习的基础上,加入一定程度真人的干预会有效果。但 Facebook 的 news feed 规模太庞大了,机器学习的工作量已经大到人类无法干预的程度。因而,Facebook 只能另辟蹊径,直接对算法下手。目前 Facebook 的答案是开始收集其他形式的用户信息,用于为机器提供更加人性化的指导——比过去的赞、分享、评论和点击更实用,更高级。


在这些新形式的用户信息提取工作中,有三类目前帮助了 Facebook 重新界定算法。它们分别为调查(Survey)、A/B 测试以及一项以前令人更捉摸不透的数据——离站数据(Off-site Data):哪些帖子令用户点击之后离开 Facebook、离开了多久、回来之后用户进行了什么操作。

调查能够直接让 Facebook 提取到最关键的,别的提取方式无法提取到的信息;而 A/B 测试将 Facebook 进行的每一项算法微调都进行完整的测试。根据 Cathcart 的介绍,目前的规则是这样的:每当 Facebook 的工程师对算法进行一次微调之后,Facebook 都会单独针对这次调整将算法应用于一组用户进行测试,而每次调整进行的测试中的测试对象都不相同。Cathcart 透露,最多的时候甚至有 1000 种左右的不同版本的 Facebook 面向不同的用户运行。 Facebook 从所有测试对象中提取信息,来了解哪些算法优化真正改善了情况,而哪些优化没有产生效果。

最近,Facebook 测试了一系列用于 纠正“诱导点赞”行为的算法优化。使用诱导点赞行为的人,会在帖子的标题、图片、视频甚至是正文中使用诱导性的画面或词语,利用用户的从众心态来诱导点赞,而这些帖子的发送者因此能够提高在用户 feed 中的权重。Cathcart 表示,Facebook 目前的进展良好,已经“很快见到垃圾内容的点赞减少,而给深度的文章和正常内容的点赞增多。”

而对于离站数据,Cathcart 进行了更清晰的解释: “假设你是一名每次看到纽约时报发送的帖子,都要点进去的人;不仅点进去,还在当前页面离开了 Facebook 前往纽约时报,并且驻足了一段时间,然后回到了 Facebook 中;Facebook 就能够因此判定纽约时报的内容对你来说权重应该调整的更高,即便你并没有为该条内容点赞。

同时,Facebook 也在对于”点赞“这个动作进行更加细致的区分。Facebook 将要在点赞的时间上下功夫:用户是看到文章先点赞再点进去看,还是看完了文章回来再点的赞,在未来将会有更明显的区别。很多人看到一个帖子,只是被唬人的题目或者好看的头图而吸引点了个赞。如果只有很少一部分的人在看过文章之后回来点了赞或者分享,这很有可能说明这篇文章并不值得分享。


业内曾经有一部分人士认为,Facebook 最近对于算法的“优化”,实则 调低了竞争对手网站的内容权重,而相应提升了自己以及伙伴的内容权重。Cathcart 否认了这一观点,他坚称,Facebook 的算法内并不包含任何主观的评分系统,而是按照用户的喜好程度和操作行为进行权重的判定。举个例子,假如用户看到 A 网站的文章就点进去看,看到 B 网站的文章过了一会才去看,Facebook 就会在这种行为出现的更多之后,相应调整权重,让 A 的文章出现率更高。

归根究底, 在每一次用户登录的同时,Facebook 的后台都在计算并考虑为用户呈现什么样的内容,并且隐藏什么样的内容,即便这条内容是最新发出的。而Twitter 则确实做好了一个“时间线”的工作,用户想要看到更优质的内容,只能自己关注别人的时候多加注意了。因此,现在我们或许能够回答本文最一开始的问题:为什么 Facebook 反而变得更流行了?Twitter 这个当年西南偏南大会的当红炸子鸡,用户活跃度却 略显萎靡。不论我们如何努力,如何自满地认为我们能比算法做得更好,事实上我们当中的大部分人并没有时间面对着电脑或手机屏幕,翻阅多达数千条的 Facebook 留言,只为找到更重要的那条信息。Facebook 有点像一个过渡负责的母亲,但我们却开始更加思念和依赖亲人的爱。


后话:

扯远点,如果哪天 Facebook 能够将我们在 Facebook 上“喜欢”的东西,和我们在真实生活中真正喜欢的东西区分开来,或许那天开始我们会真正的开始“喜欢”Facebook 这个令人又爱又恨的东西。

图片:Facebook、《社交网络》;原文: Slate








相关 [facebook 武器 测试] 推荐:

Facebook的神秘武器:A/B测试和离站数据

- - TECH2IPO创见
很多人都以为 Facebook 已经没以前那么 cool 了. 然而 Mark Zuckerberg 并不想让你有这样的想法. 他们周三宣布了刚 过去季度的财报,看来他们的在用户中的好感度还是维持得不错的. Zuckerberg 透露,平均每天,Facebook 的 12.8 亿名用户中的 63% 都要 至少登陆网站一次.

分析称Chrome是谷歌战胜Facebook的终极武器

- 奇材 - cnBeta.COM
国外媒体周三发表文章称,谷歌一直希望继续成为互联网的核心,但却遭到了Facebook的强劲挑战. 与Facebook相比,谷歌的优势在于拥有自己的浏览器. Chrome不但发展迅速,功能也日益丰富.

【AD】谷歌与facebook联手测试:IPv6靠谱吗?

- Shadow - Solidot
谷歌,Facebook和雅虎这些对手们也有合作的时候. 明天,他们将联手进行首次全 球级别的IPv6测试,名曰:取名"世界IPv6日". 此举是为了在IPv4地址已经枯竭的情况下,推进互联网加速部署IPv6,谷歌表示当天将在其主站和Youtube上全面启用IPv6访问. IPv6的发展离不开运营商的 支持,全球运营商的IPv6策略和状态是怎样的.

雅虎和Facebook测试六度分隔理论

- Adam - Solidot
雅虎和Facebook合作测试著名的小社会现象“六度分隔理论”——两个互不相识的人只需很少的中间人就能建立起联系. 雅虎小社会实验目标是利用世界最大社交网络和它的7.5亿用户,判断两位不相识陌生人之间的社交路径长度. 任何有Facebook帐号的人都可以参加这项实验,你将被要求选择一位最可能知道“目标对象”的朋友,信息将会从一位朋友传递到另一位朋友,最后抵达目标对象.

雅虎和Facebook联合测试“六度分隔”理论

- bill - cnBeta.COM
雅虎和Facebook合作测试著名的小世界现象“六度分隔理论”――两个互不相识的人只需很少的中间人就能建立起联系. 对于“六度分隔”的假设,即世界上的任何人通过朋友相互认识,六个人后就可以将信息传递给任何人. 雅虎小世界实验设计的目的就是旨在利用世界最大社交网络 Facebook 和它的7.5亿用户,证明此假设是否成立.

Facebook 测试「信任朋友」密码解锁功能,真心希望大家永远没机会用到

- Woooon - Engadget 中国版
Facebook 现在正在测试一个全新的「信任朋友(Trusted Friends)」功能,让你可以将遗失的密码透过信任的好友取回. 首先你得先从好友清单中挑选出三到五个好友,然后他们就可以在你失忆时帮助你取回密码. 其实现实生活中还满常见到为了担心弄丢钥匙,而将其托付给挚友家人代为保管的做法,不过还真没想到透过社群网站的人脉资源竟然也可以有这样的应用,颇佩服这样的创意.

中国的Facebook?

- Lorna - It Talks--上海魏武挥的博客
腾讯近日很低调地推出了一个名为“朋友”的网络服务(也是一个使用独立域名的网站),这是一个与时下社交网站,比如人人、开心等非常类似的产品. 与它们一样,目前这个“朋友”上也加载了一些应用,当然,一贯的,以腾讯自家出品为主. 而且,我个人以为,未来会有更多的腾讯在QQ这个客户端上的应用,逐步向这个网站迁移.

Facebook初探

- 亦农 - 王建硕
今天的湾区阳光灿烂,280州际公路两边的绿色山坡和蔚蓝的白云,让人觉得自己是Windows XP桌面上的一个图标. 下午,2点,终于来到Facebook这个神奇的公司. 他们的新家在南加利福尼亚街的最里面,一幢两层的楼里. 他们刚刚从车位紧张的Palo Alto城里搬到这里,据说一层楼又要搬了. 我好像是他们再次搬地方前的最后一批访客.

Facebook败给Foursquare

- We_Get - GeekPark 捕风捉影
除了我们熟知的QQ,互联网世界里以自身强大资源来复制小公司的产品和服务的事,绝不少见. 去年8月份,Facebook推出了Facebook Places,这是一个类似Foursquare的基于地理位置的手机在线签到功能. Foursquare当时是社交网站新贵,几个月以后它成了代表着全球互联网方向中的SoLoMo中的Lo—Location.

Facebook的标语

- - 阮一峰的网络日志
Facebook即将 上市,一时之间成为全球新闻热点. 为了不错过商机,有人将Facebook内部的标语做成 海报,每张20美元,放到网上卖. 据说,从扎克伯格创业初期,这些标语就贴在Facebook的办公室,作为行动准则,激励员工. 虽然这些标语很简单,但是我发现,它们真的具有警醒的效果,能指导你做出正确的事.