Facebook的神秘武器：A/B测试和离站数据

标签： facebook 武器测试 | 发表时间：2014-04-25 23:43 | 作者：柯基小虫

出处：http://tech2ipo.com/feed

屏幕快照 2014-04-25 23.27.35.png

很多人都以为 Facebook 已经没以前那么 cool 了。

然而 Mark Zuckerberg 并不想让你有这样的想法。他们周三宣布了刚过去季度的财报，看来他们的在用户中的好感度还是维持得不错的。Zuckerberg 透露，平均每天，Facebook 的 12.8 亿名用户中的 63% 都要 至少登陆网站一次。而在财报发布前过去的一个星期中，有 6 天至少 50% 的用户登陆了 Facebook。

那么，是什么让 Facebook 反而变得更流行了，而不是我们以为的“更无聊”了呢？

因为 Facebook 正在学习你的喜好，并且在为了你而变得更好。

尽管 Facebook 一直在提取你的数据信息来进行更精准的广告投放，至少他们也在利用机器学习来了解你的喜好，了解哪些好友的帖子是你打开应用时更想要看到的。广告商是 Facebook 想要吸引的人，但只有巩固更高的用户活跃度才能为 Facebook 带来广告或是其他方面的收入。

失用户者，失天下。

那么 Facebook 是如何学会我们的喜好的呢？Facebook 的 news feed 产品团队领导 Will Cathcart 表示，答案并不简单，而是存在于算法、机器学习，乃至更宽泛的互联网中。

Facebook 2006 年推出了 news feed，然而一年后推出了“ 赞”（like）按钮——有了赞，Facebook 才开始基于你和你朋友以及朋友的朋友的喜好，学习倒你可能喜欢看到什么样的帖子。从 8 年前，到现在，news feed 已经从简单的时间逻辑排列的帖子列表，逐渐演化成了机器学习的产物（为什么我的 feed 还是 James Franco 在刷屏？坑爹！）。在这个 feed 中，所有的帖子按照时间顺序，并基于你可能的喜好程度进行排列。News Feed 的最终目标，举个例子，你打开页面的时候能够先看到你的大学室友生了个宝宝，而不是你远方表哥的天天酷跑成绩。

曾几何时，Facebook 中的点赞，以及其他的分享、评论，甚至只是点击，都被作为 Facebook 重要的用户活跃度指标。然而，Cathcart 表示，这个逻辑并不严谨。工作人员逐渐发现了越来越多的弊端：一张搞笑的 Imgur 图片，可能会在发送数分钟内收获几千个赞，而一篇富有深度的乌克兰局势分析，可能会因为机器学习的短处，不能获得较高的权重，而大大减少被人们浏览到的机会。最终的结果就是：人们的 feed 上充斥着垃圾内容，而并非人们真正“like”的故事。

这还不是最烂的事。Facebook 的用户还会发现，成千上万人们点赞的帖子，却是其他人们讨厌的帖子。比如那些用引人瞩目的标题，诱导别人点赞或分享的无聊文章，或是干脆使用假标题和图片，实际内容却是含有病毒或垃圾广告的网站。而 Facebook 却并未为这类内容设计一个“讨厌”（Dislike）按钮。Facebook 引以为豪的算法，并不能学习哪些内容是令用户感到厌烦的……直到一年之前，Facebook 才正视自己内容质量严重下滑的问题。

Facebook 上的诱导行为

这并不是 Facebook 一家的问题，而是所有采用算法、机器学习来进行功能级决策的社交网站，乃至所有互联网公司所面临的问题。该怎样解决？有人认为，在机器学习的基础上，加入一定程度真人的干预会有效果。但 Facebook 的 news feed 规模太庞大了，机器学习的工作量已经大到人类无法干预的程度。因而，Facebook 只能另辟蹊径，直接对算法下手。目前 Facebook 的答案是开始收集其他形式的用户信息，用于为机器提供更加人性化的指导——比过去的赞、分享、评论和点击更实用，更高级。

在这些新形式的用户信息提取工作中，有三类目前帮助了 Facebook 重新界定算法。它们分别为调查（Survey）、A/B 测试以及一项以前令人更捉摸不透的数据——离站数据（Off-site Data）：哪些帖子令用户点击之后离开 Facebook、离开了多久、回来之后用户进行了什么操作。

调查能够直接让 Facebook 提取到最关键的，别的提取方式无法提取到的信息；而 A/B 测试将 Facebook 进行的每一项算法微调都进行完整的测试。根据 Cathcart 的介绍，目前的规则是这样的：每当 Facebook 的工程师对算法进行一次微调之后，Facebook 都会单独针对这次调整将算法应用于一组用户进行测试，而每次调整进行的测试中的测试对象都不相同。Cathcart 透露，最多的时候甚至有 1000 种左右的不同版本的 Facebook 面向不同的用户运行。 Facebook 从所有测试对象中提取信息，来了解哪些算法优化真正改善了情况，而哪些优化没有产生效果。

最近，Facebook 测试了一系列用于纠正“诱导点赞”行为的算法优化。使用诱导点赞行为的人，会在帖子的标题、图片、视频甚至是正文中使用诱导性的画面或词语，利用用户的从众心态来诱导点赞，而这些帖子的发送者因此能够提高在用户 feed 中的权重。Cathcart 表示，Facebook 目前的进展良好，已经“很快见到垃圾内容的点赞减少，而给深度的文章和正常内容的点赞增多。”

而对于离站数据，Cathcart 进行了更清晰的解释： “假设你是一名每次看到纽约时报发送的帖子，都要点进去的人；不仅点进去，还在当前页面离开了 Facebook 前往纽约时报，并且驻足了一段时间，然后回到了 Facebook 中；Facebook 就能够因此判定纽约时报的内容对你来说权重应该调整的更高，即便你并没有为该条内容点赞。

同时，Facebook 也在对于”点赞“这个动作进行更加细致的区分。Facebook 将要在点赞的时间上下功夫：用户是看到文章先点赞再点进去看，还是看完了文章回来再点的赞，在未来将会有更明显的区别。很多人看到一个帖子，只是被唬人的题目或者好看的头图而吸引点了个赞。如果只有很少一部分的人在看过文章之后回来点了赞或者分享，这很有可能说明这篇文章并不值得分享。

业内曾经有一部分人士认为，Facebook 最近对于算法的“优化”，实则调低了竞争对手网站的内容权重，而相应提升了自己以及伙伴的内容权重。Cathcart 否认了这一观点，他坚称，Facebook 的算法内并不包含任何主观的评分系统，而是按照用户的喜好程度和操作行为进行权重的判定。举个例子，假如用户看到 A 网站的文章就点进去看，看到 B 网站的文章过了一会才去看，Facebook 就会在这种行为出现的更多之后，相应调整权重，让 A 的文章出现率更高。

归根究底， 在每一次用户登录的同时，Facebook 的后台都在计算并考虑为用户呈现什么样的内容，并且隐藏什么样的内容，即便这条内容是最新发出的。而Twitter 则确实做好了一个“时间线”的工作，用户想要看到更优质的内容，只能自己关注别人的时候多加注意了。因此，现在我们或许能够回答本文最一开始的问题：为什么 Facebook 反而变得更流行了？Twitter 这个当年西南偏南大会的当红炸子鸡，用户活跃度却略显萎靡。不论我们如何努力，如何自满地认为我们能比算法做得更好，事实上我们当中的大部分人并没有时间面对着电脑或手机屏幕，翻阅多达数千条的 Facebook 留言，只为找到更重要的那条信息。Facebook 有点像一个过渡负责的母亲，但我们却开始更加思念和依赖亲人的爱。

后话：

扯远点，如果哪天 Facebook 能够将我们在 Facebook 上“喜欢”的东西，和我们在真实生活中真正喜欢的东西区分开来，或许那天开始我们会真正的开始“喜欢”Facebook 这个令人又爱又恨的东西。

图片：Facebook、《社交网络》；原文： Slate

Facebook的神秘武器：A/B测试和离站数据

相关 [facebook 武器测试] 推荐：