你是如何被微信广告选中的?微信广告引擎与社交传播算法实践

标签: 技能GET | 发表时间:2017-07-04 11:47 | 作者:InfoQ技术媒体
出处:http://36kr.com

编者按:本文来自微信公众号 “InfoQ”(ID:infoqchina),作者陈功;36氪经授权发布。

微信广告自 2014 年上线以来,分别发布了公众号与朋友圈广告。微信广告系统承载了每天十亿级以上的访问量,紧密与微信平台生态相结合,同时利用了腾讯大数据体系进行效果优化。本文首先会给大家展示微信广告的整体系统架构,并介绍重要的功能模块和数据流程。其中会深入讲解广告投放时的播放节奏算法,看如何解决微信环境下的投放优化问题。

写在前面

图中这句话,也许大家曾在朋友圈中看到过,这就是比亚迪汽车投放广告的文案。该广告效果反响非常的好,于是有人就说,这是借着大数据的商业炒作,也有人说,所谓的选中其实是被广告算法选中,微信在其后有一个复杂网络在支持。那么这背后真正的逻辑是怎么样的呢?就让本文来揭秘吧。

本文将分为两个部分:第一部分,由于首次对外分享,先介绍一下微信广告的产品形态以及系统架构;第二部分,介绍微信广告是如何区别于传统效果广告,在品牌社交广告上曾做过的探索与思考。

由于篇幅限制,微信广告引擎核心算法策略模块就不展开一一介绍。这里选择品牌广告社交投放模块介绍,一个是因为它是我们微信广告核心特色模块之一,另外业界在品牌广告播放算法层面上的分享也十分少,所以希望能够通过本文和大家多做交流。


微信广告介绍

公众号广告


通过图中可以看到,除了传统的下载与图文外链形式之外,还有平台特色的关注类与卡券类广告。

最近我们也发布了广告互选平台,让流量主和广告主可以在上面进行自行交易,这也是广告产品的新形态。


朋友圈广告


如图所示的三个商业广告:宝马、可口可乐、VIVO 智能手机,在最初投放时期引发了社会热议。有些人表示收到的广告是可口可乐,有些人表示看见的是宝马广告,而有些人却在分析该类人背后的性格特点。然而,无论如何,他们讨论的话题恰好就是社交广告的精髓所在。

社交广告的效果,如下图右边所显示的第一个数字,其首次覆盖人群超过一亿;而第二个数字,点击互动率已超过 40%,40% 是极高的点击率,能产生这样的效果,广告的社交属性功不可没。


微信广告系统介绍

投放模块视图


先来看下系统的整体模块视图,我们分为 4 个层面。

第一层是投放端,除了可以在腾讯广告官网上投放外,还能在公众号平台内部闭环投放。

第二层是播放引擎,这里主要分为检索,粗选,精选。检索就是当一个用户来了之后,根据他自身的属性,比如年龄性别地域,以及广告投放的人群,做个匹配,选择出适合该用户的广告,可能有几千个。粗选就是将这上万条广告筛选 100 个再给后面的精选模块,精选再选择一个给到用户。可见粗选是注重速度,效果次之。这里会考虑新广告的扶持,类目的多样性,和预算不要花超等问题。最后是精选,会考虑更为细致。首先就是播放的节奏控制,这是我们后面重点要讲的,就是广告以一个什么样的节奏来投放。其次,也会考虑用户体验和生态等问题。

第三层,主要是数据相关的模块,之后会逐个介绍一下。

最后是一些支持的模块,比如反作弊,监控,审核等,我们也用了很多公司的基础组件。

这里是从模块层面整体看了下,下面再从数据流的角度来看下广告的业务场景。


业务数据流


首先,当用户刷朋友圈的时候,朋友圈后台就会把这个请求丢到广告引擎了,广告引擎根据自身的算法和其他数据模块综合计算给出一条合适的广告。引擎算法其中主要还会调用社交传播控制模块,在广告排序之前,先根据社交传播过程动态选定人群。用户拉取到广告之后,会对广告有各种行为,分别是曝光,点击和转化,在经过我们的反作弊模块鉴别之后,就用来计费和更新相关的数据模块。

而社交行为,还会进入到专门的社交扩散模块进行计算,供引擎使用。这个后面会详细讲到。

可以看到广告引擎的位置至关重要。


引擎在微信广告系统下如何考虑?


广告引擎的作用是不断调整广告主、用户、广告平台、生态方平台这四者之间的价值利益。对于用户而言,用户希望提升自己的体验,不愿看见过多的广告,不接受过多的广告骚扰,并且希望得到有价值的信息;而对于广告主,它想提升自己的效果或者品牌力;对于平台,它不仅仅为了赚钱,也要兼顾口碑;而对于生态方,即对朋友圈和公众号而言,不能有损生态方的利益,相反地,我们应该促进它的更好发展。


用户画像体系


要做好广告,首先得识别准用户。那么用户画像就是帮我们做这件事的。腾讯有近千款产品,分别覆盖了社交平台,游戏平台,电商平台等,提供了丰富的行为日志。帮助我们识别用户的基本人口属性,兴趣爱好等。

举个例子,我们通过用户在公众号中阅读的文章,就能挖掘出用户的阅读兴趣,也可以挖掘出用户的个人状态,比如是否高端等。那如果我们再加上时间的维度,我们就能知道用户的轨迹 -- 恋爱,结婚,生子,那么也就可以推送对应阶段的广告了。

在移动互联网时代,我们也对用户做了设备画像,这样就可以打通多个平台的数据,大大丰富了我们的原始数据。


互动和点击率预估模块


在知道用户属性之后,我们自然就想知道这个用户发生某种行为的概率,也就是广告领域里一直在说的点击率或者转化率预估问题。我们的系统已经做到全流程的实时化,从数据的收集到模块的训练更新。实时化对效果的提升是十分之大的。其次在模型的选择方面,我们也是经历了从 LR 到 FM,最后到 DNN。这也是业界发展的方向。最后也是比较特殊的地方在于我们的多目标预估问题,朋友圈广告有许多行为,比如头像点击,图片点击,名称点击等,我们需要在 10ms 内完成十几种行为的预估,这对算法和系统都是一种考验。


社交播放算法实践

为什么要做社交广告?


首先,我们为什么要做社交广告呢?这是因为微信广告诞生在微信平台之上,而微信是目前国内最大最有影响力的社交平台,所以广告也被寄予厚望。正如之前提到我们的初衷 -- 尝试做些改变。所以,我们在设计朋友圈广告产品时候,就希望让朋友圈广告,也像朋友圈的其他内容一样,成为一个话题,在朋友间流传开来,让好友去给这个品牌代言。于是我们就这样去设计了社交广告。

品牌广告在朋友圈场景下,它的话题传播会更有优势。

首先,朋友圈广告本身就是一条普通的内容,而且收到且互动之后就会沉淀在朋友圈 timeline 中,这样后续的互动提醒都是可以全程参与的,而市面上其他的社交平台广告产品都是在出卖广告位。

其次,朋友圈是一个熟人网络,而且是目前市面上最优质的熟人关系网。直观的想,熟人的推荐和口碑肯定是比陌生人要有力量的多。大家想想微商为什么能火,靠得是什么。这是因为现在的营销方式已经发生变化了。传统的效果广告,我们优化素材,吸引点击,进去还要想办法促成转化,一系列的链条。而现在基于社交传播的营销越来越火,不管是微信里的微商,还是微博的大 V 推荐和软文,都是利用社交关系在做营销。这里关键点是,社交影响力越强,营销的效果就越大。

举个朋友圈中例子,如果你看到一个好友做微商发布一个广告后,可能嗤之以鼻,把他拉黑,然后默默同情他怎么堕落到如此地步了。但如果很多好友都在同时推荐一个商品,你还能保证不受影响吗,这可就不好说了。我们希望社交广告也能有如此的效果。

社交广告推荐过程

我们先来看下传统的效果广告推荐过程:首先,用户通过检索系统,检索出 100 条广告。然后经过基于个人兴趣的点击率预估,得出对这 100 条广告每个的点击概率,再结合广告出价,统一进行排序,排第一的广告返回给用户。

而在朋友圈的社交广告中,首先当然还是经过检索。然后这里不再只是根据用户点击兴趣推荐,还需要考虑用户对这个广告的社交意愿。然后,在排序之前,我们还要经过一次社交传播的投放节奏控制。看看每个广告当前适合给哪些人群投放,对用户做一轮筛选,此时 100 个广告可能只有 50 个适合投放给该用户。最后,再经过考虑社交因素的广告排序,返回一个广告给到用户。

下面就来具体看看这 3 个过程

社交意愿、社交传播节奏控制、基于社交广告排序是社交广告投放三部曲。

第一阶段,社交意愿计算阶段,假设此刻有三个用户同时访问朋友圈,有宝马和可口可乐两个广告在线,该三个用户对这两个广告两两社交互动意愿;

第二个阶段,社交传播节奏控制,它是广告选人阶段,假如这个时刻是让三个人中最好那两个人才能收到广告,那么根据分数计算,发现此时小明此时此刻是没办法收到宝马和可乐这两个广告。但这仅仅只代表此时此刻,随着传播范围的扩散,以及小明受到越来越多的好友的影响,他在之后的某个时刻还是可能继续收到广告的。

第三个阶段,基于社交的排序阶段。此时用户已经拿到了那些他可以收到的广告列表,然后再把社交意愿分加入到排序公式之中,选择最合适的那条广告给到用户。


社交意愿的计算


用户的社交意愿,除了受个人主动的互动兴趣外,还受好友的影响。可以看下图下面影响力作用的几个阶段。首先,最中间,用户对两个广告有一个主动兴趣,这是不受其他人影响的。左边,有两个好友分别对两个广告进行了互动,他们与该用户的影响力都是不同的。右边,是一个传播的过程,表示假如我收到广告后,我的互动可能对其他人造成的影响。

我们通过一个例子来看下影响力在朋友圈环境下和品牌力感知的关系。假如你看到一个洗发水广告,可能就是超市常见的牌子,没用过也没怎么留意过。但此时已经有许多你的好友在下面点赞评论了,而且反应去屑效果真的很棒。这个时候,你可能会想到我的洗发水貌似用了还有头屑啊,那么要不要试试这个呢?此时,你可能回复一个好友说“我也试试去”,但也可能你就不回复了,不过此时你对这个品牌的印象一定是加深的。再想想这些讨论的好友中,假如还有一个是你的老板,可能平时你们都没机会说话,那这个时候要不要也点个赞表达下赞同呢?还可能能吸引下关注。这个就是社交影响力的作用,而这里的主要问题是影响力如何量化。

首先,好友之间的影响力评估,越是亲密的两位好友影响力越大,因此一般会基于亲密度进行模型建设。但我们通过限量的系统发现其带来的收益很小,便对其进一步的数据分析发现主要原因是目标不一致。

举个例子,我们与父母特别亲密,但是我们却不会在他们的朋友圈发表的内容进行评论。于是,我们进一步改进通过更加相关的行为评价影响力,即 A 能影响 B 日常互动的概率,将其定义为影响力,但该数据在一定置信度下十分稀疏,所以通过模型预估方式进行计算。

这里,除了基础的一些特征之外,我们还运用了几个网络特征。比如,好友关系网,正常情况下微信用户有 8 亿,那么这就是一个 8 亿 *8 亿的邻接矩阵。这个是很难用作模型训练的 feature 的。同时,还有其他的一些关系网,比如消息互动,文章阅读等。那么这里,我们采用一种叫 node2vec 的方法将这些图节点映射为一个向量。这个向量维度比较低,我们就能拿这些来进行训练。最终通过 GBDT 和 LR 来进行影响力的预估。

Node2vec 是一种 embedding。首先,就是如何采用图中的节点信息可以尽量保留多一些原始的网络信息。 换到自然语言处理的场景,一般个词可以用它周围的词来表示它,这个也就是 word2vec 的思想。那同理到图中,我们就是可以用一个节点的周围节点来代表它,node2vec 就是用解决如何抽样的问题。

那么,我们拿到抽样后的向量就可以用 word2vec 的方法来进行训练,得出每个网络节点可表示的向量。

前面我们已经知道了两个好友对自己的影响,那么多个好友又是如何互相影响呢?这里我们就引入了传播力模型来对这个问题建模求解。

传统的影响力模型有许多种,这里我列了最为常见的独立级联模型。它的原理是这样的,一个用户每个好友都对自己有一个影响力,这个影响力可以用前面我们提到的方法计算出来。初始时刻,已经有一些人是被激活的,这些人就是种子用户,具体的选择我后面会说到。然后,一个用户的每个已经被激活的好友,根据他们之前的影响力去计算一个激活概率,轮流去激活该用户。这样子迭代下去直到每轮没有新激活用户位置。

传统独立级联模型直接应用会存在图中说的一些问题,所以改为上图中下面的形式(示意),但这样直接做还会存在工程上的问题。主要在于广告系统的时延要求是十分低的,假如用户有 5000 个好友,分布在几百台存储机器上,要在 20ms 内读完,这几乎是不可能完成的事情。

那么这种读扩散的方式不行,我们就换一个思考,采用写扩散的方式。当用户的一个点赞评论数据接收到之后,我们放入消息队列之后,然后社交扩散模块取出,根据关系链,权威度,传播力在内存中计算他对每个好友的影响,然后再告知所有好友这个信息。但是,假如是一一告知,5000 个好友就要 5000 次网络调用,这个开销也是接受不了的。所以,我们会根据路由规则和机器列表,将属于一台机器的用户合并起来写入,最小化网络调用。

完成这些之后,当一个用户来拉取广告时候,只需要一次网络调用,就可以拿到好友对他的影响力了。

注:目前为了引入更多的特征做实时推荐,我们已经将上面架构改为基于图形数据库的形式,架构上更加复杂和巧妙,之后会有文章专门再介绍。


社交传播节奏控制


社交传播节奏控制的核心思想是先传播给优质人群,再让优质人群带动其他人。如下图所示,Ripple 扩散传播系统。

所谓优质人群,在投放初期被定义为种子用户。他们可以通过一些方法进行挖掘:第一,广告主的粉丝,铁杆粉丝用户;第二,广告主最为了解自己的用户,因此根据广告主的需求做出定向挖掘,历史行为用户。正如大家所了解的,InfoQ 粉丝群体庞大,我们之前将粉丝和行业影响力大的人群选择出来进行投放,确定优质人群。与此同时,如果觉得量级不够,我们还可以通过 lookalike 的方法进行用户扩展,在大盘里面找到与之前两步得到的相似用户。

那么投放中如何确定优质人群?我们通过引入一个全局的实时排名队列来分析每个用户与每个广告实时的社交价值,在不同的时段,我们定义优质人群的函数是不同的。


选取优质用户之后,就会在我们的 ripple 扩散传播系统中进行扩散,从种子用户阶段投放,然后逐渐向外扩展,一直到广告预算结束。过程看似简单,但实际投放是一个较为复杂的过程。

首先,影响力是实时动态变化的过程;其次,朋友圈广告是基于用户的拉取,而不是简单的推送,所以无法理想化的扩散。

在这两个背景之后,还需要面临具体如何扩散的问题,比如扩散的比例值如何确定;另外,一般品牌广告主也需要合约保量,在保量需求下完成社交扩散动作,这对系统实时性与算法都有很高要求。下面的图中列举了波纹传播系统的几个组成。



基于社交的排序


能换取别人的关注、评论、点赞的事物都可以称之为社交货币。系统内所引入的变量将它价值化、货币化。将货币化的值放入总的价值排序之中和广告主的初价以及广告主的信息进行排序,广告价值的放大代表着我们对社交传播的重视。


写在最后


当初有很多人问,什么是社交广告?回答普遍都是在社交平台上的广告就是社交广告。开始我也以为就是这样,可是经历了一个一个优秀的案例,以及一波又一波的社会热点,我觉得,那些能让我们抒发情感,聆听好友心声的广告才称得上社交广告。我们也会继续在社交广告上继续做出创新,因为我们的目标是让广告,也可以成为生活的一部分。


作者介绍:陈功,腾讯微信广告引擎逻辑负责人。浙江大学计算机研究生毕业,2011 年加入腾讯微信,负责微信数据计算系统建设,以及微信基础数据的分析与挖掘工作。2014 年加入微信广告项目团队,主要负责广告引擎精选的系统架构与算法策略设计,现任微信广告引擎策略 Team Leader。平时对广告业界动态,大型系统架构,模型算法,都十分感兴趣。


相关 [微信 广告 微信] 推荐:

你是如何被微信广告选中的?微信广告引擎与社交传播算法实践

- - 36氪
编者按:本文来自微信公众号 “InfoQ”(ID:infoqchina),作者陈功;36氪经授权发布. 微信广告自 2014 年上线以来,分别发布了公众号与朋友圈广告. 微信广告系统承载了每天十亿级以上的访问量,紧密与微信平台生态相结合,同时利用了腾讯大数据体系进行效果优化. 本文首先会给大家展示微信广告的整体系统架构,并介绍重要的功能模块和数据流程.

微信的价值

- - 钛媒体TMTpost—把脉科技资本论
昨天,微信正式发布了4.5版. 在我看来,这个新版本释放出了两个关键的信号,第一个是微信只做底层的平台,具体的应用会开放给第三方来做,第二个是微信公众账号未来的形态,一定不是简单的对话,而是类似app的形态. 首先,我们看到微信把保存公众账号文章这个功能,开放给了“我的印象笔记”. 这是一个非常基础性的功能,微信完全可以自己来做,而且自己做从客户体验角度来讲,也会最方便,但是它把它开放了.

微信是什么?

- - 《商业价值》杂志
一个移动互联网时代全民都在参与回答的问题. 2012年12月,丁香园CTO、知名互联网评论人冯大辉在推出不久的微信公众平台上创建并运营自己的公众号一段时间之后,说了一句让人印象深刻的话,“对话即服务,对话即搜索”. “微信一定会蚕食搜索引擎的市场……搜索本质上也是服务,天气、旅游、购物、股票……皆可拓展.

微信是鸡肋?

- - 月光博客
   微信是一款跨平台的通讯工具,作为腾讯最为倚重和寄予厚望的产品,承载着腾讯移动互联网称霸之梦. 本文希望透过微信,加深对社会化媒体与移动互联网的理解,概述微信在社会化媒体及移动互联网的角色定位.   我们可以用微信与好友一对一聊天,具有私密性强,快捷便利的特点,这是微信的一个基本功能. 陌陌,微博私信,QQ等都可以具有这样的功能,显然这形成不了微信的核心竞争力.

微信在东南亚推“WeChat GO 微信乐游卡”,聊微信免流量

- - PingWest品玩
PingWest 品玩 9 月 8 日报道,微信与新加坡第二大电信运营商 StarHub(星和电信)合作,推出一款名为“WeChat GO 微信乐游卡”的电话卡产品. “微信乐游卡”用户在境内可以免流量使用微信,同时提供 7 天和 12 天两种套餐,定价分别为 16 新元和 32 新元. 前者提供 7GB 定额流量和 1GB 高速可漫游流量,500 分钟本地通话时长以及 60 分钟直拨主叫中国大陆通话时长;12 天套餐提供 15GB 定额流量,2.4GB 高速可漫游流量,3000 分钟本地通话时长和 150 分钟主叫中国大陆通话时长.

微信架构的启示

- - Tim[后端技术]
腾讯大讲堂中最近分享了周颢演讲的 微信技术总监解读微信架构的秘密,看完视频的一些心得. 微信的技术设计上有很多微创新,看起来都很小,但是对于系统的稳定性、用户体验及开发敏捷都具有重要作用. 由于客户端升级不便,从技术设计上尽量利用后端的设计来减少依赖客户端升级的方法. 如某个版本新增了群聊功能,按常规思路,需要所有客户端升级才能全部打通.

「微信」没有未来

- - Page to Page
不管从软件的界面、交互和速度那一个单点上来说超过微信的同类应用都能数出好几个,不过因为它的出身好,占着QQ用户群这个庞大的资源,所以不用它还不行,不用就完全脱离了群众. 曾经的Msn已经远去,Gtalk也清冷了,因为时不时还要接收一下QQ离线消息,不情不愿也要用上微信,不喜欢它繁杂的功能集成,只能选择关闭的仅剩QQ离线消息.

微信开发入门

- - 行业应用 - ITeye博客
【做微信平台开发需要以下步骤,wx.zip示例可以参考,修改配置即可】. 1.申请一个公众号(订阅号或者服务号). 2.需要有自己的服务器(建议使用花生壳做内网映射). * 检查是否是微信发送的请求. * @param signature 签名. * @param timestamp 时间戳. * @param nonce 随机数.

微信官方UI库:WeUI

- - 标点符
WeUI是一套同微信原生视觉体验一致的基础样式库,由微信官方设计团队为微信 Web 开发量身设计,可以令用户的使用感知更加统一. 包含button、cell、dialog、 progress、 toast、article、actionsheet、icon等各式元素. 演示地址; http://weui.github.io/weui/.