发表人:David W. Baker,Google广告研发总监
这是系列博文中的第一篇,该系列文章将以更高的透明度,介绍我们如何通过检测和清除垃圾广告,让我们的广告更安全。——编者。 数周以前,我们
曾发博文讲述了我们为打击不良广告而做出的各种努力,并且分享了一个
视频对我们采用的基本方法进行了简单介绍。今天,我想更进一步,与大家分享一些我们所用的广告系统旨在阻止不良广告展示的一些见解。我们在以安全和诚信为出发点,制定了
广告政策—例如,我们禁止
恶意下载、
仿冒商品,或含有
不明确结算行为的广告。为了阻止这类广告的展示,我们将自动化系统和人工输入相结合,对每年提交给Google 的数十亿广告进行审查。我就是众多工程师中的一员,帮助确保Google不会向用户展示不良广告就是我们的职责。
我们采用三管齐下的策略制定了方针,每个部分集中解决问题的一个层面:广告、网站和广告帐户。这些系统相辅相成,互通信息,让我们能够对不良广告发动全面攻击。
例如,对于销售仿冒商品的网站,这项三管齐下的措施旨在查找各种模式,将这类网站标记出来,从而阻止不良广告的展示。
广告审查会关注这类广告的模式和广告主选择的关键字。
网站审查会分析整个网站,以确定其是否正在销售仿冒商品。
帐户审查旨在确定一个新广告主是否为真正的新注册用户,或者仅仅是一个“惯犯”,试图滥用Google的广告系统。下面我们就如何审查这三个组成部分的各项内容展开详细介绍。
广告审查 广告是指向用户展示的,附带一个超链接至一个特定的网页或登录页面的一段信息。广告审查系统会核查单个广告和登录页面,这可能是广告主最为熟悉的一个系统。每当广告主提交一个广告,我们的系统会立即执行初步审查。如果广告内没有提示任何需要进一步审查的内容,我们会告知广告主,广告“有效”,然后仅在
google.com上向关闭了
SafeSearch功能的用户展示这则广告。如果广告被标注为需要进一步审查,大多数情况下,我们会称其为
“审核中”广告,不会进行展示。此后,该广告进入我们的自动化流水线,通过机器学习模式,规则引擎和登录页面分析来进行更为广泛的审查。如果我们的自动化系统得出的结果为高度可信,我们会批准广告在Google 和我们所有合作伙伴那里展示(“已批准”),或者批准广告在特定区域面向恰当的用户展示(“已批准-受限”),又或者拒绝展示(“已拒登”)。如果我们的自动化系统无法确定结果,我们会将广告发送给实际工作人员来做出最终决定。
网站审查 网站会有很多不同的页面,每个页面可以通过不同的广告进行链接,通常我们称其为一个域。我们的网站审查系统会确认适用于整个网站的政策问题。系统将从所有广告主的所有广告内汇集各类网站,并定期进行信息抓取,建立一个信息库,并不断改善,更新诈骗和新网站审查信息。我们会存储广告宣传的网站内容,并通过机器学习模式和规则引擎来分析网站。网站审查系统的神奇之处在于,它可以理解网页上的语言结构,从而可以对网站内容进行分类。网站审查将决定是否应禁用整个网站,从而阻止任何账户中发布的广告导向这个网站。如果自动化系统无法判定结果是否高度可信,我们会将其发送至工作人员进行人工审查。如果网站被禁用,我们会告知广告主,该网站不符合“网站政策”。
帐户审查
帐户是某个特定广告主的所有广告的集合,以及广告主针对这些广告的目标和拍卖所作出的特定选择。例如, 一个帐户可能有很多的广告,而这些广告可能指向多个不同的网站。帐户审查系统会不断地评估单个广告主帐户,以确定整个帐户是否应接受审查或因违反政策而关闭。这个系统会“监听”各种信号,如广告主提交的广告和关键词,预算变化,广告主的地址和电话号码,广告主的IP地址,连接到该帐户的禁用网站,处于“已拒登”状态的广告等。该系统会不断地重新评估所有帐户,纳入新数据。例如,如果一个广告主,从一个新的IP地址登录,该帐户将被重新评估,以确定这一新信号是否表明我们应该对广告主的帐户内容采取深入核查。如果帐户审查系统判定某一特定账户的可信度有待怀疑,它将自动停用该帐户。如果系统不能确定,它将停止这一账户发布任何广告,并要求工作人员来决定该帐户是否停用。
即使有了这些机器系统和人工的努力来阻止不良广告的发布,我们不想要的一些广告有时还是会偷偷溜出来。有很多恶意用户十分执着 -——他们为了利用我们的用户,企图滥用Google的广告系统。如果我们关闭了一千个帐户,他们会用不同的方式再创造出两千个来,犹如一场永无止境的猫鼠大战。
Google长期以来的成功是基于广大产品用户对我们的信任,所以我们为建立这些系统投入了大量精力和费用。我觉得这是一项鼓舞人心的工作:打一场正义之战,关注用户,尽一切所能来阻止不良广告的发布。我将继续在这里发布更多的想法和更好的信息,向大家介绍我们是如何通过检测和删除垃圾广告,让我们的广告更安全。