点击率的误差

标签: 点击率 付费搜索SEM | 发表时间:2011-08-09 17:28 | 作者:hewei liang
出处:http://semwatch.org

搜索引擎营销对一个人的统计学直觉(而非知识)是比较高的,一个错误的统计判断,可能造成效果优化的方向完全搞错。由于本人非统计学专业,统计学在线上广告方面应用可追索的资料也较少,如果有概念性错误的地方,请读者指正(林志海 邮箱linzhihai at yahoo.com;微博:http://weibo.com/zhihailin)。

我们知道,网络广告最基本的两个数据是广告展现和点击。如果一个广告一天产生了1000个展现,25个点击,点击率2.5%。那么这个点击率的测量误差是多少?

如果说我们可以获得连续几天的数据,那么这个问题很好回答,Excel的AVERAGE和STDEV就可以计算平均值和标准偏差。这样计算没错,需要注意的这背后隐藏的条件是广告条件不变,即广告来源和广告创意都没有发生过变化,而来源的流量,即广告的展现量基本稳定。

上图是欧洲大型强子加速器LHC的一个实验图(我的本行)

但是,当数据有限,只能观测到一天或两天数据,误差如何计算?

一个广告展示出来,要么被点击,要么不被点击;当这个广告展示了很多次后,被点击的次数就会以一定频率出现,这个值就是我们通常所说的点击率。当展示次数非常大的时候,点击率会趋于一个稳定值(这就是伯努利大数定理),即发生点击的概率。实际上,广告点击的次数,和伯努利实验是完全一样的,它服从二项式分布,当展示次数很大的时候,点击率的误差近似为 ,p是点击率,N是展现次数,点击率。一般点击率都不会超过10%,点击率的误差可以简化为  。1000个展现,2.5%的点击率的误差约为0.5%。所以,当比较两个广告的点击率优劣的时候,计算误差是必要的。当误差显示放宽的三个标准偏差的时候,2.5%的误差范围为1%-4%之间。也就是说另外一个广告的点击率为1%-4%时,和第一个广告的点击率是不显著的。如果第二个广告自身的误差也很大的时候,统计判断就更为困难了。

同样,当计算点击转化比率的时候,会有类似误差的估算方法,只需把N换成点击,p设为转化率。

在文章最后,给出一个判断两个广告点击率差异是否显著的一个工具型的网站splittester,请读者自己做一下实验。

转载请注明: 文章来自腾信创新搜索引擎营销,作者:林志海
http://sem.tensynad.com/

补充,林彦同学很快给我私信,做了很好的补充。一个系统说明的线上文档可以参见百度文库中一个教案,同时指出,目前split test方法多用到的是卡方的四格表检验,这个在一些统计学的基础教材里面有详细的解释。

您可能也喜欢:

Anchor Intelligence:2010年二季度全球欺诈点击率高达28.9%

两份新鲜出炉的点击欺诈报告

最大点击欺诈集团在中国

质量得分(QS)中点击率的重要性
无觅

相关 [点击率 误差] 推荐:

点击率的误差

- liang - SEM WATCH
搜索引擎营销对一个人的统计学直觉(而非知识)是比较高的,一个错误的统计判断,可能造成效果优化的方向完全搞错. 由于本人非统计学专业,统计学在线上广告方面应用可追索的资料也较少,如果有概念性错误的地方,请读者指正(林志海 邮箱linzhihai at yahoo.com;微博:http://weibo.com/zhihailin).

点击率预估

- - Yonglong.Zhou
推荐系统的框架模式大致是:多种召回策略(触发层),一种融合排序策略(排序层),也可认为两阶段排序模型[33]:. 召回策略方法繁多(例如常见的协同过滤中的item-based,user-based,以及MF矩阵分解),最终的融合排序层中,如果采用point-wise[24]排序方法,最常用的是点击率(CTR)预估[1],作为排序依据.

提高横幅广告点击率的6个方法

- - 雷锋网
【编者按】原文作者为前Google员工、精确邮件广告商 LaunchBit联合创始人Elizabeth Yin. 她将LaunchBit比作是Google AdWords. 在下文中,她总结了能提高网站横幅广告点击率的6种方法,大家看看适不适用. 横幅广告点击率正持续下降已经不是什么秘密了,许多营销人员也在试图通过各种方法让自己的广告能够突出重围成功吸引用户的点击.

搜索引擎自然排名点击率报告

- - 互联网旁观者
相信很多人在网上找搜索引擎自然排名各位置的点击率吧. 前一段时间我也在找,找到了一点Google自然排名位置的点击率数据,但是百度各位置点击率的数据太少了,没有太多价值. 特来跟大家分享下Slingshot发布的Google自然排名点击率数据报告. Slingshot发布的Google 自然排名点击率报告(Google organic CTR Study)地址是:.

江南Style点击率突破YouTube计数器上限

- - Solidot
YouTube的Google+账号透露,韩国歌手鸟叔的《江南Style》太受欢迎了,其点击率竟打破了YouTube的计数器上限. 《江南Style》的浏览量超过了21亿次,打破了32位整数计数器的上限(2,147,483,647),使得YouTube不得不将计数器升级到64位整数. 升级之后,YouTube的计数器能记录到最高9,223,372,036,854,775,808次浏览量,在可预见的未来应该没人能打破了.

广告点击率实时样本产生

- - Koala++'s blog
样本简单地讲就是用来机器学习的数据,本文所讲样本特指监督学习中的样本,即样本由特征和标签两部分组成. 广告点击率预测中的特征主要有三部分,用户特征,广告特征,环境. 举例说明,用户特征中有年龄,性别. 广告特征中有广告ID,广告主ID. 环境特征中有操作系统,联网类型,广告位等等. 实 时样本是相对批量样本的概念,批量样本一般是用来训练对实时性要求不高的模型,比如人脸识别,手写识别等.

广告点击率预估是怎么回事? - 知乎专栏

- -
2016-11-08 欧阳辰 互联居. 点击率预估是广告技术的核心算法之一,它是很多广告算法工程师喜爱的战场. 一直想介绍一下点击率预估,但是涉及公式和模型理论太多,怕说不清楚,读者也不明白. 所以,这段时间花了一些时间整理点击率预估的知识,希望在尽量不使用数据公式的情况下,把大道理讲清楚,给一些不愿意看公式的同学一个Cook Book.

计算广告点击率预估算法总结

- - 小石头的码疯窝
谈到CTR,都多多少少有些了解,尤其在互联网广告这块,简而言之,就是给某个网络服务使用者推送一个广告,该广告被点击的概率,这个问题难度简单到街边算命随口告诉你今天适不适合娶亲、适不适合搬迁一样,也可以复杂到拿到各种诸如龟壳、铜钱等等家伙事,在沐浴更衣、净手煴香后,最后一通预测,发现完全扯淡,被人暴打一顿,更有甚者,在以前关系国家危亡、异或争国本这种情况时,也通常会算上一卦,国家的兴衰、.

推荐系统中的点击率预估 – Advertising & Recommendation

- -
推荐系统的框架模式大致是:多种召回策略(触发层),一种融合排序策略(排序层),也可认为两阶段排序模型[33]:. 召回策略方法繁多(例如常见的协同过滤中的item-based,user-based,以及MF矩阵分解),最终的融合排序层中,如果采用point-wise[24]排序方法,最常用的是点击率(CTR)预估[1],作为排序依据.

国外点击率过千万让人惊讶的运动视频

- 硬盘被格 - 雷客