CNZZ网站流量统计原理简析

标签: cnzz 网站流量 统计 | 发表时间:2014-08-17 17:09 | 作者:ozhaohuafei
出处:http://blog.csdn.net
这是我的域名www.iyizhan.com,暂无内容,其中只有一个页面index.html,
在index.html上放置了如下的 js 脚本:
<script 
src="http://s11.cnzz.com/stat.php?id=5364825&web_id=5364825" 
language="JavaScript">
</script>


1.当用户访问这个页面时,会请求src,对应的是上面的脚本的源文件:
Request URL:http://s11.cnzz.com/stat.php?id=5364825&web_id=5364825
请求的query:
id:5364825 //网站id
web_id:5364825 //网站id
脚本会对其中的参数赋值,其中this.q = "CNZZDATA" + this.c为cookie名 
cnzz.js中的函数L会为生成一个我的网站域下的cookie,即
名称: CNZZDATA5364825
内容: CNZZDATA5364825=cnzz_eid%3D2115650326-1406861325-%26ntime%3D1406869345
//CNZZDATA5364825=cnzz_eid=2115650326-1406861325-&ntime=1406869345
域: www.iyizhan.com
其中的ntime会随着访问而更新。
//上面的cookie值表示的仅仅是三个时间值。


并触发如下的链接请求:


2.Request URL:
http://hzs14.cnzz.com/stat.htm?id=5364825&r=&lg=zh-cn&ntime=1406861325&cnzz_eid=124331323-1406861325-&showp=1280x800&t=zhaohf-CNZ...&h=1&rnd=1196942655
(这个请求一个1x1的不可见像素,其中的参数代表不同的含义)
id:5364825 //网站id
r:weibo.com //refer,来源。
lg:zh-cn //页面语言
ntime:1406861325 //now time请求时的时间戳
cnzz_eid:124331323-1406861325- //一个随机数(过期时间)-首次访问时间,差即cookie的生命周期
showp:1280x800 //页面(屏幕)大小
t:zhaohf-CNZ...//页面的title
h:1 //?
rnd:1196942655 //random,一个随机数,目的是每次访问都要请求


请求头中如下:
Accept:image/webp,*/*;q=0.8
Accept-Encoding:gzip,deflate,sdch
Accept-Language:zh-CN,zh;q=0.8
Cookie:
cna=YuVcDKp/IhQCAXL/FAmu3PJk; 
PHPSESSID=7e0dc5ea1b0fa3b5357f0b46cb4245d5; 
lzstat_uv=22071519872809337448|3037573; 
UC_SID=e3a977d0ecd733fb2adb54b5a3cfc3ae; 
TJ_LG=cnzz; 
Host:hzs14.cnzz.com
Proxy-Connection:keep-alive
Referer:http://www.iyizhan.com/
User-Agent:Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/36.0.1985.125 Safari/537.36


3.Request URL:http://c.cnzz.com/core.php?web_id=5364825&t=z
这对应的是一个js脚本。


4.Request URL:http://cnzz.mmstat.com/9.gif?abc=1&rnd=659454759

服务器写入cookie:
Set-Cookie:aui=137828086; expires=Mon, 29-Jul-24 03:49:34 GMT; path=/; domain=.cnzz.mmstat.com
Set-Cookie:atpsida=69e4ef05fb4ee7ea895ac82a_1406864974; expires=Mon, 29-Jul-24 03:49:34 GMT; path=/; domain=.cnzz.mmstat.com


5.Request URL:http://pcookie.cnzz.com/app.gif?&cna=YuVcDKp/IhQCAXL/FAmu3PJk
请求另一张图片,其中的参数
cna=YuVcDKp/IhQCAXL/FAmu3PJk
是上一步生成的cookie
回传给服务器
返回的是在cnzz.com下的cookie:
Set-Cookie:cna=YuVcDKp/IhQCAXL/FAmu3PJk; expires=Mon, 29-Jul-24 03:49:34 GMT; path=/; domain=.cnzz.com


------------------------------------------------------------------


由上可见,用户第一次访问网站时,会向cnzz发如下的5个请求(如下图):
1.请求第一个 js 脚本(我命名为cnzz.js)
2.上一步的 js 在用户端浏览器上执行,向cnzz请求一个html文件,
其中的内容只有1x1不可见像素,作用是发送parameter数据
3.请求第二个 js 脚本(我命名为core.js)
4.此脚本在用户的浏览器执行后会触发一个新的请求,向cnzz.mmstat.com请求一个1x1图片,
目的是服务器端生成cookie返回给浏览器
5.浏览器得到cookie之后将cookie发送给pcookie.cnzz.com,这个应该是专门处理cookie的服务器

,然后把新的cookie设置到cnzz.com域上,并返回给用户浏览器


------------------------------------------------------------------
以上是用户首次与CNZZ交互的全部过程。
之后访问的话,就只有前3个请求(如下图),即请求cnzz.stat.php,stat.html,core.php
并在cookie中带有 cna=YuVcDKp/IhQCAXL/FAmu3PJk,用来判断有几个Unique Visitor.


没有接着发请求是因为:返回的第二个js文件中的
"0" === m && k.callRequest([l + "//cnzz.mmstat.com/9.gif?abc=1"])
可以发现重复访问的时候,返回的m = "1",即不会执行这个请求。
------------------------------------------------------------------
//注:点击【站长统计】即可看到统计结果,不过基本为0。

作者:ozhaohuafei 发表于2014-8-17 9:09:51 原文链接
阅读:0 评论:0 查看评论

相关 [cnzz 网站流量 统计] 推荐:

CNZZ网站流量统计原理简析

- - CSDN博客推荐文章
这是我的域名www.iyizhan.com,暂无内容,其中只有一个页面index.html,. 在index.html上放置了如下的 js 脚本:. 1.当用户访问这个页面时,会请求src,对应的是上面的脚本的源文件:. id:5364825 //网站id. web_id:5364825 //网站id.

网站流量异常变动的8种常见原因

- Demi - 蓝鲸的网站分析笔记
网站分析中,最常见的一项工作就是对流量的异常变化进行分析和解释.今天网站的流量变高了,为什么. 后天网站的流量降低了,又是为什么. 对网站有什么影响?这些都是等待我们去回答的问题. 蓝鲸网站分析笔记 Original Source. 通常在遇到这种情况时,我们会先进行定量分析,通过细分找出具体发生异常变化的那部分流量.然后再进行定性分析,找出这部分流量发生异常变化的具体原因.第一步的工作相对简单一些,通过google analytics的细分功能逐层剖析,就可以找到原因.而第二步的工作就有些难度了.因为数据本身只能说明发生了什么,却不能告诉我们为什么,所以,真正的原因需要我们自己去寻找..

二线电子商务网站流量分析

- Eric - 月光博客
  本文并不想分析那些一线知名电子商务网站,而是从一些不知名的电商网站进行分析,看看这些小电商网站的流量来源到底是哪里. 以下是这些天我分析和查询的一些流量较高的二线电子商务网站,其流量数量,收录数量,搜索关键字来源,以及其网站流量排名的分析,分析时间是今年年初.   在网站流量分析报告中,主要以Alexa排名为基准,排列对比二线的电子商务网站,在电子商务市场竞争白热化的今天,如果不烧钱做广告做营销,是很难获取大批用户的,但是,这些二线电商网站是如何积累流量的呢.

浅谈网站流量劫持防范措施

- - 博客园_EtherDream の 原创空间
  前几天上网打开163首页时,发现页面底部莫名其妙的出现一个边框. 这在以前可是未曾有过的,而且以后也绝不可能会有这么丑陋的设计.   趋于好奇心,立刻在边框上点了右键审查元素. 尼玛,不看不知道,网易首页的HTML何时变得这么劣质了.   没有doctype声明,连title元素都没有. script还是language=JScript风格,这得追溯到多少个世纪前了~ 最劣质的是框架居然还是元素.

Compete:2009年6月-2011年6月美国黄色网站流量数据

- ddtd - 中文互联网数据研究资讯中心
2011年9月9日黄色网站数据图表,彻底将男淫们带回了学生时代. 看黄色网站数据图表,黄色网站 YouPorn,曾经的王者已经没落,而最新的 PornHub网站,简直就是黄色网站版 Youtube,月独立访问用户 2570万,数据来源于 Compete,美国媒体 SAI 图片制作. 下图是黄色网站的独立用户访问数据图表,PornHub 第一,redtube youporn 等几乎部分彼此.

Kaggle网站流量预测任务第一名解决方案:从模型到代码详解时序预测

- - 机器之心
近日,Artur Suilin 等人发布了 Kaggle 网站流量时序预测竞赛第一名的详细解决方案. 他们不仅公开了所有的实现代码,同时还详细解释了实现的模型与经验. 机器之心简要介绍了他们所实现的模型与经验,更详细的代码请查看 GitHub 项目. GitHub 项目地址:https://github.com/Arturus/kaggle-web-traffic.

Google+统计报告

- pestwave - 36氪
Google+推出有一段时间了,用户性别比例如何呢. find people on plus对947996名Google+用户进行了统计,按照性别、地理位置、职位进行了分类,甚至还对来自Facebook和Google的员工进行了统计. 男:698,703 (73.70%). 女:234,504 (24.74%).

足球的统计

- Race forward! - 学而时嘻之
《足球的逻辑》这篇得到了不少有益的批评,以至于我很想写一个修改版,不过更有意思的做法是接着另写一篇. 更重要的是,这回终于可以提供一点数据支持了. 足球比赛的一个一般规律是下半场比上半场容易进球. 在以下几个大赛中,上下半场的进球比率分别是:. 98年世界杯:上半场39.2%,下半场60.8%. 02年世界杯:上半场41%,下半场59%.

hive 抽样统计

- - SQL - 编程语言 - ITeye博客
本文转自http://www.taobaotesting.com/blogs/2468,原文分层抽样的逻辑不是很清楚,按照自己的想法重新实现个. 用hive实现了随机抽样中简单随机、系统和分层抽样的方式,记得抽样的概念还是初中数据接触的. 其实很多时候不需要理论,想也是可以想到的,不过还是总结一下.

Oracle 统计信息

- - 数据库 - ITeye博客
--Oracle 优化器统计信息 Oracle优化器统计信息描述了关于数据库和相关对象的统计信息,当执行SQL查询时,优化器会使用这些统计信息估算出各种不同的执行计划的资源消耗, ,从而选择最高效的执行计划. 当统计信息缺失或者陈旧时,Oracle可能会选择错误的执行计划,导致SQL执行效率低下.