根据PV计算带宽及根据PV算并发

标签: pv 计算 带宽 | 发表时间:2015-10-03 13:39 | 作者:m635674608
出处:http://www.iteye.com

根据PV计算带宽

我们通常说的网站流量(traffic)就是指网站的访问量,是用来描述访问一个网站的用户数量以及用户所浏览的网页数量等指标,常用的统计指标包括网站的独立用户数量、总用户数量(含重复访问者)、网页浏览数量、每个用户的页面浏览数量、用户在网站的平均停留时间等。

网站访问量的衡量标准一个是IP,另一个是PV,常以日为标准,即日独立IP和PV来计算.

    访问数(IP):即Internet Protocol,指独立IP数。00:00-24:00内相同IP地址只被计算一次。

    综合浏览量(PV):即Page View, 即页面浏览量或点击量,用户每次刷新即被计算一次。

    二者的联系与区别:PV高不一定代表来访者多;PV与来访者的数量成正比,但是PV并不直接决定页面的真实来访者数量。比如一个网站就你一个人进来,通过不断的刷新页面,也可以制造出非常高的PV。

IP是一个反映网络虚拟地址对象的概念,独立用户是一个反映实际使用者的概念,每个独立用户相对于每个IP,更加准确地对应一个实际的浏览者。使用独立用户作为统计量,可以更加准确的了解单位时间内实际上有多少个访问者来到了相应的页面。

一个独立IP可以产生多个PV,所以PV个数>=IP个数。

    PV(Page View)值:是指一定时间范围内所有浏览该网站的访问者请求的页面数量之合。(例如:该网站一天有500个访问者,每个访问者浏览的页面数量平均为8页,则每天的PV是500×8=4000)

    Hits值:是指对每个页面元素的请求数量。(一个页面中任何一个图片或者flash文件都算是一个页面元素)

    日浏览字节数:即日流量,是指一天内,访问者请求的所有页面元素的字节数之和。

 

计算带宽大小需要关注两个指标:峰值流量和页面的平均大小。举个例子说明下吧:

 

    假设网站的峰值流量是平均流量的5倍(当然,这只是一个假设,具体实施我们需要视自己情况而定);

    假设每次访问的平均页面大小是200K字节;

    假设网站的预期目标是每天50W PV的访问量。

我们的计算开始:50W PV如果在一天内平均分布,折合到每秒大概是50W/(24*60*60)=6次访问,按照我们之前的假设平均页面大小是200K字节计算,这6次访问总 共就是1200K字节(需要注意的是这个地方是字节),字节的单位是Byte,而带宽的单位是bit,1Byte=8bit,因此1200K Byte大概就是9600K bit,也就是9Mbps(1M=1024K)。在实际的网站运行过程中,我们的网站必须要在峰值流量时保持正常的访问,这里就会用到我们之前的假设,峰 值流量是平均流量的5倍,按照这个计算,实际需要的带宽大约在9Mbps*5=45Mbps左右。

具体的计算公式是:网站独享带宽=一天总的PV值÷ 一天总时间(换算到S)*平均页面大小(单位KB)* 8

     这个计算结果的前提是我们之前的三条假设,而在实际运行中,由于缓存、网站提供下载、图片较多、网站白天夜里访问量不同等原因,这个结果可能并不是很理想。所以这个算法只能算是一个大概的算法了。

 

eg. 10w pv,页面大小1M ,带宽=10,0000/86400*1M*8 = 9.26Mbps 

 

PV与并发之间换算的算法换算公式

 

 

并发连接数 = PV / 统计时间 * 页面衍生连接次数 * http响应时间 * 因数 / web服务器数量

PV = 并发连接数 * 统计时间 * web服务器数量/ 页面衍生连接次数 / http响应时间 / 因数

解释:

统计时间 : pv统计的总时间,单位秒,要计算一天的pv就是86400秒

页面衍生连接次数: 一个HTML页面可能会请求好几次http连接,如外部的css, js,图片等,可以估算一下,或者用10,可根据实际情况改变

http响应时间: 可以使用1秒或更少,可根据实际情况改变

因数: 一般使用5即可,可根据实际情况计算后推出

web服务器数量: web服务器数量

* "页面衍生连接次数","http响应时间","因数"这三个参数要根据实际情况分析计算后,确定一个适合的值

推算一下。单台机器1000并发的情况下,一天是1,728,000的pv(1秒响应,10个衍生连接,因子为5的情况下)

======================================================================

例子:

保证每天多少PV的并发连接数的计算公式是:

并发连接数= PV / 统计时间(一天是86400) * 页面衍生连接次数 * http响应时间 * 因数(5) / web服务器数量

保证4千万PV的并发连接数:

(40000000PV / 86400秒 * 10个派生连接数 * 5秒内响应 * 5倍峰值) / 6台Web服务器 = 19290连接数

 

eg.

 

10PV的并发连接数:

(100000PV / 86400秒 * 10个派生连接数 * 5秒内响应 * 5倍峰值) / 1台Web服务器 = 289连接数

 

Ref:

[1] http://cwind.blog.51cto.com/62582/1114405

[2] http://2804976.blog.51cto.com/2794976/786664

 

http://blog.csdn.net/fffy2366/article/details/40858931



已有 0 人发表留言,猛击->> 这里<<-参与讨论


ITeye推荐



相关 [pv 计算 带宽] 推荐:

根据PV计算带宽及根据PV算并发

- - 企业架构 - ITeye博客
我们通常说的网站流量(traffic)就是指网站的访问量,是用来描述访问一个网站的用户数量以及用户所浏览的网页数量等指标,常用的统计指标包括网站的独立用户数量、总用户数量(含重复访问者)、网页浏览数量、每个用户的页面浏览数量、用户在网站的平均停留时间等. 网站访问量的衡量标准一个是IP,另一个是PV,常以日为标准,即日独立IP和PV来计算..

[转]你想建设一个能承受500万PV/每天的网站吗?如果计算呢?

- - 上善若水 厚德载物
你想建设一个能承受500万PV/每天的网站吗. 服务器每秒要处理多少个请求才能应对. PV是page view的简写. PV是指页面的访问次数,每打开或刷新一次页面,就算做一个pv. 每台服务器每秒处理请求的数量=((80%*总PV量)/(24小时*60分*60秒*40%)) / 服务器数量. 其中关键的参数是80%、40%.

你想建设一个能承受500万PV/每天的网站吗?如果计算呢?

- - 非技术 - ITeye博客
博客:http://elf8848.iteye.com. 你想建设一个能承受500万PV/每天的网站吗. 服务器每秒要处理多少个请求才能应对. PV是page view的简写. PV是指页面的访问次数,每打开或刷新一次页面,就算做一个pv. 每台服务器每秒处理请求的数量=((80%*总PV量)/(24小时*60分*60秒*40%)) / 服务器数量.

使用rrdtool统计网站PV和IP

- - Linux - 操作系统 - ITeye博客
现在网站服务器已经使用snmp进行监控,已经对CPU,内存,流量等进行了监控,但觉得还需要加一项监控,就是网站的PV和IP的监控,这样可以快速知道服务器负载上升是否是网站访问量增加的原因. 这几天初学 rrdtool,这个工具既能存储数据,又能画图,非常的方便. 下面是统计近一天的pv和ip图.

服务器内存带宽计算和使用情况测量(杀猫长文)

- coolzsb - Erlang非业余研究
原创文章,转载请注明: 转载自Erlang非业余研究. 本文链接地址: 服务器内存带宽计算和使用情况测量(杀猫长文). 前段时间我们在MYSQL调优上发现有瓶颈,怀疑是过多拷贝内存,导致内存带宽用完. 在Linux下内存的使用情况有top工具, IO设备的使用情况有iostat工具,就是没有内存使用情况的测量工具.

温故而知新「Fate/Zero」 PV+CM大回顾

- Adam - 和邪社
凌晨备受关注的10月新番《Fate/Zero》就要在nico上做8字幕全球放送了,在正是面相大家前. 大家再来回顾一下此前Fate/Zero为了宣传造势而制作的两段PV和连续7弹的CM吧.

Digg起死回生?Facebook添加其应用 PV一月增35%

- - TechWeb 今日焦点 RSS阅读
  Digg的网页浏览量在一月份增加35%,创下该公司自2010年10月份以来最大的流量记录.   网易科技讯 2月25日消息,据国外媒体报道,由于Facebook新添加Digg应用程序,Digg网站表现出新的发展活力.   报道称,软件工程师威尔·拉森尔(Will Larson)在一篇博文中表示,Digg的网页浏览量在一月份增加35%,创下该公司自2010年10月份以来最大的流量记录.

Reddit如何可以承受每月2.7亿PV

- - 博客园_新闻
英文原文: 7 Lessons Learned While Building Reddit To 270 Million Page Views A Month.    这篇文章有点老,是 2010 年的. Reddit 在美国年轻人中很受欢迎,感觉 黃易山做 CEO 后更蒸蒸日上了. 相信这 4 年间,他们面临的 scalability 的问题更严峻,一些架构可能都推倒重来了.

抛弃 PV,网站广告也按时间收费?

- - 疯狂简报·MADBRIEF
“同样一个品牌,曝光 1 秒和 5 秒有差别么. 这是《金融时报》(Financial Times)数字广告总监 Jon Slade 近日提出的一个看似简单问题,他无非是想证明注意力时间对于广告的重要性. 但在在线媒体行业,衡量广告投放效果的却是另外一套指标——PV 和 UV. 在广告主眼中,页面浏览量越大,意味着广告到达受众人数越广,投放效果也就越好.

从100PV到1亿级PV网站架构演变

- - 快课网
一个网站就像一个人,存在一个从小到大的过程. 养一个网站和养一个人一样,不同时期需要不同的方法,不同的方法下有共同的原则. 本文结合我自已14年网站人的经历记录一些架构演变中的体会. 1999年,我作了一个个人主页,在学校内的虚拟空间,参加了一次主页大赛,几个DREAMWEAVER的页面,几个TABLE作布局,一个DB连接,几行PHP的代码嵌入在HTML中,再用FTP传到服务器上就可以给别人展示一个网站.