Nginx优化教程实现突破十万并发_源码_站长之家ChinaZ.com

nginx指令中的优化（配置文件）

worker_processes 8;

　　nginx进程数，建议按照cpu数目来指定，一般为它的倍数。

worker_cpu_affinity 00000001 00000010 00000100 00001000 00010000 00100000 01000000 10000000;

　　为每个进程分配cpu，上例中将8个进程分配到8个cpu，当然可以写多个，或者将一个进程分配到多个cpu。

worker_rlimit_nofile 102400;

　　这个指令是指当一个nginx进程打开的最多文件描述符数目，理论值应该是最多打开文件数（ulimit -n）与nginx进程数相除，但是nginx分配请求并不是那么均匀，所以最好与ulimit -n的值保持一致。

use epoll;

　　使用epoll的I/O模型，这个不用说了吧。

worker_connections 102400;

　　每个进程允许的最多连接数，理论上每台nginx服务器的最大连接数为worker_processes*worker_connections。

keepalive_timeout 60;

　　keepalive超时时间。

client_header_buffer_size 4k;

　　客户端请求头部的缓冲区大小，这个可以根据你的系统分页大小来设置，一般一个请求的头部大小不会超过1k，不过由于一般系统分页都要大于1k，所以这里设置为分页大小。分页大小可以用命令getconf PAGESIZE取得。

open_file_cache max=102400 inactive=20s;

　　这个将为打开文件指定缓存，默认是没有启用的，max指定缓存数量，建议和打开文件数一致，inactive是指经过多长时间文件没被请求后删除缓存。

open_file_cache_valid 30s;

　　这个是指多长时间检查一次缓存的有效信息。

open_file_cache_min_uses 1;

　　open_file_cache指令中的inactive参数时间内文件的最少使用次数，如果超过这个数字，文件描述符一直是在缓存中打开的，如上例，如果有一个文件在inactive时间内一次没被使用，它将被移除。

内核参数的优化

net.ipv4.tcp_max_tw_buckets = 6000

　　timewait的数量，默认是180000。

net.ipv4.ip_local_port_range = 1024    65000

　　允许系统打开的端口范围。

net.ipv4.tcp_tw_recycle = 1

　　启用timewait快速回收。

net.ipv4.tcp_tw_reuse = 1

　　开启重用。允许将TIME-WAIT sockets重新用于新的TCP连接。

net.ipv4.tcp_syncookies = 1

　　开启SYN Cookies，当出现SYN等待队列溢出时，启用cookies来处理。

net.core.somaxconn = 262144

　　web应用中listen函数的backlog默认会给我们内核参数的net.core.somaxconn限制到128，而nginx定义的NGX_LISTEN_BACKLOG默认为511，所以有必要调整这个值。

net.core.netdev_max_backlog = 262144

　　每个网络接口接收数据包的速率比内核处理这些包的速率快时，允许送到队列的数据包的最大数目。

net.ipv4.tcp_max_orphans = 262144

　　系统中最多有多少个TCP套接字不被关联到任何一个用户文件句柄上。如果超过这个数字，孤儿连接将即刻被复位并打印出警告信息。这个限制仅仅是为了防止简单的DoS攻击，不能过分依靠它或者人为地减小这个值，更应该增加这个值(如果增加了内存之后)。

net.ipv4.tcp_max_syn_backlog = 262144

　　记录的那些尚未收到客户端确认信息的连接请求的最大值。对于有128M内存的系统而言，缺省值是1024，小内存的系统则是128。

net.ipv4.tcp_timestamps = 0

　　时间戳可以避免序列号的卷绕。一个1Gbps的链路肯定会遇到以前用过的序列号。时间戳能够让内核接受这种"异常"的数据包。这里需要将其关掉。

net.ipv4.tcp_synack_retries = 1

　　为了打开对端的连接，内核需要发送一个SYN并附带一个回应前面一个SYN的ACK。也就是所谓三次握手中的第二次握手。这个设置决定了内核放弃连接之前发送SYN+ACK包的数量。

net.ipv4.tcp_syn_retries = 1

　　在内核放弃建立连接之前发送SYN包的数量。

net.ipv4.tcp_fin_timeout = 1

　　如果套接字由本端要求关闭，这个参数决定了它保持在FIN-WAIT-2状态的时间。对端可以出错并永远不关闭连接，甚至意外当机。缺省值是60秒。2.2 内核的通常值是180秒，你可以按这个设置，但要记住的是，即使你的机器是一个轻载的WEB服务器，也有因为大量的死套接字而内存溢出的风险，FIN- WAIT-2的危险性比FIN-WAIT-1要小，因为它最多只能吃掉1.5K内存，但是它们的生存期长些。

net.ipv4.tcp_keepalive_time = 30

　　当keepalive起用的时候，TCP发送keepalive消息的频度。缺省是2小时。

一个完整的内核优化配置

net.ipv4.ip_forward = 0
net.ipv4.conf.default.rp_filter = 1
net.ipv4.conf.default.accept_source_route = 0
kernel.sysrq = 0
kernel.core_uses_pid = 1
net.ipv4.tcp_syncookies = 1
kernel.msgmnb = 65536
kernel.msgmax = 65536
kernel.shmmax = 68719476736
kernel.shmall = 4294967296
net.ipv4.tcp_max_tw_buckets = 6000
net.ipv4.tcp_sack = 1
net.ipv4.tcp_window_scaling = 1
net.ipv4.tcp_rmem = 4096        87380   4194304
net.ipv4.tcp_wmem = 4096        16384   4194304
net.core.wmem_default = 8388608
net.core.rmem_default = 8388608
net.core.rmem_max = 16777216
net.core.wmem_max = 16777216
net.core.netdev_max_backlog = 262144
net.core.somaxconn = 262144
net.ipv4.tcp_max_orphans = 3276800
net.ipv4.tcp_max_syn_backlog = 262144
net.ipv4.tcp_timestamps = 0
net.ipv4.tcp_synack_retries = 1
net.ipv4.tcp_syn_retries = 1
net.ipv4.tcp_tw_recycle = 1
net.ipv4.tcp_tw_reuse = 1
net.ipv4.tcp_mem = 94500000 915000000 927000000
net.ipv4.tcp_fin_timeout = 1
net.ipv4.tcp_keepalive_time = 30
net.ipv4.ip_local_port_range = 1024    65000

一个简单的nginx优化配置文件

user  www www;
worker_processes 8;
worker_cpu_affinity 00000001 00000010 00000100 00001000 00010000 00100000 01000000;
error_log  /www/log/nginx_error.log  crit;
pid        /usr/local/nginx/nginx.pid;
worker_rlimit_nofile 204800;

events
{
  use epoll;
  worker_connections 204800;
}

http
{
  include       mime.types;
  default_type  application/octet-stream;

  charset  utf-8;

  server_names_hash_bucket_size 128;
  client_header_buffer_size 2k;
  large_client_header_buffers 4 4k;
  client_max_body_size 8m;

  sendfile on;
  tcp_nopush     on;

  keepalive_timeout 60;

  fastcgi_cache_path /usr/local/nginx/fastcgi_cache levels=1:2
                keys_zone=TEST:10m
                inactive=5m;
  fastcgi_connect_timeout 300;
  fastcgi_send_timeout 300;
  fastcgi_read_timeout 300;
  fastcgi_buffer_size 16k;
  fastcgi_buffers 16 16k;
  fastcgi_busy_buffers_size 16k;
  fastcgi_temp_file_write_size 16k;
  fastcgi_cache TEST;
  fastcgi_cache_valid 200 302 1h;
  fastcgi_cache_valid 301 1d;
  fastcgi_cache_valid any 1m;
  fastcgi_cache_min_uses 1;
  fastcgi_cache_use_stale error timeout invalid_header http_500;
  
  open_file_cache max=204800 inactive=20s;
  open_file_cache_min_uses 1;
  open_file_cache_valid 30s;
  


  tcp_nodelay on;
  
  gzip on;
  gzip_min_length  1k;
  gzip_buffers     4 16k;
  gzip_http_version 1.0;
  gzip_comp_level 2;
  gzip_types       text/plain application/x-javascript text/css application/xml;
  gzip_vary on;


  server
  {
    listen       8080;
    server_name  ad.test.com;
    index index.php index.htm;
    root  /www/html/;

    location /status
    {
        stub_status on;
    }

    location ~ .*\.(php|php5)?$
    {
        fastcgi_pass 127.0.0.1:9000;
        fastcgi_index index.php;
        include fcgi.conf;
    }

    location ~ .*\.(gif|jpg|jpeg|png|bmp|swf|js|css)$
    {
      expires      30d;
    }

    log_format  access  '$remote_addr - $remote_user [$time_local] "$request" '
              '$status $body_bytes_sent "$http_referer" '
              '"$http_user_agent" $http_x_forwarded_for';
    access_log  /www/log/access.log  access;
      }
}

关于FastCGI的几个指令

fastcgi_cache_path /usr/local/nginx/fastcgi_cache levels=1:2 keys_zone=TEST:10m inactive=5m;

　　这个指令为FastCGI缓存指定一个路径，目录结构等级，关键字区域存储时间和非活动删除时间。

fastcgi_connect_timeout 300;

　　指定连接到后端FastCGI的超时时间。

fastcgi_send_timeout 300;

　　向FastCGI传送请求的超时时间，这个值是指已经完成两次握手后向FastCGI传送请求的超时时间。

fastcgi_read_timeout 300;

　　接收FastCGI应答的超时时间，这个值是指已经完成两次握手后接收FastCGI应答的超时时间。

fastcgi_buffer_size 16k;

　　指定读取FastCGI应答第一部分需要用多大的缓冲区，这里可以设置为fastcgi_buffers指令指定的缓冲区大小，上面的指令指定它将使用1个16k的缓冲区去读取应答的第一部分，即应答头，其实这个应答头一般情况下都很小（不会超过1k），但是你如果在fastcgi_buffers指令中指定了缓冲区的大小，那么它也会分配一个fastcgi_buffers指定的缓冲区大小去缓存。

fastcgi_buffers 16 16k;

　　指定本地需要用多少和多大的缓冲区来缓冲FastCGI的应答，如上所示，如果一个php脚本所产生的页面大小为256k，则会为其分配16个16k的缓冲区来缓存，如果大于256k，增大于256k的部分会缓存到fastcgi_temp指定的路径中，当然这对服务器负载来说是不明智的方案，因为内存中处理数据速度要快于硬盘，通常这个值的设置应该选择一个你的站点中的php脚本所产生的页面大小的中间值，比如你的站点大部分脚本所产生的页面大小为256k就可以把这个值设置为16 16k，或者4 64k 或者64 4k，但很显然，后两种并不是好的设置方法，因为如果产生的页面只有32k，如果用4 64k它会分配1个64k的缓冲区去缓存，而如果使用64 4k它会分配8个4k的缓冲区去缓存，而如果使用16 16k则它会分配2个16k去缓存页面，这样看起来似乎更加合理。

fastcgi_busy_buffers_size 32k;

　　这个指令我也不知道是做什么用，只知道默认值是fastcgi_buffers的两倍。

fastcgi_temp_file_write_size 32k;

　　在写入fastcgi_temp_path时将用多大的数据块，默认值是fastcgi_buffers的两倍。

fastcgi_cache TEST

　　开启FastCGI缓存并且为其制定一个名称。个人感觉开启缓存非常有用，可以有效降低CPU负载，并且防止502错误。但是这个缓存会引起很多问题，因为它缓存的是动态页面。具体使用还需根据自己的需求。

fastcgi_cache_valid 200 302 1h;
fastcgi_cache_valid 301 1d;
fastcgi_cache_valid any 1m;

　　为指定的应答代码指定缓存时间，如上例中将200，302应答缓存一小时，301应答缓存1天，其他为1分钟。

fastcgi_cache_min_uses 1;

　　缓存在fastcgi_cache_path指令inactive参数值时间内的最少使用次数，如上例，如果在5分钟内某文件1次也没有被使用，那么这个文件将被移除。

fastcgi_cache_use_stale error timeout invalid_header http_500;

　　不知道这个参数的作用，猜想应该是让nginx知道哪些类型的缓存是没用的。以上为nginx中FastCGI相关参数，另外，FastCGI自身也有一些配置需要进行优化，如果你使用php-fpm来管理FastCGI，可以修改配置文件中的以下值：

<value name="max_children">60</value>

　　同时处理的并发请求数，即它将开启最多60个子线程来处理并发连接。

<value name="rlimit_files">102400</value>

　　最多打开文件数。

<value name="max_requests">204800</value>

　　每个进程在重置之前能够执行的最多请求数。

阅读全文……

标签 : nginx

发表评论

IT瘾于2014年12月20日下午05时19分00秒发布 #

Anychart图表系列五之事件监听 - 上善若水任方圆 - ITeye技术网站

创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。

以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下：

Js代码  
<script>  
//创建AnyChart  
var chart = new AnyChart();  
//添加钻取操作"pointClick"事件监听  
chart.addEventListener('pointClick', onPointClick);  
  
//钻取操作事件Event Handler  
function onPointClick(e) {  
// 读取point name  
var name=e.data.Name;  
// 读取point value  
var value=e.data.YValue;  
// 读取自定义属性point attribute  
var attribute = e.data.Attributes['test'];  
//弹出提示框  
alert("point_name="+name+"  point_value="+value);  
}  
</script>  

我们项目有一个需求是：点击图表某一个point的时候可以穿透打开一个新页面，这个新页面其实就是统计数据的详细列表，那么要做这样的功能就必须在图表中传入一个URL，图表在穿透时获取这个URL并打开详细列表页面。最后我是这样实现这个功能的：给每个point定义id属性，而这个id就是URL，然后在js中创建钻取事件监听，钻取时取id值再进行跳转。

Js代码  
<!--AnyChart配置-->  
<point id="http://xxx/xxx.do?method=xx?id=xx" name="" value="">  
  
<script>  
//创建AnyChart  
var chart = new AnyChart();  
//添加钻取操作"pointClick"事件监听  
chart.addEventListener('pointClick', onPointClick);  
  
//钻取操作事件Event Handler  
function onPointClick(e) {  
//读取point id  
var url=e.data.id;  
//创建弹出框并访问指定地址  
openDialog(url);  
}  
</script>  

当然有一点细节需要注意：如果id是通过后台代码拼装的，最好进行一次字符转换，否则很可能会出现XML解析错误，以java代码为例：

Java代码  
String url = "http://xxxx";  
url = StringEscapeUtils.escapeHtml(url);  

AnyChart支持图表“钻取”功能，除此之外还提供了鼠标移入、移出、图表创建、渲染中、渲染结束等等事件的监听，开发可以根据不同事件点去做一些特殊操作。

一个图可以监听多个不同的事件，要想监听多个，则只需要执行多次addEventListener即可。

Js代码  
function init() {   
// Create new chart  
var chart = new AnyChart();  
// Add event handlers for all point events  
chart.addEventListener('pointClick', onPointClick);  
chart.addEventListener('pointSelect', onPointSelect);  
chart.addEventListener('pointMouseOver', onPointMouseOver);  
chart.addEventListener('pointMouseOut', onPointMouseOut);  
// Set data XML File  
chart.setXMLFile('./data.xml');  
//Output chart to "chartContainer" div  
chart.write('chartContainer');  
}  

更多的事件监听在这就不做赘述，大家可以访问AnyChart帮助文档学习，里面说得非常详细

阅读全文……

标签 : javascript, web前端

发表评论

IT瘾于2014年12月11日上午02时06分00秒发布 #

使用HBase EndPoint（coprocessor）进行计算 « 搜索技术博客－淘宝

如果要统对hbase中的数据，进行某种统计，比如统计某个字段最大值，统计满足某种条件的记录数，统计各种记录特点，并按照记录特点分类（类似于sql的group by）~

常规的做法就是把hbase中整个表的数据scan出来，或者稍微环保一点，加一个filter，进行一些初步的过滤（对于rowcounter来说，就加了FirstKeyOnlyFilter），但是这么做来说还是会有很大的副作用，比如占用大量的网络带宽（当标级别到达千万级别，亿级别之后）尤为明显，RPC的量也是不容小觑的。

理想的方式应该是怎样？

拿row counter这个简单例子来说，我要统计总行数，如果每个region 告诉我他又多少行，然后把结果告诉我，我再将他们的结果汇总一下，不就行了么？
现在的问题是hbase没有提供这种接口，来统计每个region的行数，那是否我们可以自己来实现一个呢？
没错，正如本文标题所说，我们可以自己来实现一个Endpoint，然后让hbase加载起来，然后我们远程调用即可。

什么是Endpoint？

先弄清楚什么是hbase coprocessor

hbase有两种coprocessor，一种是Observer（观察者），类似于关系数据库的trigger（触发器），另外一种就是EndPoint，类似于关系数据库的存储过程。

观察者这里就多做介绍了，这里介绍Endpoint。

EndPoint是动态RPC插件的接口，它的实现代码被部署在服务器端（regionServer），从而能够通过HBase RPC调用。客户端类库提供了非常方便的方法来调用这些动态接口，它们可以在任意时候调用一个EndPoint，它们的实现代码会被目标region远程执行，结果会返回到终端。用户可以结合使用这些强大的插件接口，为HBase添加全新的特性。

怎么实现一个EndPoint

1. 定义一个新的protocol接口，必须继承CoprocessorProtocol.
2. 实现终端接口，继承抽象类BaseEndpointCoprocessor，改实现代码需要部署到
3. 在客户端，终端可以被两个新的HBase Client API调用。单个region：HTableInterface.coprocessorProxy(Class<T> protocol, byte[] row) 。rigons区域：HTableInterface.coprocessorExec(Class<T> protocol, byte[] startKey, byte[] endKey, Batch.Call<T,R> callable)，这里的region是通过一个row来标示的，就是说，改row落到那个region，RPC就发给哪个region，对于start-end的，[start,end)范围内的region都会受到RPC调用。

如图

    
            public interface CounterProtocol extends CoprocessorProtocol {
    public long count(byte[] start, byte[] end) throws IOException;
}

    
            
            public class CounterEndPoint extends BaseEndpointCoprocessor implements CounterProtocol {
 
    @Override
    public long count(byte[] start, byte []end) throws IOException {
        // aggregate at each region
        Scan scan = new Scan();
        long numRow = 0;
 
        InternalScanner scanner = ((RegionCoprocessorEnvironment) getEnvironment()).getRegion()
                .getScanner(scan);
        try {
            List<KeyValue> curVals = new ArrayList<KeyValue>();
            boolean hasMore = false;
            do {
                curVals.clear();
                hasMore = scanner.next(curVals);
                if (Bytes.compareTo(curVals.get(0).getRow(), start)<0) {
                    continue;
                }
                if (Bytes.compareTo(curVals.get(0).getRow(), end)>= 0) {
                    break;
                }
                numRow++;
            } while (hasMore);
        } finally {
            scanner.close();
        }
        return numRow;
    }
 
}

        

    
            
            public class CounterEndPointDemo {
    public static void main(String[] args) throws IOException, Throwable {
        final String startRow = args[0];
        final String endRow = args[1];
 
        @SuppressWarnings("resource")
        HTableInterface table = new HTable(HBaseConfiguration.create(), "tc");
        Map<byte[], Long> results;
 
        // scan: for all regions
        results = table.coprocessorExec(CounterProtocol.class, startRow.getBytes(),
                endRow.getBytes(), new Batch.Call<CounterProtocol, Long>() {
                    public Long call(CounterProtocol instance) throws IOException {
                        return instance.count(startRow.getBytes(), endRow.getBytes());
                    }
                });
 
        long total = 0;
        for (Map.Entry<byte[], Long> e : results.entrySet()) {
            System.out.println(e.getValue());
            total += e.getValue();
        }
 
        System.out.println("total:" + total);
    }
}

        

整个程序的框架其实又是另外一个mapreduce，只是运行在region server上面，reduce运行在客户端，其中map计算量较大，reduce计算量很小！

另外需要提醒的是：
protocol的返回类型，可以是基本类型。
如果是一个自定义的类型需要实现org.apache.hadoop.io.Writable接口。
关于详细的支持类型，请参考代码hbase源码：org.apache.hadoop.hbase.io.HbaseObjectWritable

怎么部署？

1. 通过hbase-site.xml增加

    
            <property>
  <name>hbase.coprocessor.region.classes</name>
  <value>xxxx.CounterEndPoint </value>
</property>

如果要配置多个，就用逗号（,)分割。
包含此类的jar必须位于hbase的classpath
这种coprocessor是作用于所有的表，如果你只想作用于部分表，请使用下面一种方式。

2. 通过shell方式
增加：

1

2

3

4

5

6

hbase(main):005:0> alter 't1', METHOD => 'table_att',
'coprocessor'=>'hdfs:///foo.jar|com.foo.FooRegionObserver|1001|arg1=1,arg2=2'
Updating all regions with the new schema...
1/1 regions updated.
Done.
0 row(s) in 1.0730 seconds

coprocessor格式为：
[FilePath]|ClassName|Priority|arguments
arguments: k=v[,k=v]+

其中FilePath是hdfs路径，例如/tmp/zhenhe/cp/zhenhe-1.0.jar
ClassNameEndPoint实现类的全名
Priority为，整数，框架会根据这个数据决定多个cp的执行顺序
Arguments，传给cp的参数
如果hbase的classpath包含改类，FilePath可以留空

卸载：

先describe “tableName‘，查看你要卸载的cp的编号
然后alter 't1', METHOD => 'table_att_unset', NAME=> 'coprocessor$3'，coprocessor$3可变。

应用场景

这是一个最简单的例子，另外还有很多统计场景，可以用在这种方式实现，有如下好处：

节省网络带宽
减少RPC调用（scan的调用随着CacheSzie的变小而线性增加），减轻hbase压力
可以提高统计效率，那我之前写过的一个groupby类型的例子来说，大约可以提高50%以上的统计速度。

其他应用场景？

一个保存着用户信息的表，可以统计每个用户信息（counter job）
统计最大值，最小值，平均值，参考：https://issues.apache.org/jira/browse/HBASE-1512
批量删除记录，批量删除某个时间戳的记录

参考：

1. http://blogs.apache.org/hbase/entry/coprocessor_introduction
2. https://issues.apache.org/jira/browse/HBASE-1512

阅读全文……

标签 : database, hadoop, hbase, java, 大数据

发表评论

IT瘾于2014年12月9日上午01时25分00秒发布 #

Nginx优化教程 实现突破十万并发_源码_站长之家ChinaZ.com

nginx指令中的优化（配置文件）

内核参数的优化

一个完整的内核优化配置

一个简单的nginx优化配置文件

关于FastCGI的几个指令

Anychart图表系列五之事件监听 - 上善若水任方圆 - ITeye技术网站

使用HBase EndPoint（coprocessor）进行计算 « 搜索技术博客－淘宝

理想的方式应该是怎样？

什么是Endpoint？

怎么实现一个EndPoint

怎么部署？

应用场景

Nginx优化教程实现突破十万并发_源码_站长之家ChinaZ.com