nginx中if命令的设计和实现
原创文章,转载请注明: 转载自pagefault
本文链接地址: nginx中if命令的设计和实现
先看这篇文章:http://wiki.nginx.org/IfIsEvil,这篇文章只是简单的介绍了if使用中一些很恶心的地方,接下来我会通过代码来看if为什么是 evil的。
if是rewrite模块里面的一个命令,因此if部分的执行也是在rewrite的phase执行的,下面就来简要的描述下rewrite模块是如何运行的。
这里有一个很关键的函数就是ngx_http_script_code_p,它的原型如下:
typedef void (*ngx_http_script_code_pt) (ngx_http_script_engine_t *e);
在rewrite模块中,所有将要在rewrite phase执行的代码的函数都会是一个ngx_http_script_code_pt类型的函数(比如rewrtie的正则匹配,比如if指令等等,而当进入rewrite handler的时候,将会依次执行这些函数,这些函数都是保存在ngx_http_script_engine_t中,下面我们来看这个结构。
typedef struct { //这个指针指向了所有的需要执行的函数(ngx_http_script_code_pt)数组的首地址. u_char *ip; u_char *pos; ngx_http_variable_value_t *sp; ............................................................... //表示执行完对应的函数之后的返回值. ngx_int_t status; ngx_http_request_t *request; } ngx_http_script_engine_t;
接下来就是ngx_http_rewrite_handler函数,这个函数是rewrite phase的handler,可以看到它的实现比较简单,先取得将要执行的回调函数的地址,然后依次执行他们,最终通过返回值(e->status)来决定需要如何返回.
static ngx_int_t ngx_http_rewrite_handler(ngx_http_request_t *r) { ngx_http_script_code_pt code; ngx_http_script_engine_t *e; ngx_http_rewrite_loc_conf_t *rlcf; rlcf = ngx_http_get_module_loc_conf(r, ngx_http_rewrite_module); if (rlcf->codes == NULL) { return NGX_DECLINED; } e = ngx_pcalloc(r->pool, sizeof(ngx_http_script_engine_t)); ....................................................... //取得回调函数的地址 e->ip = rlcf->codes->elts; e->request = r; e->quote = 1; e->log = rlcf->log; //默认返回值是declined e->status = NGX_DECLINED; //开始遍历回调函数. while (*(uintptr_t *) e->ip) { code = *(ngx_http_script_code_pt *) e->ip; //执行回调,在回调函数中会更新ip指针,以便与下次调用. code(e); } if (e->status == NGX_DECLINED) { return NGX_DECLINED; } if (r->err_status == 0) { return e->status; } return r->err_status; }
了解了大体流程之后,我们来看if指令的实现。首先来看ngx_http_rewrite_if的实现,函数比较长,我们分段来看,首先是新建一个ctx,然后新建location(调用create_loc_conf),然后将新建的location挂载到新的ctx中,这里要注意server conf和main conf是不变的。
ctx = ngx_pcalloc(cf->pool, sizeof(ngx_http_conf_ctx_t)); if (ctx == NULL) { return NGX_CONF_ERROR; } pctx = cf->ctx; //main conf和serv conf不变 ctx->main_conf = pctx->main_conf; ctx->srv_conf = pctx->srv_conf; //新建loc conf ctx->loc_conf = ngx_pcalloc(cf->pool, sizeof(void *) * ngx_http_max_module); if (ctx->loc_conf == NULL) { return NGX_CONF_ERROR; } //开始新建location conf for (i = 0; ngx_modules[i]; i++) { if (ngx_modules[i]->type != NGX_HTTP_MODULE) { continue; } module = ngx_modules[i]->ctx; if (module->create_loc_conf) { mconf = module->create_loc_conf(cf); if (mconf == NULL) { return NGX_CONF_ERROR; } ctx->loc_conf[ngx_modules[i]->ctx_index] = mconf; } }
接下来就是加新的location(ngx_http_add_location),紧接着就会解析if后面的指令(比如等号,括号等),通过不同的符号设置不同的回调函数,我们后面会分析这个函数,然后就是从codes属猪中取得对应的if_code,然后设置code值,也就是回调函数。
clcf = ctx->loc_conf[ngx_http_core_module.ctx_index]; clcf->loc_conf = ctx->loc_conf; clcf->name = pclcf->name; clcf->noname = 1; //加location if (ngx_http_add_location(cf, &pclcf->locations, clcf) != NGX_OK) { return NGX_CONF_ERROR; } //设置if的条件对应的回调. if (ngx_http_rewrite_if_condition(cf, lcf) != NGX_CONF_OK) { return NGX_CONF_ERROR; } //从数组中取得元素(codes默认是一个每个元素为1个字节的数组). if_code = ngx_array_push_n(lcf->codes, sizeof(ngx_http_script_if_code_t)); if (if_code == NULL) { return NGX_CONF_ERROR; } //给code赋值,后面会详细分析这个回调函数. if_code->code = ngx_http_script_if_code; .................................................................... //如果name长度为0,则说明这是一个server if。 if (pclcf->name.len == 0) { //此时loc就为null if_code->loc_conf = NULL; cf->cmd_type = NGX_HTTP_SIF_CONF; } else { //否则保存对应loc_conf,这里loc_conf里面保存了我们需要的信息. if_code->loc_conf = ctx->loc_conf; cf->cmd_type = NGX_HTTP_LIF_CONF; } //解析,这时if 作用域里面的命令都会保存在if_code->loc_conf中.因为上面我们改变了cf本身的loc conf rv = ngx_conf_parse(cf, NULL);
接下来来看ngx_http_rewrite_if_condition,这个函数比较长,我们就关注当if的条件是等于时的情况,其它的情况都类似。它也是会设置一个回调函数(code).
static char * ngx_http_rewrite_if_condition(ngx_conf_t *cf, ngx_http_rewrite_loc_conf_t *lcf) { ................................................................ if (len == 1 && p[0] == '=') { if (ngx_http_rewrite_value(cf, lcf, &value[last]) != NGX_CONF_OK) { return NGX_CONF_ERROR; } //从codes数组中得到对应的值。 code = ngx_http_script_start_code(cf->pool, &lcf->codes, sizeof(uintptr_t)); if (code == NULL) { return NGX_CONF_ERROR; } //然后赋值。 *code = ngx_http_script_equal_code; return NGX_CONF_OK; } ............................ }
然后来看ngx_http_script_equal_code,它主要是会判断if中声明的两个值是否相等,如果相等则设置对应的值为ngx_http_variable_true_value,否则设置为ngx_http_variable_null_value,以供后面调用ngx_http_script_if_code时判断。
void ngx_http_script_equal_code(ngx_http_script_engine_t *e) { ngx_http_variable_value_t *val, *res; ngx_log_debug0(NGX_LOG_DEBUG_HTTP, e->request->connection->log, 0, "http script equal"); e->sp--; val = e->sp; res = e->sp - 1; e->ip += sizeof(uintptr_t); //比较是否相等 if (val->len == res->len && ngx_strncmp(val->data, res->data, res->len) == 0) { //相等赋值为ngx_http_variable_true_value *res = ngx_http_variable_true_value; return; } ngx_log_debug0(NGX_LOG_DEBUG_HTTP, e->request->connection->log, 0, "http script equal: no"); *res = ngx_http_variable_null_value; }
最后来看ngx_http_script_if_cod,它主要是就是根据前面的函数设置的变量来判断是否if条件成立,如果成立,则将在ngx_http_rewrite_if保存的loc conf赋值为当前的request的loc conf.这样,接下来的都会使用新的loc conf.
void ngx_http_script_if_code(ngx_http_script_engine_t *e) { ngx_http_script_if_code_t *code; code = (ngx_http_script_if_code_t *) e->ip; ngx_log_debug0(NGX_LOG_DEBUG_HTTP, e->request->connection->log, 0, "http script if"); e->sp--; //判断if的条件是否成立 if (e->sp->len && e->sp->data[0] != '0') { if (code->loc_conf) { ngx_log_debug0(NGX_LOG_DEBUG_HTTP, e->request->connection->log, 0, "http script if: update"); //修改loc conf,然后update。 e->request->loc_conf = code->loc_conf; ngx_http_update_location_config(e->request); } e->ip += sizeof(ngx_http_script_if_code_t); return; } //否则修改ip,然后进入下面的处理 ngx_log_debug0(NGX_LOG_DEBUG_HTTP, e->request->connection->log, 0, "http script if: false"); e->ip += code->next; }
最后来看一开始的nginx wiki中的几个if的例子。
从上面可以看到最关键的一个就是update loc conf的那段,而loc是每次在解析if指令的时候创建的,因此如果我们的指令在if之前就被解析的话,此时if中这个指令的设置就是无效的,我们来看一开始nginx wiki中的2个例子:
location /proxy-pass-uri { proxy_pass http://127.0.0.1:8080/; set $true 1; if ($true) { # nothing } } # try_files wont work due to if location /if-try-files { try_files /file @fallback; set $true 1; if ($true) { # nothing } }
可以看到如果进入if的话,location里面的指令将不会被继承。所以对应的proxy_pass 和try_files都不会在if里面起作用.
而如果有两个if的话,第二个将会覆盖第一个,所以在下面的这个里面只有第二个会起作用.
location /only-one-if { set $true 1; if ($true) { add_header X-First 1; } if ($true) { add_header X-Second 2; } return 204; }
不知道igor以后会不会改写if,我的想法是,把if放到core http module,然后单独做一个if作用域,它要么属于server要么属于loc,然后每次解析对应的server或者loc的时候,merge存在的if作用域就可以了。
Related posts: