nginx rewrite学习笔记
一、什么是Rewrite
Rewrite对称URL Rewrite,即URL重写,就是把传入Web的请求重定向到其他
URL的过程。URL Rewrite最常见的应用是URL伪静态化,是将动态页面显示为静态页
面方式的一种技术。比如http://www.123.com/news/index.asp?id=123 使用
URLRewrite 转换后可以显示为 http://www.123.com/news/123.html
对于追求完美主义的网站设计师,就算是网页的地址也希望看起来尽量简洁明快。形如
http://www.123.com/news/index.asp?id=123的网页地址,自然是毫无美感可言,而用
UrlRewrite技术,你可以轻松把它显示为 http://www.123.com/news/123.html。
理论上,搜索引擎更喜欢静态页面形式的网页,搜索引擎对静态页面的评分一般要高于
动态页面。所以,UrlRewrite可以让我们网站的网页更容易被搜索引擎所收录。
从安全角度上讲,如果在url中暴露太多的参数,无疑会造成一定量的信息泄漏,可能
会被一些黑客利用,对你的系统造成一定的破坏,所以静态化的url地址可以给我们带来更
高的安全性。
二、Rewrite相关指令
Nginx Rewrite相关指令有if、rewrite、set、return等。
if 的语法 应用于 server和location环境内
if (condition) { … }
if可以支持如下条件判断匹配符号
~ 为区分大小写匹配
~* 为不区分大小写匹配
!~和!~*分别为区分大小写不匹配及不区分大小写不匹配
-f 和!-f 用来判断是否存在文件
-d 和!-d 用来判断是否存在目录
-e 和!-e 用来判断是否存在文件或目录
-x 和!-x 用来判断文件是否可执行
在匹配过程中可以引用一些Nginx的全局变量,更多的变量请参考
http://wiki.nginx.org/NginxHttpCoreModule 的 Variables 部分
$args, 请求中的参数;
$document_root, 针对当前请求的根路径设置值;
$host, 请求信息中的"Host",如果请求中没有Host行,则等于设置的服务器名;
$limit_rate, 对连接速率的限制;
$request_method, 请求的方法,比如"GET"、"POST"等;
$remote_addr, 客户端地址;
$remote_port, 客户端端口号;
$remote_user, 客户端用户名,认证用;
$request_filename, 当前请求的文件路径名
$query_string, 与$args相同;
$scheme, 所用的协议,比如http或者是https
$server_protocol, 请求的协议版本,"HTTP/1.0"或"HTTP/1.1";
$server_addr, 服务器地址,如果没有用listen指明服务器地址,使用这个变量将发起一次系统调用
以取得地址(造成资源浪费);
$server_name, 请求到达的服务器名;
$document_uri 与$uri一样,URI地址;
$server_port, 请求到达的服务器端口号;
看了一大堆也许会有点晕,当然有时晕着晕着也就习惯了。不过我们还是先来看两个例
子。这样更有助于理解。
例 匹配访问的url地址是否是个目录
if (-d $request_filename) {
…;
}
例 匹配访问的地址是否以www开头
if ($hosts ~* ^www) {
…;
}
rewrite 指令根据表达式来重定向URI,或者修改字符串。可以应用于server,
location, if环境下 每行rewrite指令最后应该根一个flag标记,支持的flag标记有
last 相当于Apache里的[L]标记,表示完成rewrite
break 本条规则匹配完成后,终止匹配,不再匹配后面的规则
redirect 返回302临时重定向,浏览器地址会显示跳转后的URL地址
permanent 返回301永久重定向,浏览器地址会显示跳转后URL地址
last和break标记的区别在于,last标记在本条rewrite规则执行完后,会对其所在的
server { … } 标签重新发起请求,而break标记则在本条规则匹配完成后,停止匹配,不
再做后续的匹配。另有些时候必须使用last,比如在使用alias指令时,而使用proxy_pass
指令时则必须使用break。
例:以下这段rewrite会导致死循环
location /abc/ {
rewrite “^/abc/(.*)\.html$” /abc/index.html last;
}
我们应该将上面的last改成break以避免死循环。
redirect和 permanent区别则是返回的不同方式的重定向,对于客户端来说一般状态
下是没有区别的。而对于搜索引擎,相对来说301的重定向更加友好,如果我们把一个地址
采用301跳转方式跳转的话,搜索引擎会把老地址的相关信息带到新地址,同时在搜索引擎
索引库中彻底废弃掉原先的老地址。
使用302重定向时,搜索引擎(特别是google)有时会查看跳转前后哪个网址更直观,
然后决定显示哪个,如果它觉的跳转前的URL更好的话,也许地址栏不会更改,那么很有
可能出现URL劫持的现像。
我们在做URI重写时,有时会发现URI中含有相关参数,如果需要将这些参数保存下
来,并且在重写过程中重新引用,我们可以用到 () 和 $N 的方式来解决。
例:匹配访问的url地址是否是个目录,如果是则自动加个 /
if (-d $request_filename) {
rewrite ^/(.*)([^/])$ http://$host/$1$2/ permanent;
}
例:用户访问的网址为www.test.com/abc.html 重写后真实地址是
www.test.com/login.php?user=abc
location ~* /php/.*\.html$ {
rewrite /php/(.*)\.html /login.php?user=$1 last;
}
例:用户访问地址为/uplook/11-22-33.html重写后真实地址为
/uplook/11/22/33.html
location /uplook/ {
rewrite /uplook/([0-9]+)-([0-9]+)-([0-9]+).html /uplook/$1/$2/$3.html last;
}
set 指令是用于定义一个变量,并且赋值。应用于server,location,if环境。
语法格式为: set $变量名 变量值
例:当访问任意目录下的whoami.html都重定向到 /who.html
location ~* .*/whoami\.html$ {
set $who 'who.html';
rewrite .* /$who break;
}
return 指令用于返回状态码给客户端,应用于server,location,if环境。
例:如果访问的 .sh 结尾的文件则返回403操作拒绝错误
location ~* .*\.sh$ {
return 403;
}