纸上得来终觉浅,绝知此事要躬行。
1. 基础知识
1.1 架构演变
传统意思上,基于进程或线程模型架构的web
服务通过每进程或每线程处理并发连接请求,这势必会在网络和I/O
操作时产生阻塞,其另一个必然结果则是对内存或CPU
的利用率低下。生成一个新的进程/线程需要事先备好其运行时环境,这包括为其分配堆内存和栈内存,以及为其创建新的执行上下文等。这些操作都需要占用CPU
,而且过多的进程/线程还会带来线程抖动或频繁的上下文切换,系统性能也会由此进一步下降。
在设计的最初阶段,nginx
的主要着眼点就是其高性能以及对物理计算资源的高密度利用,因此其采用了不同的架构模型。受启发于多种操作系统设计中基于“事件”的高级处理机制,nginx
采用了模块化、事件驱动、异步、单线程及非阻塞的架构,并大量采用了多路复用及事件通知机制。在nginx
中,连接请求由为数不多的几个仅包含一个线程的进程worker
以高效的回环(run-loop
)机制进行处理,而每个worker
可以并行处理数千个的并发连接及请求。
如果负载以CPU
密集型应用为主,如SSL
或压缩应用,则worker
数应与CPU
数相同;如果负载以I/O
密集型为主,如响应大量内容给客户端,则worker
数应该为CPU
个数的1.5
或2
倍。
1.2 运行模式
Nginx
会按需同时运行多个进程:一个主进程(master
)和几个工作进程(worker
),配置了缓存时还会有缓存加载器进程(cache loader
)和缓存管理器进程(cache manager
)等。所有进程均是仅含有一个线程,并主要通过“共享内存”的机制实现进程间通信。主进程以root
用户身份运行,而worker
、cache loader
和cache manager
均应以非特权用户身份运行。
master 进程主要完成如下工作:
- 读取并验正配置信息;
- 创建、绑定及关闭套接字;
- 启动、终止及维护
worker
进程的个数; - 无须中止服务而重新配置工作特性;
- 控制非中断式程序升级,启用新的二进制程序并在需要时回滚至老版本;
- 重新打开日志文件,实现日志滚动;
- 编译嵌入式 perl 脚本;
worker 进程主要完成的任务包括:
- 负责实际响应用户请求
cache loader 进程主要完成的任务包括:
- 检查缓存存储中的缓存对象;
- 使用缓存元数据建立内存数据库;
- 接收、传入并处理来自客户端的连接;
- 提供反向代理及过滤功能;
- nginx 任何能完成的其它任务;
cache manager 进程的主要任务:
- 缓存的失效及过期检验;
2. 安装 Nginx 服务
平台版本为:
rhel 6.4 32bit
2.1 基本安装操作
- 1、解决依赖关系
# 安装Nginx服务的必备软件包和组件
yum install -y openssl-devel pcre-devel
yum groupinstall -y "Development Tools"
yum groupinstall -y "Server Platform Deveopment"
- 2、安装 Nginx 服务
# 首先添加用户nginx,用于运行nginx服务进程
groupadd -r nginx
useradd -r -g nginx nginx
# 接着进行编译
./configure \
--prefix=/usr/local/nginx \
--error-log-path=/data/applogs/nginx/error.log \
--http-log-path=/data/applogs/nginx/access.log \
--pid-path=/var/run/nginx/nginx.pid \
--lock-path=/var/lock/nginx.lock \
--user=nginx \
--group=nginx \
--with-http_ssl_module \
--with-http_flv_module \
--with-http_stub_status_module \
--with-http_gzip_static_module \
--http-client-body-temp-path=/usr/local/nginx/client/ \
--http-proxy-temp-path=/usr/local/nginx/proxy/ \
--http-fastcgi-temp-path=/usr/local/nginx/fcgi/ \
--http-uwsgi-temp-path=/usr/local/nginx/uwsgi \
--http-scgi-temp-path=/usr/local/nginx/scgi \
--with-pcre
# 最后进行安装
make && make install
2.2 额外优化操作
加速内存分配
Nginx
可以使用Tmalloc
(快速、多线程的 malloc 库及优秀性能分析工具)来加速内存分配,使用此功能需要事先安装gperftools
,而后在编译nginx
添加--with-google_perftools_module
选项即可。
添加额外组件
- 如果想使用
Nginx
的perl
模块,可以为configure
脚本添加--with-http_perl_module
选项来实现。 - 如果想使用基于
nginx
的cgi
功能,也可以基于FCGI
来实现,具体实现方法请参照网上的文档。
- 如果想使用
编译启动脚本
- 为
Nginx
提供SysV
的init
脚本 - 新建
/etc/rc.d/init.d/nginx
文件,添加如下内容
- 为
#!/bin/sh
# nginx - this script starts and stops the nginx daemon
#
# chkconfig: - 85 15
# description: Nginx is an HTTP(S) server, HTTP(S) reverse \
# proxy and IMAP/POP3 proxy server
# processname: nginx
# config: /etc/nginx/nginx.conf
# config: /etc/sysconfig/nginx
# pidfile: /var/run/nginx.pid
# Source function library.
. /etc/rc.d/init.d/functions
# Source networking configuration.
. /etc/sysconfig/network
# Check that networking is up.
[ "$NETWORKING" = "no" ] && exit 0
nginx="/usr/local/nginx/sbin/nginx"
prog=$(basename $nginx)
NGINX_CONF_FILE="/usr/local/nginx/nginx.conf"
[ -f /etc/sysconfig/nginx ] && . /etc/sysconfig/nginx
lockfile=/var/lock/subsys/nginx
make_dirs() {
# make required directories
user=`nginx -V 2>&1 | grep "configure arguments:" | sed 's/[^*]*--user=\([^ ]*\).*/\1/g' -`
options=`$nginx -V 2>&1 | grep 'configure arguments:'`
for opt in $options; do
if [ `echo $opt | grep '.*-temp-path'` ]; then
value=`echo $opt | cut -d "=" -f 2`
if [ ! -d "$value" ]; then
# echo "creating" $value
mkdir -p $value && chown -R $user $value
fi
fi
done
}
start() {
[ -x $nginx ] || exit 5
[ -f $NGINX_CONF_FILE ] || exit 6
make_dirs
echo -n $"Starting $prog: "
daemon $nginx -c $NGINX_CONF_FILE
retval=$?
echo
[ $retval -eq 0 ] && touch $lockfile
return $retval
}
stop() {
echo -n $"Stopping $prog: "
killproc $prog -QUIT
retval=$?
echo
[ $retval -eq 0 ] && rm -f $lockfile
return $retval
}
restart() {
configtest || return $?
stop
sleep 1
start
}
reload() {
configtest || return $?
echo -n $"Reloading $prog: "
killproc $nginx -HUP
RETVAL=$?
echo
}
force_reload() {
restart
}
configtest() {
$nginx -t -c $NGINX_CONF_FILE
}
rh_status() {
status $prog
}
rh_status_q() {
rh_status >/dev/null 2>&1
}
case "$1" in
start)
rh_status_q && exit 0
$1
;;
stop)
rh_status_q || exit 0
$1
;;
restart|configtest)
$1
;;
reload)
rh_status_q || exit 7
$1
;;
force-reload)
force_reload
;;
status)
rh_status
;;
condrestart|try-restart)
rh_status_q || exit 0
;;
*)
echo $"Usage: $0 {start|stop|status|restart|condrestart|try-restart|reload|force-reload|configtest}"
exit 2
esac
# 而后为此脚本赋予执行权限
chmod +x /etc/rc.d/init.d/nginx
# 添加至服务管理列表,并让其开机自动启动
chkconfig --add nginx
chkconfig nginx on
# 而后就可以启动服务并测试了
service nginx start
3. Nginx 配置文件
3.1 配置格式介绍
Nginx
的配置有着几个不同的上下文:main
、http
、server
、upstream
和location
(还有实现邮件服务反向代理的mail
)。配置语法的格式和定义方式遵循所谓的C
风格,因此支持嵌套,还有着逻辑清晰并易于创建、阅读和维护等优势。
Nginx
的代码是由一个核心和一系列的模块组成,核心主要用于提供Web Server
的基本功能,以及Web
和Mail
反向代理的功能;还用于启用网络协议,创建必要的运行时环境以及确保不同的模块之间平滑地进行交互。不过,大多跟协议相关的功能和某应用特有的功能都是由nginx
的模块实现的。
这些功能模块大致可以分为事件模块、阶段性处理器、输出过滤器、变量处理器、协议、upstream
和负载均衡几个类别,这些共同组成了nginx
的http
功能。事件模块主要用于提供OS
独立的(不同操作系统的事件机制有所不同)事件通知机制如kqueue
或epoll
等。协议模块则负责实现nginx
通过http
、tls/ssl
、smtp
、pop3
以及imap
与对应的客户端建立会话。
在nginx
内部,进程间的通信是通过模块的pipeline
或chain
实现的。换句话说,每一个功能或操作都由一个模块来实现。例如,压缩、通过FastCGI
或uwsgi
协议与upstream
服务器通信,以及与memcached
建立会话等。
Nginx
的核心模块为Main
和Events
,此外还包括标准HTTP
模块、可选HTTP
模块和邮件模块,其还可以支持诸多第三方模块。Main
用于配置错误日志、进程及权限等相关的参数,Events
用于配置IO
模型,如epoll
、kqueue
、select
或poll
等,它们是必备模块。
Nginx
的主配置文件由几个段组成,这个段通常也被称为nginx
的上下文,每个段的定义格式如下所示。需要注意的是,其每一个指令都必须使用分号(;
)结束,否则为语法错误。
user
worker_processes
error_log
pid
events {
...
}
http {
...
upstream escapelife {
...
}
server{
...
location {
...
}
}
}
3.2 配置 main 模块
下面说明
main
模块中的几个关键参数。
- error_log
# 用于配置错误日志,可用于main、http、server及location上下文中
# 语法格式
error_log file | stderr [debug|info|notice|warn|error|crit|alert|emerg]
# 如果在编译nginx时使用了--with-debug选项,还可以使用如下格式打开调试功能。
error_log LOGFILE [debug_core|debug_alloc|debug_mutex|debug_event|debug_http|debug_imap];
# 要禁用错误日志,不能使用“error_log off;”,而要使用类似如下选项:
error_log /dev/null crit;
- timer_resolution
# 用于降低gettimeofday()系统调用的次数。
# 默认情况下,每次从kevent()、epoll、/dev/poll、select()或poll()返回时都会执行此系统调用。
# 语法格式
timer_resolution interval
# 例如
timer_resolution 100ms;
- worker_cpu_affinity
# 通过sched_setaffinity()将worker绑定至CPU上,只能用于main上下文。
# 语法格式
worker_cpu_affinity cpumask ...
# 例如
worker_processes 4;
worker_cpu_affinity 0001 0010 0100 1000;
- worker_priority
# 为worker进程设定优先级(指定nice值),此参数只能用于main上下文中,默认为0;
# 语法格式
worker_priority number
- worker_processes
# worker进程是单线程进程。如果Nginx用于CPU密集型的场景中,如SSL或gzip,且主机上的CPU个数至
# 少有2个,那么应该将此参数值设定为与CPU核心数相同;如果Nginx用于大量静态文件访问的场景中,且
# 所有文件的总大小大于可用内存时,应该将此参数的值设定得足够大以充分利用磁盘带宽。
# 此参数与Events上下文中的work_connections变量一起决定了maxclient的值
maxclients = work_processes * work_connections
- worker_rlimit_nofile
# 设定worker进程所能够打开的文件描述符个数的最大值。
# 语法格式
worker_rlimit_nofile number
3.3 配置 events 模块
- worker_connections
# 设定每个worker所处理的最大连接数
# 它与来自main上下文的worker_processes一起决定了maxclients的值
max_clients = worker_processes * worker_connections
# 而在反向代理场景中,其计算方法与上述公式不同,因为默认情况下浏览器将打开2个
# 连接,而nginx会为每一个连接打开2个文件描述符,因此,其maxclients的计算方法为
max_clients = worker_processes * worker_connections / 4
- use
# 在有着多于一个的事件模型IO的应用场景中,可以使用此指令设定nginx所使用的IO机制
# 默认为./configure脚本选定的各机制中最适用当前OS的版本
# 语法格式
use [kqueue|rtsig|epoll|/dev/poll|select|poll|eventport]
3.4 一个配置示例
user nginx;
worker_processes 16;
error_log /var/log/nginx/error.log;
pid /var/run/nginx.pid;
events {
use epoll;
worker_connections 2048;
}
3.5 HTTP 服务器相关配置
http
上下文专用于配置用于http
的各模块,此类指令非常的多,每个模块都有其专用指定,具体请参数nginx
官方wiki
关于模块部分的说明。
大体上来讲,这些模块所提供的配置指令还可以分为如下几个类别。
- 客户端类指令
client_body_buffer_size
client_header_buffer_size
client_header_timeout
keepalive_timeout
- 等等
- 文件 IO 类指令
aio
directio
open_file_cache
open_file_cache_min_uses
open_file_cache_valid
sendfile
- 等等
- hash 类指令
- 用于定义
Nginx
为某特定的变量分配多大的内存空间 types_hash_bucket_size
server_names_hash_bucket_size
variables_hash_bucket_size
- 等等
- 用于定义
- 套接字类指令
- 用于定义
Nginx
如何处理tcp
套接字相关的功能 tcp_nodelay
(用于keepalive
功能启用时)tcp_nopush
(用于sendfile
启用时)- 等等
- 用于定义
3.6 虚拟服务器相关配置
- 用于定义虚拟服务器相关的属性,常见的指令有
backlog
、rcvbuf
、bind
及sndbuf
等。
server {
<directive> <parameters>;
}
3.7 location 的相关配置
- 通常用于
server
上下文中,用于设定某URI
的访问属性,location
可以嵌套。
location [modifier] uri {...} 或 location @name {…}
- 如下面关于
memcached
的相关配置
server {
location / {
set $memcached_key $uri;
memcached_pass name:11211;
default_type text/html;
error_page 404 @fallback;
}
location @fallback {
proxy_pass http://backend;
}
}
4. Nginx 的反向代理
4.1 使用方式
Nginx
通过proxy
模块实现反向代理功能。在作为web
反向代理服务器时,nginx
负责接收客户请求,并能够根据URI
、客户端参数或其它的处理逻辑将用户请求调度至上游服务器上(upstream server
)。nginx
在实现反向代理功能时的最重要指令为proxy_pass
,它能够将location
定义的某URI
代理至指定的上游服务器(组)上。如下面的示例中,location
的/uri
将被替换为上游服务器上的/newuri
。
location /uri {
proxy_pass http://www.escapelife.com:8080/newuri;
}
- 不过,这种处理机制中有两个例外。一个是如果
location
的URI
是通过模式匹配定义的,其URI
将直接被传递至上游服务器,而不能为其指定转换的另一个URI
。
location ~ ^/bbs {
proxy_pass http://www.escapelife.com;
}
- 第二个例外是,如果在
loation
中使用的URL
重定向,那么nginx
将使用重定向后的URI
处理请求,而不再考虑上游服务器上定义的URI
。如下面所示的例子中,传送给上游服务器的URI
为/index.php?page=<match>
,而不是/index
。
location / {
rewrite /(.*)$ /index.php?page=$1 break;
proxy_pass http://localhost:8080/index;
}
4.2 proxy 模块的指令
proxy
模块的可用配置指令非常多,它们分别用于定义proxy
模块工作时的诸多属性,如连接超时时长、代理时使用http
协议版本等。下面对常用的指令做一个简单说明。
- proxy_connect_timeout
nginx
将一个请求发送至upstream server
之前等待的最大时长;
- proxy_cookie_domain
- 将
upstream server
通过Set-Cookie
首部设定的domain
属性修改为指定的值,其值可以为一个字符串、正则表达式的模式或一个引用的变量;
- 将
- proxy_cookie_path
- 将
upstream server
通过Set-Cookie
首部设定的path
属性修改为指定的值,其值可以为一个字符串、正则表达式的模式或一个引用的变量;
- 将
- proxy_hide_header
- 设定发送给客户端的报文中需要隐藏的首部;
- proxy_pass
- 指定将请求代理至
upstream server
的URL
路径;
- 指定将请求代理至
- proxy_set_header
- 将发送至
upsream server
的报文的某首部进行重写;
- 将发送至
- proxy_redirect
- 重写
location
并刷新从upstream server
收到的报文的首部;
- 重写
- proxy_send_timeout
- 在连接断开之前两次发送至
upstream server
的写操作的最大间隔时长;
- 在连接断开之前两次发送至
- proxy_read_timeout
- 在连接断开之前两次从接收
upstream server
接收读操作的最大间隔时长;
- 在连接断开之前两次从接收
如下面的一个示例:
proxy_redirect off;
proxy_set_header Host $host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
client_max_body_size 10m;
client_body_buffer_size 128k;
proxy_connect_timeout 30;
proxy_send_timeout 15;
proxy_read_timeout 15;
4.3 upstream 模块
与proxy
模块结合使用的模块中,最常用的当属upstream
模块。pstream
模块可定义一个新的上下文,它包含了一组宝岛upstream
服务器,这些服务器可能被赋予了不同的权重、不同的类型甚至可以基于维护等原因被标记为down
。
upstream 模块常用的指令
- ip_hash:基于客户端
IP
地址完成请求的分发,它可以保证来自于同一个客户端的请求始终被转发至同一个upstream
服务器; - keepalive:每个
worker
进程为发送到upstream
服务器的连接所缓存的个数; - least_conn:最少连接调度算法;
- server:定义一个
upstream
服务器的地址,还可包括一系列可选参数,如:- weight:权重;
- max_fails:最大失败连接次数,失败连接的超时时长由
fail_timeout
指定; - fail_timeout:等待请求的目标服务器发送响应的时长;
- backup:用于
fallback
的目的,所有服务均故障时才启动此服务器; - down:手动标记其不再处理任何请求;
# 例如
upstream backend {
server www.escapelife.com weight=5;
server www2.escapelife.com:8080 max_fails=3 fail_timeout=30s;
}
upstream
模块的负载均衡算法主要有三种,轮调(round-robin
)、ip 哈希(ip_hash
)和最少连接(least_conn
)三种。此外,upstream
模块也能为非http
类的应用实现负载均衡,如下面的示例定义了nginx
为memcached
服务实现负载均衡之目的。
upstream memcachesrvs {
server 172.16.100.6:11211;
server 172.16.100.7:11211;
}
server {
location / {
set $memcached_key "$uri?$args";
memcached_pass memcachesrvs;
error_page 404 = @fallback;
}
location @fallback {
proxy_pass http://127.0.0.1:8080;
}
}
4.4 if 判断语句
- 基本使用方法
在location
中使用if
语句可以实现条件判断,其通常有一个return
语句,且一般与有着last
或break
标记的rewrite
规则一同使用。但其也可以按需要使用在多种场景下,需要注意的是,不当的使用可能会导致不可预料的后果。
location / {
if ($request_method == "PUT") {
proxy_pass http://upload.escapelife.com:8080;
}
if ($request_uri ~ "\.(jpg|gif|jpeg|png)$") {
proxy_pass http://imageservers;
break;
}
}
upstream imageservers {
server 172.16.100.8:80 weight 2;
server 172.16.100.9:80 weight 3;
}
- if 语句中的判断条件
# 正则表达式匹配
~:与指定正则表达式模式匹配时返回“真”,判断匹配与否时区分字符大小写;
~*:与指定正则表达式模式匹配时返回“真”,判断匹配与否时不区分字符大小写;
!~:与指定正则表达式模式不匹配时返回“真”,判断匹配与否时区分字符大小写;
!~*:与指定正则表达式模式不匹配时返回“真”,判断匹配与否时不区分字符大小写;
# 文件及目录匹配判断
-f, !-f:判断指定的路径是否为存在且为文件;
-d, !-d:判断指定的路径是否为存在且为目录;
-e, !-e:判断指定的路径是否存在,文件或目录均可;
-x, !-x:判断指定路径的文件是否存在且可执行;
- 常用的全局变量
下面是nginx
常用的全局变量中的一部分,它们经常用于if
语句中实现条件判断。
$args
$content_length
$content_type
$document_root
$document_uri
$host
$http_user_agent
$http_cookie
$limit_rate
$request_body_file
$request_method
$remote_addr
$remote_port
$remote_user
$request_filename
$request_uri
$query_string
$scheme
$server_protocol
$server_addr
$server_name
$server_port
$uri
5. 反向代理性能优化
在反向代理场景中,
nginx
有一系列指令可用于定义其工作特性,如缓冲区大小等,给这些指令设定一个合理的值,可以有效提升其性能。
5.1 缓冲区设定
nginx
在默认情况下在将其响应给客户端之前会尽可能地接收来upstream
服务器的响应报文,它会将这些响应报文存暂存于本地并尽量一次性地响应给客户端。然而,在来自于客户端的请求或来自upsteam
服务器的响应过多时,nginx
会试图将之存储于本地磁盘中,这将大大降低nginx
的性能。因此,在有着更多可用内存的场景中,应该将用于暂存这些报文的缓冲区调大至一个合理的值。
proxy_buffer_size size
- 设定用于暂存来自于
upsteam
服务器的第一个响应报文的缓冲区大小;
- 设定用于暂存来自于
proxy_buffering on|off
- 启用缓冲
upstream
服务器的响应报文,否则,如果proxy_max_temp_file_size
指令的值为0
,来自upstream
服务器的响应报文在接收到的那一刻将同步发送至客户端;一般情况下,启用proxy_buffering
并将proxy_max_temp_file_size
设定为0
能够启用缓存响应报文的功能,并能够避免将其缓存至磁盘中;
- 启用缓冲
proxy_buffers 8 4k|8k
- 用于缓冲来自
upstream
服务器的响应报文的缓冲区大小;
- 用于缓冲来自
5.2 缓存设定
nginx
做为反向代理时,能够将来自upstream
的响应缓存至本地,并在后续的客户端请求同样内容时直接从本地构造响应报文。
- proxy_cache zone|off
- 定义一个用于缓存的共享内存区域,其可被多个地方调用;缓存将遵从
upstream
服务器的响应报文首部中关于缓存的设定,如"Expires"
、"Cache-Control: no-cache"
、"Cache-Control: max-age=XXX"
、"private"
和"no-store"
等,但nginx
在缓存时不会考虑响应报文的"Vary"
首部。为了确保私有信息不被缓存,所有关于用户的私有信息可以upstream
上通过"no-cache" or "max-age=0"
来实现,也可在 nginx 设定proxy_cache_key
必须包含用户特有数据如$cookie_xxx
的方式实现,但最后这种方式在公共缓存上使用可能会有风险。因此,在响应报文中含有以下首部或指定标志的报文将不会被缓存。
- 定义一个用于缓存的共享内存区域,其可被多个地方调用;缓存将遵从
Set-Cookie
Cache-Control containing "no-cache", "no-store", "private", or a "max-age" with a non-numeric or 0 value
Expires with a time in the past
X-Accel-Expires: 0
proxy_cache_key
$uri
设定在存储及检索缓存时用于“键”的字符串,可以使用变量为其值,但使用不当时有可能会为同一个内容缓存多次;另外,将用户私有信息用于键可以避免将用户的私有信息返回给其它用户;
proxy_cache_lock
- 启用此项,可在缓存未命令中阻止多个相同的请求同时发往
upstream
,其生效范围为worker
级别;
- 启用此项,可在缓存未命令中阻止多个相同的请求同时发往
proxy_cache_lock_timeout
proxy_cache_lock
功能的锁定时长;
proxy_cache_min_uses
- 某响应报文被缓存之前至少应该被请求的次数;
proxy_cache_path
- 定义一个用记保存缓存响应报文的目录,及一个保存缓存对象的键及响应元数据的共享内存区域(
keys_zone=name:size
),其可选参数有: levels
:每级子目录名称的长度,有效值为 1 或 2,每级之间使用冒号分隔,最多为 3 级;inactive
:非活动缓存项从缓存中剔除之前的最大缓存时长;max_size
:缓存空间大小的上限,当需要缓存的对象超出此空间限定时,缓存管理器将基于 LRU 算法对其进行清理;loader_files
:缓存加载器(cache_loader
)的每次工作过程最多为多少个文件加载元数据;loader_sleep
:缓存加载器的每次迭代工作之后的睡眠时长;loader_threashold
:缓存加载器的最大睡眠时长;
- 定义一个用记保存缓存响应报文的目录,及一个保存缓存对象的键及响应元数据的共享内存区域(
# 例如
proxy_cache_path /data/nginx/cache/one levels=1 keys_zone=one:10m;
proxy_cache_path /data/nginx/cache/two levels=2:2 keys_zone=two:100m;
proxy_cache_path /data/nginx/cache/three levels=1:1:2 keys_zone=three:1000m;
- proxy_cache_use_stale
- 在无法联系到
upstream
服务器时的哪种情形下(如error
、timeout
或http_500
等)让nginx
使用本地缓存的过期的缓存对象直接响应客户端请求
- 在无法联系到
# 其格式为
proxy_cache_use_stale error|timeout|invalid_header|updating
proxy_cache_use_stale http_500|http_502|http_503|http_504|http_404|off
proxy_cache_valid [ code …] time
- 用于为不同的响应设定不同时长的有效缓存时长
- 例如:
proxy_cache_valid 200 302 10m;
proxy_cache_methods [GET HEAD POST]
- 为哪些请求方法启用缓存功能;
proxy_cache_bypass string
- 设定在哪种情形下,
nginx
将不从缓存中取数据;
- 设定在哪种情形下,
# 例如
proxy_cache_bypass $cookie_nocache $arg_nocache $arg_comment;
proxy_cache_bypass $http_pragma $http_authorization;
http {
proxy_cache_path /data/nginx/cache levels=1:2 keys_zone=STATIC:10m
inactive=24h max_size=1g;
server {
location / {
proxy_pass http://www.escapelife.com;
proxy_set_header Host $host;
proxy_cache STATIC;
proxy_cache_valid 200 1d;
proxy_cache_valid 301 302 10m;
proxy_cache_vaild any 1m;
proxy_cache_use_stale error timeout invalid_header updating
http_500 http_502 http_503 http_504;
}
}
}
5.3 压缩设定
nginx
将响应报文发送至客户端之前可以启用压缩功能,这能够有效地节约带宽,并提高响应至客户端的速度。通常编译nginx
默认会附带gzip
压缩的功能,因此,可以直接启用之。
http {
gzip on;
gzip_http_version 1.0;
gzip_comp_level 2;
gzip_types text/plain
text/css
application/x-javascript
text/xml
application/xml
application/xml+rss
text/javascript
application/javascript
application/json;
gzip_disable msie6;
}
gzip_proxied
指令可以定义对客户端请求哪类对象启用压缩功能,如“expired”
表示对由于使用了expire
首部定义而无法缓存的对象启用压缩功能,其它可接受的值还有“no-cache”
、“no-store”
、“private”
、“no_last_modified”
、“no_etag”
和“auth”
等,而“off”
则表示关闭压缩功能。
^~ /test
rewrite a.jpg a.css last;
rewrite a.css --> 172.16.1.1 break;
rewrite 172.16.1.1 172.16.1.2
~* css$
6. Nginx 配置文件示例
6.1 反向代理
server {
listen 80;
server_name www.escapelife.com;
add_header X-Via $server_addr;
location / {
root html;
index index.html index.htm;
if ($request_method ~* "PUT") {
proxy_pass http://172.16.100.12;
break;
}
}
location /bbs {
proxy_pass http://172.16.100.11/;
}
}
此例中,对http://www.escapelife.com/bbs/
的请求将被转发至http://172.16.100.11/
这个URL
,切记最后的/
不应该省去;而/
匹配的URL
中请求方法为“PUT”时
,将被转发至http://172.16.100.12/
这个URL
。
另外,add_header
用于让nginx
在响应给用户的报文中构造自定义首部,其使用格式为“add_header NAME VALUE”
。可以使用curl
命令对配置好的服务进行请求,以验正其效果。如:
# curl -I http://www.escapelife.com/bbs/
HTTP/1.1 200 OK
Server: nginx/1.4.1
Date: Tue, 14 May 2013 10:19:10 GMT
Content-Type: text/html; charset=UTF-8
Content-Length: 15
Connection: keep-alive
Last-Modified: Tue, 30 Apr 2013 09:34:09 GMT
ETag: "186e9f-f-b4076640"
X-Via: 172.16.100.107
Accept-Ranges: bytes
在后端服务器172.16.100.12
上装载dav
模块,并开放其dav
功能,而后验正文件上传效果。开放dav
功能的方法如下:
# 首先启用如下两个模块
LoadModule dav_module modules/mod_dav.so
LoadModule dav_fs_module modules/mod_dav_fs.so
# 而后配置相应主机的目录如下所示,关键是其中的dav一行
<Directory "/var/www/html">
dav on
Options Indexes FollowSymLinks
Order allow,deny
Allow from all
</Directory>
# 接着尝试访问代理服务器
# curl -I -T /etc/inittab http://www.escapelife.com/
HTTP/1.1 100 Continue
HTTP/1.1 201 Created
Server: nginx/1.4.1
Date: Tue, 14 May 2013 10:20:15 GMT
Content-Type: text/html; charset=UTF-8
Content-Length: 261
Location: http://172.16.100.107/inittab
Connection: keep-alive
X-Via: 172.16.100.107
<!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN">
<html><head>
<title>201 Created</title>
</head><body>
<h1>Created</h1>
<p>Resource /inittab has been created.</p>
<hr />
<address>Apache/2.2.3 (Red Hat) Server at 172.16.100.12 Port 80</address>
</body></html>
6.2 启用缓存
http {
include mime.types;
default_type application/octet-stream;
sendfile on;
keepalive_timeout 65;
proxy_cache_path /nginx/cache/escapelife
levels=1:2
keys_zone=first:10m
max_size=10g
inactive=60m
use_temp_path=off;
server {
listen 80;
server_name www.escapelife.com;
location / {
root html;
index index.html index.htm;
if ($request_method ~* "PUT") {
proxy_pass http://172.16.100.12;
break;
}
}
location /bbs {
proxy_pass http://172.16.100.11/;
proxy_cache first;
proxy_cache_valid 200 1d;
proxy_cache_valid 301 302 10m;
proxy_cache_valid any 1m;
}
}
}
6.3 使用 upstream
- upstream 不启用缓存
http {
include mime.types;
default_type application/octet-stream;
sendfile on;
keepalive_timeout 65;
upstream websrv {
server 172.16.100.11 weight=1;
server 172.16.100.12 weight=1;
server 127.0.0.1:8080 backup;
}
server {
listen 80;
server_name www.escapelife.com;
add_header X-Via $server_addr;
location / {
proxy_pass http://websrv;
index index.html index.htm;
if ($request_method ~* "PUT") {
proxy_pass http://172.16.100.12;
break;
}
}
error_page 500 502 503 504 /50x.html;
location = /50x.html {
root html;
}
}
server {
listen 8080;
server_name localhost;
root /nginx/htdocs;
index index.html;
}
}
测试效果:默认情况下,nginx
对定义了权重的upstream
服务器使用加权轮调的方法调度访问,因此,其多次访问应该由不同的服务器进行响应。如下所示。
# curl http://172.16.100.107/
RS2.escapelife.com
# curl http://172.16.100.107/
RS1.escapelife.com
根据上面的配置,如果172.16.100.11
和172.16.100.12
两个upstream
服务器均宕机时,将由本地监听在8080
端口的虚拟主机进行响应。
# curl http://172.16.100.107/
Sorry...
- 为 upstream 启用缓存
http {
include mime.types;
default_type application/octet-stream;
sendfile on;
keepalive_timeout 65;
proxy_cache_path /data/cache levels=1:2 keys_zone=html:10m max_size=512m;
upstream websrv {
server 172.16.100.11 weight=1;
server 172.16.100.12 weight=1;
server 127.0.0.1:8080 backup;
}
server {
listen 80;
server_name www.escapelife.com;
add_header X-Via $server_addr;
add_header X-Cache-Status $upstream_cache_status;
location / {
proxy_pass http://websrv;
proxy_cache first;
proxy_cache_valid 200 1d;
proxy_cache_valid 301 302 10m;
proxy_cache_valid any 1m;
index index.html index.htm;
if ($request_method ~* "PUT") {
proxy_pass http://172.16.100.12;
break;
}
}
error_page 500 502 503 504 /50x.html;
location = /50x.html {
root html;
}
}
server {
listen 8080;
server_name localhost;
root /nginx/htdocs;
index index.html;
}
}
- 第一次访问某可缓存资源时,在本地缓存中尚未有其对应的缓存对象,因此,其一定为未命中状态。而第二次请求时,则可以直接从本地缓存构建响应报文。
# curl -I http://www.escapelife.com/
HTTP/1.1 200 OK
Server: nginx/1.4.1
Date: Tue, 14 May 2013 10:53:07 GMT
Content-Type: text/html; charset=UTF-8
Content-Length: 15
Connection: keep-alive
Last-Modified: Tue, 30 Apr 2013 09:34:09 GMT
ETag: "186e9f-f-b4076640"
Accept-Ranges: bytes
X-Via: 172.16.100.107
X-Cache-Status: MISS
# curl -I http://www.escapelife.com/
HTTP/1.1 200 OK
Server: nginx/1.4.1
Date: Tue, 14 May 2013 10:53:09 GMT
Content-Type: text/html; charset=UTF-8
Content-Length: 15
Connection: keep-alive
Last-Modified: Tue, 30 Apr 2013 09:34:09 GMT
ETag: "186e9f-f-b4076640"
X-Via: 172.16.100.107
X-Cache-Status: HIT
Accept-Ranges: bytes
7. Nginx 服务限速配置
nginx
的限速功能通过limit_zone
、limit_conn
和limit_rate
指令进行配置。首先需要在http
上下文配置一个limit_zone
,然后在需要的地方使用limit_conn
和limit_rate
进行限速设置。下面是一个简单的例子。
- limit_zone
- 语法格式:
limit_req_zone $variable zone=name:size rate=rate;
- 实现针对每个
IP
定义一个存储session
状态的容器
- 语法格式:
http {
limit_zone first $binary_remote_addr 10m;
server {
location /downloads/ {
limit_conn first 1;
limit_rate 50k;
}
}
}
这个示例中定义了一个名叫first
的10m
大小的容器,这个名字会在后面的limit_conn
中使用。limit_conn first 1;
限制在first
中记录状态的每个IP
只能发起一个并发连接。limit_rate 50k;
对每个连接限速50k
。
注意,这里是对连接限速,而不是对IP
限速。如果一个IP
允许三个并发连接,那么这个 IP 就是限速为limit_rate×3
,在设置的时候要根据自己的需要做设置调整,要不然会达不到自己希望的目的。
限制连接数的配置如下所示。
limit_conn_zone $binary_remote_addr zone=perip:10m;
limit_conn_zone $server_name zone=perserver:10m;
server {
...
limit_conn perip 10;
limit_conn perserver 100;
}