Nginx

介绍

Nginx是一款轻量级的Web服务器、反向代理服务器,由于它的内存占用少,启动极快,高并发能力强,在互联网项目中广泛应用。采用事件驱动的异步非阻塞处理方式框架,这让其具有极好的 IO 性能,时常用于服务端的反向代理负载均衡

上图基本上说明了当下流行的技术架构,其中Nginx有点入口网关的味道。

正向代理:

反向代理:

由于防火墙的原因,我们并不能直接访问谷歌,那么我们可以借助VPN来实现,这就是一个简单的正向代理的例子。这里你能够发现,正向代理“代理”的是客户端,而且客户端是知道目标的,而目标是不知道客户端是通过VPN访问的。

当我们在外网访问百度的时候,其实会进行一个转发,代理到内网去,这就是所谓的反向代理即反向代理“代理”的是服务器端,而且这一个过程对于客户端而言是透明的。

  1. 保障应用服务器的安全(增加一层代理,可以屏蔽危险攻击,更方便的控制权限)
  2. 实现负载均衡(稍等~下面会讲)
  3. 实现跨域(号称是最简单的跨域方式)

Nginx的Master-Worker模式

启动Nginx后,其实就是在80端口启动了Socket服务进行监听,如图所示,Nginx涉及Master进程和Worker进程。

Master进程的作用是?

读取并验证配置文件nginx.conf;管理worker进程;

Worker进程的作用是?

每一个Worker进程都维护一个线程(避免线程切换),处理连接和请求;注意Worker进程的个数由配置文件决定,一般和CPU个数相关(有利于进程切换),配置几个就有几个Worker进程。

配置

启动 Nginx:

1
sudo nginx` 或 `sudo brew services start nginx

停止 Nginx:

1
sudo nginx -s stop` 或 `sudo brew services stop nginx

热重启 Nginx:

1
sudo nginx -s reload

强制停止 Nginx:

1
sudo pkill -9 nginx

/usr/local/etc/nginx/nginx.conf (nginx配置文件路径)

/usr/local/var/www (nginx服务器默认的根目录)

/usr/local/Cellar/nginx/1.17.9 (nginx的安装路径)

/usr/local/var/log/nginx/error.log (nginx默认的日志路径)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
# 首尾配置暂时忽略
server {
# 当nginx接到请求后,会匹配其配置中的service模块
# 匹配方法就是将请求携带的host和port去跟配置中的server_name和listen相匹配
listen 8080;
server_name localhost; # 定义当前虚拟主机(站点)匹配请求的主机名

location / {
root html; # Nginx默认值
# 设定Nginx服务器返回的文档名
index index.html index.htm; # 先找根目录下的index.html,如果没有再找index.htm
}
}
# 首尾配置暂时忽略

server{ } 其实是包含在 http{ } 内部的。每一个 server{ } 是一个虚拟主机(站点)。

上面代码块的意思是:当一个请求叫做localhost:8080请求nginx服务器时,该请求就会被匹配进该代码块的 server{ } 中执行。

当然 nginx 的配置非常多,用的时候可以根据文档进行配置。

应用

动静分离:

Nginx 服务器将接收到的请求分为动态请求静态请求

静态请求直接从 nginx 服务器所设定的根目录路径去取对应的资源,动态请求转发给真实的后台(前面所说的应用服务器,如图中的Tomcat)去处理。

这样做不仅能给应用服务器减轻压力,将后台api接口服务化,还能将前后端代码分开并行开发和部署。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
server {  
listen 8080;
server_name localhost;

location / {
root html; # Nginx默认值
index index.html index.htm;
}

# 静态化配置,所有静态请求都转发给 nginx 处理,存放目录为 my-project
location ~ .*\.(html|htm|gif|jpg|jpeg|bmp|png|ico|js|css)$ {
root /usr/local/var/www/my-project; # 静态请求所代理到的根目录
}

# 动态请求匹配到path为'node'的就转发到8002端口处理
location /node/ {
proxy_pass http://localhost:8002; # 充当服务代理
}
}

反向代理

1
2
3
4
5
6
7
8
9
10
11
12
server {  
listen 8080;
server_name localhost;

location / {
root html; # Nginx默认值
index index.html index.htm;
}

proxy_pass http://localhost:8000; # 反向代理配置,请求会被转发到8000端口
}

反向代理的表现很简单。那上面的代码块来说,其实就是向nginx请求localhost:8080跟请求 http://localhost:8000 是一样的效果。(跟代购的原理一样)

这是一个反向代理最简单的模型,只是为了说明反向代理的配置。但是现实中反向代理多数是用在负载均衡中。

nginx 就是充当图中的 proxy。左边的3个 client 在请求时向 nginx 获取内容,是感受不到3台 server 存在的。

反向代理应用十分广泛,CDN 服务就是反向代理经典的应用场景之一。除此之外,反向代理也是实现负载均衡的基础,很多大公司的架构都应用到了反向代理。

负载均衡

随着业务的不断增长和用户的不断增多,一台服务已经满足不了系统要求了。这个时候就出现了服务器 集群。

在服务器集群中,Nginx 可以将接收到的客户端请求“均匀地”(严格讲并不一定均匀,可以通过设置权重)分配到这个集群中所有的服务器上。这个就叫做负载均衡

Nginx还带有健康检查(服务器心跳检查)功能,会定期轮询向集群里的所有服务器发送健康检查请求,来检查集群中是否有服务器处于异常状态。

一旦发现某台服务器异常,那么在这以后代理进来的客户端请求都不会被发送到该服务器上(直健康检查发现该服务器已恢复正常),从而保证客户端访问的稳定性。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
# 负载均衡:设置domain
upstream domain {
server localhost:8000;
server localhost:8001;
}
server {
listen 8080;
server_name localhost;

location / {
# root html; # Nginx默认值
# index index.html index.htm;

proxy_pass http://domain; # 负载均衡配置,请求会被平均分配到8000和8001端口
proxy_set_header Host $host:$server_port;
}
}

8000和8001是我本地用 Node.js 起的两个服务,负载均衡成功后可以看到访问 localhost:8080 有时会访问到8000端口的页面,有时会访问到8001端口的页面。

受集群单台服务器内存等资源的限制,负载均衡集群的服务器也不能无限增多。但因其良好的容错机制,负载均衡成为了实现高可用架构中必不可少的一环。

代理其实就是一个中介,A和B本来可以直连,中间插入一个C,C就是中介。刚开始的时候,代理多数是帮助内网client访问外网server用的(比如HTTP代理),从内到外 . 后来出现了反向代理,”反向”这个词在这儿的意思其实是指方向相反,即代理将来自外网client的请求forward到内网server,从外到内

面试

1.Nginx 实现负载均衡有哪几种方式?

轮询(Round Robin):默认策略,顺序转发请求;

加权轮询(Weighted Round Robin):给服务器设置权重,权重大就多分配请求;

IP Hash:根据客户端 IP 做哈希,把同一个 IP 的请求固定分配给同一台服务器;

最少连接数(Least Connections):优先转发给当前连接数最少的服务器(需要开启 least_conn 模块);

健康检查(可选):检查服务器是否存活,不可用的服务器不会被请求到。

2.你项目中用的是什么负载均衡策略?为什么选这个?

我使用的是默认的轮询(round-robin)策略,因为我们集群内的服务节点配置基本一致,响应时间也相差不大,这样的简单策略就足够满足负载均衡需求。如果后期出现性能差异,再考虑使用加权轮询或 IP Hash 策略来优化。

3.负载均衡后 session 如何保持?(Sticky Session)

默认情况下,用户的请求会轮流打到不同的服务器,这样可能会导致 session 丢失。解决方案有:

  • 使用 IP Hash 策略:让同一 IP 的请求打到同一台服务器;
  • 使用 cookie 记录和识别客户端,前端转发到固定节点
  • 服务端使用 session 共享机制,如 Redis 分布式 session;
  • 客户端使用 token(如 JWT),实现无状态认证

4.Nginx 如何判断服务器挂了?

Nginx 的 openresty 或第三方模块(如 nginx_upstream_check_module)可以启用主动健康检查机制,通过定期向后端发送请求,判断其状态。

如果是默认配置,Nginx 并不会主动健康检查,只有当某个请求失败时,才会暂时标记服务器为不可用(被动方式)。

5.upstream 模块中配置多个服务,如果其中一个挂了怎么办?

如果使用了健康检查模块,Nginx 会主动检测并自动将该节点剔除;如果没开启,用户请求到挂掉的服务会失败一部分。

可以手动配置 max_failsfail_timeout

1
2
3
4
upstream backend {
server localhost:8000 max_fails=3 fail_timeout=30s;
server localhost:8001;
}

表示在 30 秒内失败超过 3 次就会暂时踢掉该节点。