Nginx 如何处理请求?

嗨,你好呀,我是猿java

Nginx(Engine X)是一个高性能的HTTP和反向代理服务器,它以其高并发、高性能和低资源消耗著称。这篇文章,我们将从原理、代码以及示例来深入分析 Nginx如何处理请求。

Nginx请求处理原理

Nginx请求处理的原理主要涉及以下 6个核心技术点:

  1. 事件驱动模型
  2. 异步非阻塞处理
  3. 进程模型
  4. 模块化设计
  5. 负载均衡和反向代理
  6. 配置文件解析

接下来我们将一一分析它们:

事件驱动模型

Nginx的事件驱动模型基于非阻塞 I/O 和事件循环。它使用多路复用技术(如 epoll、kqueue 等)来监控多个连接,并在事件发生时调用相应的处理器。

多路复用技术

多路复用技术是事件驱动模型的关键。Nginx 支持多种多路复用机制,包括:

  • epoll:Linux 平台上的高效多路复用机制,适用于大量并发连接。
  • kqueue:FreeBSD、OpenBSD、macOS 等平台的多路复用机制。
  • select 和 poll:较早期的多路复用机制,适用于较少的并发连接。

Nginx 会根据操作系统的不同自动选择最优的多路复用机制。

事件循环

在 Nginx 中,事件循环主要负责监控和处理网络事件。其基本流程如下:

  • 初始化:初始化事件模块,配置事件处理机制(如 epoll)。
  • 事件监听:监听客户端连接请求、数据可读可写等事件。
  • 事件检测:通过多路复用机制检测事件的发生。
  • 事件分发:将检测到的事件分发给对应的事件处理器。
  • 事件处理:调用回调函数来处理具体的事件,如读取请求、发送响应等。

事件处理

Nginx 的事件处理是通过一系列的回调函数来实现的,这些回调函数在不同的事件阶段被调用,包括:

  • 连接建立:处理新连接的建立。
  • 请求读取:从客户端读取请求数据。
  • 响应发送:向客户端发送响应数据。
  • 连接关闭:处理连接的关闭。

###Worker 进程

Nginx 使用多进程架构,其中每个 Worker 进程都是一个独立的事件驱动服务器。Master 进程负责管理 Worker 进程,而 Worker 进程则负责处理客户端请求。每个 Worker 进程都有自己的事件循环,能够独立处理并发连接。

异步非阻塞处理

异步非阻塞意味着 Nginx在处理一个请求时,可以进行 I/O操作而不被阻塞,当请求发起后,处理过程中的任何耗时操作(如磁盘I/O,网络I/O)都不会阻塞整个处理。Nginx通过将这些操作放在异步事件中等待完成,释放工作进程来处理其他可用事件。

进程模型

Nginx 采用了 Master-Worker 多进程架构,其中包含一个主进程(Master Process)和一个或多个工作进程(Worker Processes)。这种架构的设计可以确保责任分离,以便更好地管理系统资源、并发请求处理与故障恢复。

Master进程

职责

  • Master进程的主要职责是管理和控制工作进程。
  • 接收和处理来自外部(如管理员)的请求,例如配置重载、启动或关闭 Nginx。
  • 在启动时读取和解析配置文件,初始化各种全局变量和资源。

主要功能

  • 启动和终止 Worker 进程:Master 进程负责分批启动工作进程,并根据需要重启或终止工作进程。
  • 管理信号:监听和处理系统信号(如 SIGHUP 用于重载配置,SIGTERM 用于关闭服务器等)。
  • 平滑升级:做出配置更改或执行 Nginx 版本升级时,可以通过不间断地重新启动工作进程实现平滑升级。

Worker进程

职责

  • 处理客户端请求的所有工作。所有实际的网络事件处理都在工作进程中进行,包括接受连接、读取请求、处理请求、发送响应,等等。
  • 每个 Worker 进程都是相互独立的,同时可以处理独立的连接。

主要特性和功能

  • 无共享状态:每个 Worker 内存相互独立,这样可以避免在编程中可能出现的很多锁问题,提高并行处理效率。
  • 事件驱动和非阻塞 I/O:Worker 进程使用非阻塞 I/O 和事件驱动机制(如 epoll、kqueue 等)来处理请求,这使得在同一时间可以处理大量的并发请求。
  • 进程模型的竞争连接机制:所有 Worker 进程均平等地受到请求连接,具体哪个进程处理新连接由端口复用技术和操作系统决定。

进程之间的通信

Nginx 的 Master 和 Worker 进程之间使用 UNIX 信号进行简单而有效的通信,Master 进程对信号的响应可以带来整体行为的变化。例如:

SIGHUP:重新加载配置,此时 Master进程会完成以下几件事:

  • 检查语法错误后生成新配置。
  • 启动新的 Worker 进程。
  • 逐渐关闭旧的 Worker 进程,以便不会中断现有连接。

SIGTERM/SIGQUIT:优雅地关闭 Nginx 服务器。此时,Master 进程会通知 Worker 进程在所有当前请求完成后关闭。

SIGUSR1:重新打开日志文件,通常用于日志切换。

模块化设计

Nginx以模块化的方式设计,通过不同类型的模块(如HTTP模块、事件模块、Mail模块等)来完成不同功能。每种模块提供了处理请求的特定功能,组合在一起完成完整的HTTP服务。

负载均衡和反向代理

Nginx可以配置为反向代理,在处理请求时直接转发到后端服务器。它可以实现负载均衡,根据设定的策略(如轮询、最少连接)来分配请求。

配置文件解析

Nginx通过配置文件执行请求的处理定义。配置文件指定服务器块、位置块和其他配置指令,用以指示Nginx如何响应不同的HTTP请求。

代码分析

Nginx的代码是用C语言编写的,下面我们分析一些关键的代码片段来了解其工作原理。

启动流程

Nginx的启动从main函数开始,在src/core/nginx.c文件中:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
int main(int argc, char *const *argv) {
ngx_log_t *log;
ngx_cycle_t *cycle, init_cycle;
ngx_core_conf_t *ccf;
ngx_conf_t cf;

// 初始化日志、信号处理等
ngx_log_error(NGX_LOG_NOTICE, log, 0, "nginx version: " NGINX_VERSION);

// 获取命令行参数
process_args(argc, argv, &init_cycle);

// 初始化周期
cycle = ngx_init_cycle(&init_cycle);

// 循环处理到来的请求
ngx_process_events_and_timers(cycle);

return 0;
}

ngx_init_cycle是初始化Nginx周期的函数,其中包括配置文件的加载和解析。

事件循环

核心的事件循环位于ngx_process_events_and_timers函数中:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
void ngx_process_events_and_timers(ngx_cycle_t *cycle) {
ngx_msec_t timer, delta;
ngx_uint_t i;

for (;;) {
// 获取即将触发的事件和时间
timer = ngx_event_find_timer();

if (timer == NGX_TIMER_INFINITE) {
timer = (ngx_msec_t) NGX_TIMER_INFINITE_VALUE;
}

// 等待事件到来
(void) ngx_process_events(cycle, timer, 0);

// 调用定时器事件
ngx_event_expire_timers();

// 处理延迟文件事件
ngx_handle_delayed_events(cycle);
}
}

在这个循环中,Nginx持续地等待事件的发生,然后根据事件的类型执行相应的操作。

请求处理

实际的HTTP请求处理则是在ngx_http_process_request中完成:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
void ngx_http_process_request(ngx_http_request_t *r) {
ngx_connection_t *c;
ngx_http_core_main_conf_t *cmcf;

c = r->connection;

// 处理的阶段分为不同的handler
cmcf = ngx_http_get_module_main_conf(r, ngx_http_core_module);

// Match the location
ngx_http_core_find_config_phase(r);

// Perform access checks
if (ngx_http_process_request_uri(r) != NGX_OK) {
return;
}

// Execute input body filters
if (ngx_http_read_client_request_body(r, ngx_http_request_body_handler) >= NGX_HTTP_SPECIAL_RESPONSE) {
return;
}

// Call content handler
ngx_http_core_content_phase(r);
}

在这个函数里,Nginx逐一执行请求生命周期中的各个阶段,包括URI解析,权限检查,读取请求体,以及最终的内容处理。

示例配置

为了更好地理解 Nginx如何处理请求,在这里,我们通过一个简单的静态网页服务器的配置例子来说明:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
worker_processes  1;

events {
worker_connections 1024;
}

http {
server {
listen 80;
server_name localhost;

location / {
root /var/www/html;
index index.html index.htm;
}
}
}

配置分析:

  • worker_processes 1;:指定Nginx使用一个worker进程。
  • worker_connections 1024;:每个worker进程最多支持1024个并发连接。
  • http {}:开始一个HTTP配置上下文。
  • server {}:定义一个虚拟服务器。
  • listen 80;:服务器监听80端口。
  • server_name localhost;:指定服务器名。
  • location / {}:定义根目录的请求处理位置。
  • root /var/www/html;:将所有对根目录的请求映射到文件系统的/var/www/html目录。
  • index index.html index.htm;:指定默认的首页文件。

总结

Nginx的设计和实现牢牢把握住了高性能和高并发的目标,通过事件驱动模型、异步处理、多进程架构以及丰富的模块系统,Nginx不仅可以高效地处理HTTP请求,还可以通过模块化的配置系统进行极为灵活的部署和定制。通过深入Nginx的代码和运行原理,我们可以更好地理解和优化我们的Nginx服务器配置。

交流学习

最后,把猿哥的座右铭送给你:投资自己才是最大的财富。 如果你觉得文章有帮助,请帮忙转发给更多的好友,或关注公众号:猿java,持续输出硬核文章。

drawing