一、Web服务基础介绍

1.1、互联网发展历程

1993年3月2日,中国科学院高能物理研究所租用AT&T公司的国际卫星信道建立的接入美国SLAC国家实验室的64K专线正式开通,成为我国连入Internet的第一根专线。

1995年马云开始创业并推出了一个web网站中国黄页。

1999年创建阿里巴巴www.alibabagroup.com。

2003年5月10日创立淘宝网。

2004年12月,马云创立第三方网上支付平台支付宝(蚂蚁金服旗下,共有蚂蚁金服支付宝、余额宝、招财宝、蚂蚁聚宝、网商银行、蚂蚁花呗、芝麻信用等子业务板块)。

2009年开始举办双十一购物狂欢节,以下是历年交易成交额:

2009年双十一:5000万元

2010年双十一:9.36亿元

2011年双十一:33.6亿元

2012年双十一:191亿元

2013年双十一:350亿元

2014年双十一:571亿元

2015年双十一:912.17亿元

2016年双十一:1207亿元

2017年双十一:1682.69亿元

2018年双十一:2135亿元

2019年双十一:2684亿元

2020年双十一:4982亿元

2021年双十一:5403亿元

2022年双十一:5571亿元

2023年双十一:4013亿元

2024年双十一:5314亿元

2012年1月11日淘宝商城正式更名为“天猫”。

2014年9月19日里巴巴集团于纽约证券交易所正式挂牌上市。

1.2、Web服务介绍

1.2.1、Apache经典的Web服务端

Apache起初由美国的伊利诺伊大学香槟分校的国家超级计算机应用中心开发。

目前经历了两大版本分别是1.X和2.X。

其可以通过编译安装实现特定的功能。

Apache worker 模型

一种多进程和多线程混合的模型。

有一个控制进程,启动多个子进程。

每个子进程里面包含固定的线程。

使用线程程来处理请求。

当线程不够使用的时候会再启动一个新的子进程,然后在进程里面再启动线程处理请求。

由于其使用了线程处理请求,因此可以承受更高的并发。

优点:相比prefork 占用的内存较少,可以同时处理更多的请求。

缺点:使用keepalive的长连接方式,某个线程会一直被占据,即使没有传输数据,也需要一直等待到超 时才会被释放。如果过多的线程,被这样占据,也会导致在高并发场景下的无服务线程可用(该问题在 prefork模式下,同样会发生)。

Apache event模型

Apache中最新的模式,2012年发布的apache 2.4.X系列正式支持event 模型,属于事件驱动模型(epoll)。

每个进程响应多个请求,在现在版本里的已经是稳定可用的模式。

它和worker模式很像,最大的区别在于,它解决了keepalive场景下长期被占用的线程的资源浪费问题 (某些线程因为被keepalive,空挂在哪里等待,中间几乎没有请求过来,甚至等到超时)。

event MPM中,会有一个专门的线程来管理这些keepalive类型的线程。

当有真实请求过来的时候,将请求传递给服务线程,执行完毕后,又允许它释放。这样增强了高并发场 景下的请求处理能力。

优点:单线程响应多请求,占据更少的内存,高并发下表现更优秀,会有一个专门的线程来管理keepalive类型的线程,当有真实请求过来的时候,将请求传递给服务线程,执行完毕后,又允许它释放。

缺点:没有线程安全控制。

1.2.2、Nginx 高性能的Web服务端

Nginx官网地址 www.nginx.org

Nginx历经十几年的迭代更新(https://nginx.org/en/CHANGES), 目前功能已经非常完善且运行稳 定,另外Nginx的版本分为开发版、稳定版和过期版,nginx以功能丰富著称,它即可以作为http服务器,也可以作为反向代理服务器或者邮件服务器能够快速的响应静态网页的请求。

支持FastCGI/SSL/Virtual Host/URL Rwrite /Gzip / HTTP Basic Auth/http或者TCP的负载均衡(1.9版本以 上且开启stream模块)等功能,并且支持第三方的功能扩展。

天猫 淘宝 京东 小米 163 新浪等一线互联网公司都在用Nginx或者进行二次开发。

基于Nginx的工作场景:

服务端 I/O 流程

I/O在计算机中指Input/Output, IOPS (Input/Output Per Second)即每秒的输入输出量(或读写次数), 是衡量磁盘性能的主要指标之一。IOPS是指单位时间内系统能处理的I/O请求数量,一般以每秒处理的 I/O请求数量为单位,I/O请求通常为读或写数据操作请求。

一次完整的I/O是用户空间的进程数据与内核空间的内核数据的报文的完整交换,但是由于内核空间与用 户空间是严格隔离的,所以其数据交换过程中不能由用户空间的进程直接调用内核空间的内存数据,而 是需要经历一次从内核空间中的内存数据copy到用户空间的进程内存当中,所以简单说I/O就是把数据从 内核空间中的内存数据复制到用户空间中进程的内存当中。

服务器的I/O:

        磁盘I/O

        网络I/O : 一切皆文件,本质为对socket文件的读写。

磁盘 I/O:

磁盘I/O是进程向内核发起系统调用,请求磁盘上的某个资源比如是html 文件或者图片,然后内核通过相 应的驱动程序将目标文件加载到内核的内存空间,加载完成之后把数据从内核内存再复制给进程内存, 如果是比较大的数据也需要等待时间。

机械磁盘的寻道时间、旋转延迟和数据传输时间:

寻道时间:是指磁头移动到正确的磁道上所花费的时间,寻道时间越短则I/O处理就越快,目前磁盘的寻道时 间一般在3-15毫秒左右。

旋转延迟:是指将磁盘片旋转到数据所在的扇区到磁头下面所花费的时间,旋转延迟取决于磁盘的转速,通常使用磁盘旋转一周所需要时间的1/2之一表示,比如7200转的磁盘平均训传延迟大约为 60*1000/7200/2=4.17毫秒,公式的意思为 (每分钟60秒*1000毫秒每秒/7200转每分/2),如果是 15000转的则为60*1000/15000/2=2毫秒。

数据传输时间:指的是读取到数据后传输数据的时间,主要取决于传输速率,这个值等于数据大小除以传输速 率,目前的磁盘接口每秒的传输速度可以达到600MB,因此可以忽略不计。

常见的机械磁盘平均寻道时间值:

7200转/分的磁盘平均物理寻道时间:9毫秒

10000转/分的磁盘平均物理寻道时间:6毫秒

15000转/分的磁盘平均物理寻道时间:4毫秒

常见磁盘的平均延迟时间:

7200转的机械盘平均延迟:60*1000/7200/2 = 4.17ms

10000转的机械盘平均延迟:60*1000/10000/2 = 3ms

15000转的机械盘平均延迟:60*1000/15000/2 = 2ms

每秒最大IOPS的计算方法:

7200转的磁盘IOPS计算方式:1000毫秒/(9毫秒的寻道时间+4.17毫秒的平均旋转延迟时 间)=1000/13.13=75.9 IOPS

10000转的磁盘的IOPS计算方式:1000毫秒/(6毫秒的寻道时间+3毫秒的平均旋转延迟时 间)=1000/9=111IOPS

15000转的磁盘的IOPS计算方式:15000毫秒/(4毫秒的寻道时间+2毫秒的平均旋转延迟时 间)=1000/6=166.6 IOPS

网络 I/O:

网络通信就是网络协议栈到用户空间进程的IO就是网络IO

网络I/O 处理过程

        获取请求数据,客户端与服务器建立连接发出请求,服务器接受请求(1-3)。

        构建响应,当服务器接收完请求,并在用户空间处理客户端的请求,直到构建响应完成(4)          返回数据,服务器将已构建好的响应再通过内核空间的网络 I/O 发还给客户端(5-7)。

不论磁盘和网络I/O

每次I/O,都要经由两个阶段:

        第一步:将数据从文件先加载至内核内存空间(缓冲区),等待数据准备完成,时间较长。

        第二步:将数据从内核缓冲区复制到用户空间的进程的内存中,时间较短。

1.3、 I/O 模型

1.3.1、 I/O 模型相关概念

同步/异步:关注的是消息通信机制,即调用者在等待一件事情的处理结果时,被调用者是否提供完成状 态的通知。

同步:synchronous,被调用者并不提供事件的处理结果相关的通知消息,需要调用者主动询问事 情是否处理完成。

异步:asynchronous,被调用者通过状态、通知或回调机制主动通知调用者被调用者的运行状态。

阻塞/非阻塞:关注调用者在等待结果返回之前所处的状态。

阻塞:blocking,指IO操作需要彻底完成后才返回到用户空间,调用结果返回之前,调用者被挂 起,干不了别的事情。

非阻塞:nonblocking,指IO操作被调用后立即返回给用户一个状态值,而无需等到IO操作彻底完 成,在最终的调用结果返回之前,调用者不会被挂起,可以去做别的事情。

1.3.2、 网络 I/O 模型

阻塞型、非阻塞型、复用型、信号驱动型、异步

阻塞型 I/O 模型(blocking IO)

阻塞IO模型是最简单的I/O模型,用户线程在内核进行IO操作时被阻塞。

用户线程通过系统调用read发起I/O读操作,由用户空间转到内核空间。内核等到数据包到达后,然 后将接收的数据拷贝到用户空间,完成read操作。

用户需要等待read将数据读取到buffer后,才继续处理接收的数据。整个I/O请求的过程中,用户线 程是被阻塞的,这导致用户在发起IO请求时,不能做任何事情,对CPU的资源利用率不够。

优点:程序简单,在阻塞等待数据期间进程/线程挂起,基本不会占用 CPU 资源。

缺点:每个连接需要独立的进程/线程单独处理,当并发请求量大时为了维护程序,内存、线程切换开销 较apache 的preforck使用的是这种模式。

同步阻塞:程序向内核发送I/O请求后一直等待内核响应,如果内核处理请求的IO操作不能立即返回,则进 程将一直等待并不再接受新的请求,并由进程轮询查看I/O是否完成,完成后进程将I/O结果返回给 Client,在IO没有返回期间进程不能接受其他客户的请求,而且是有进程自己去查看I/O是否完成,这种 方式简单,但是比较慢,用的比较少。

非阻塞型 I/O 模型 (nonblocking IO)

用户线程发起IO请求时立即返回。但并未读取到任何数据,用户线程需要不断地发起IO请求,直到数据 到达后,才真正读取到数据,继续执行。即 “轮询”机制存在两个问题:如果有大量文件描述符都要等, 那么就得一个一个的read。这会带来大量的Context Switch(read是系统调用,每调用一次就得在用户 态和核心态切换一次)。轮询的时间不好把握。这里是要猜多久之后数据才能到。等待时间设的太长, 程序响应延迟就过大;设的太短,就会造成过于频繁的重试,干耗CPU而已,是比较浪费CPU的方式,一 般很少直接使用这种模型,而是在其他IO模型中使用非阻塞IO这一特性。

非阻塞:程序向内核发送请I/O求后一直等待内核响应,如果内核处理请求的IO操作不能立即返回IO结果,进程将不再等待,而且继续处理其他请求,但是仍然需要进程隔一段时间就要查看内核I/O是否完 成。

查看上图可知,在设置连接为非阻塞时,当应用进程系统调用 recvfrom 没有数据返回时,内核会立即返回一个 EWOULDBLOCK 错误,而不会一直阻塞到数据准备好。如上图在第四次调用时有一个数据报准备好了,所以这时数据会被复制到应用进程缓冲区 ,于是 recvfrom 成功返回数据。

当一个应用进程这样循环调用 recvfrom 时,称之为轮询 polling 。这么做往往会耗费大量CPU时间,实 际使用很少。

多路复用 I/O 型(I/O multiplexing)

上面的模型中,每一个文件描述符对应的IO是由一个线程监控和处理。

多路复用IO指一个线程可以同时(实际是交替实现,即并发完成)监控和处理多个文件描述符对应各自 的IO,即复用同一个线程。

一个线程之所以能实现同时处理多个IO,是因为这个线程调用了内核中的SELECT,POLL或EPOLL等系统调 用,从而实现多路复用IO。

I/O multiplexing 主要包括:select,poll,epoll三种系统调用,select/poll/epoll的好处就在于单个 process就可以同时处理多个网络连接的IO。

它的基本原理就是select/poll/epoll这个function会不断的轮询所负责的所有socket,当某个socket有数 据到达了,就通知用户进程。

当用户进程调用了select,那么整个进程会被block,而同时,kernel会“监视”所有select负责的socket, 当任何一个socket中的数据准备好了,select就会返回。这个时候用户进程再调用read操作,将数据从 kernel拷贝到用户进程。

Apache prefork是此模式的select,worker是poll模式。

IO多路复用(IO Multiplexing) :是一种机制,程序注册一组socket文件描述符给操作系统,表示“我要 监视这些fd是否有IO事件发生,有了就告诉程序处理”IO多路复用一般和NIO一起使用的。NIO和IO多路 复用是相对独立的。NIO仅仅是指IO API总是能立刻返回,不会被Blocking;而IO多路复用仅仅是操作系统 提供的一种便利的通知机制。操作系统并不会强制这俩必须得一起用,可以只用IO多路复用 + BIO,这时 还是当前线程被卡住。IO多路复用和NIO是要配合一起使用才有。

实际意义 IO多路复用是指内核一旦发现进程指定的一个或者多个IO条件准备读取,就通知该进程多个连接共用一 个等待机制,本模型会阻塞进程,但是进程是阻塞在select或者poll这两个系统调用上,而不是阻塞在真 正的IO操作上用户首先将需要进行IO操作添加到select中,同时等待select系统调用返回。当数据到达 时,IO被激活,select函数返回。用户线程正式发起read请求,读取数据并继续执行从流程上来看,使用 select函数进行IO请求和同步阻塞模型没有太大的区别,甚至还多了添加监视IO,以及调用select函数的 额外操作,效率更差。并且阻塞了两次,但是第一次阻塞在select上时,select可以监控多个IO上是否已 有IO操作准备就绪,即可达到在同一个线程内同时处理多个IO请求的目的。而不像阻塞IO那种,一次只 能监控一个IO虽然上述方式允许单线程内处理多个IO请求,但是每个IO请求的过程还是阻塞的(在select 函数上阻塞),平均时间甚至比同步阻塞IO模型还要长。如果用户线程只是注册自己需要的IO请求,然 后去做自己的事情,等到数据到来时再进行处理,则可以提高CPU的利用率IO多路复用是最常使用的IO 模型,但是其异步程度还不够“彻底”,因它使用了会阻塞线程的select系统调用。因此IO多路复用只能称 为异步阻塞IO模型,而非真正的异步IO。

优点:可以基于一个阻塞对象,同时在多个描述符上等待就绪,而不是使用多个线程(每个文件描述 符一个线程),这样可以大大节省系统资源。

缺点:当连接数较少时效率相比多线程+阻塞 I/O 模型效率较低,可能延迟更大,因为单个连接处理 需要 2 次系统调用,占用时间会有增加。

IO多路复用适用如下场合:

当客户端处理多个描述符时(一般是交互式输入和网络套接口),必须使用I/O复用。

当一个客户端同时处理多个套接字时,此情况可能的但很少出现。

当一个服务器既要处理监听套接字,又要处理已连接套接字,一般也要用到I/O复用。

当一个服务器即要处理TCP,又要处理UDP,一般要使用I/O复用。

当一个服务器要处理多个服务或多个协议,一般要使用I/O复用。

信号驱动式 I/O 模型 (signal-driven IO)

信号驱动I/O的意思就是进程现在不用傻等着,也不用去轮询。而是让内核在数据就绪时,发送信号通知进程。

调用的步骤是,通过系统调用 sigaction ,并注册一个信号处理的回调函数,该调用会立即返回,然后主 程序可以继续向下执行,当有I/O操作准备就绪,即内核数据就绪时,内核会为该进程产生一个 SIGIO信 号,并回调注册的信号回调函数,这样就可以在信号回调函数中系统调用 recvfrom 获取数据,将用户进 程所需要的数据从内核空间拷贝到用户空间。

此模型的优势在于等待数据报到达期间进程不被阻塞。用户主程序可以继续执行,只要等待来自信号处理函数的通知。

在信号驱动式 I/O 模型中,应用程序使用套接口进行信号驱动 I/O,并安装一个信号处理函数,进程继续运行并不阻塞。

在信号驱动式 I/O 模型中,应用程序使用套接口进行信号驱动 I/O,并安装一个信号处理函数,进程继续运行并不阻塞。

当数据准备好时,进程会收到一个 SIGIO 信号,可以在信号处理函数中调用 I/O 操作函数处理数据。优 点:线程并没有在等待数据时被阻塞,内核直接返回调用接收信号,不影响进程继续处理其他请求因此可以提高资源的利用率。

缺点:信号 I/O 在大量 IO 操作时可能会因为信号队列溢出导致没法通知。

异步阻塞:程序进程向内核发送IO调用后,不用等待内核响应,可以继续接受其他请求,内核收到进程请求后进行的IO如果不能立即返回,就由内核等待结果,直到IO完成后内核再通知进程。

异步 I/O 模型 (asynchronous IO)

异步I/O 与 信号驱动I/O最大区别在于,信号驱动是内核通知用户进程何时开始一个I/O操作,而异步I/O 是由内核通知用户进程I/O操作何时完成,两者有本质区别,相当于不用去饭店场吃饭,直接点个外卖,把 等待上菜的时间也给省了。

相对于同步I/O,异步I/O不是顺序执行。用户进程进行aio_read系统调用之后,无论内核数据是否准备好,都会直接返回给用户进程,然后用户态进程可以去做别的事情。等到socket数据准备好了,内核直接复制数据给进程,然后从内核向进程发送通知。IO两个阶段,进程都是非阻塞的。

信号驱动IO当内核通知触发信号处理程序时,信号处理程序还需要阻塞在从内核空间缓冲区拷贝数据到 用户空间缓冲区这个阶段,而异步IO直接是在第二个阶段完成后,内核直接通知用户线程可以进行后续操作。

优点:异步 I/O 能够充分利用 DMA 特性,让 I/O 操作与计算重叠。

缺点:要实现真正的异步 I/O,操作系统需要做大量的工作。目前 Windows 下通过 IOCP 实现了真正的 异步 I/O,在 Linux 系统下,Linux 2.6才引入,目前 AIO 并不完善,因此在 Linux 下实现高并发网络编 程时以 IO 复用模型模式+多线程任务的架构基本可以满足需求。

Linux提供了AIO库函数实现异步,但是用的很少。目前有很多开源的异步IO库,例如libevent、libev、 libuv。

异步非阻塞:程序进程向内核发送IO调用后,不用等待内核响应,可以继续接受其他请求,内核调用的 IO如果不能立即返回,内核会继续处理其他事物,直到IO完成后将结果通知给内核,内核在将IO完成的 结果返回给进程,期间进程可以接受新的请求,内核也可以处理新的事物,因此相互不影响,可以实现 较大的同时并实现较高的IO复用,因此异步非阻塞使用最多的一种通信方式。

1.3.3、五种IO对比

这五种 I/O 模型中,越往后,阻塞越少,理论上效率也是最优前四种属于同步 I/O,因为其中真正的 I/O 操作(recvfrom)将阻塞进程/线程,只有异步 I/O 模型才与 POSIX 定义的异步 I/O 相匹配。

1.3.4、 I/O 的具体实现方式

I/O常见实现

Nginx支持在多种不同的操作系统实现不同的事件驱动模型,但是其在不同的操作系统甚至是不同的系统 版本上面的实现方式不尽相同,主要有以下实现方式:

select: select库是在linux和windows平台都基本支持的 事件驱动模型库,并且在接口的定义也基本相同,只是 部分参数的含义略有差异,最大并发限制1024,是最早期的事件驱动模型。

poll: 在Linux 的基本驱动模型,windows不支持此驱动模型,是select的升级版,取消了最大的并发限制,在 编译nginx的时候可以使用--with-poll_module和--without-poll_module这两个指定是否编译select库。

epoll: epoll是库是Nginx服务器支持的最高性能的事件驱动库之一,是公认的非常优秀的事件驱动模型,它和 select和poll有很大的区别,epoll是poll的升级版,但是与poll有很大的区别.epoll的处理方式是创建一个 待处理的事件列表,然后把这个列表发给内核,返回的时候在去轮询检查这个表,以判断事件是否发 生,epoll支持一个进程打开的最大事件描述符的上限是系统可以打开的文件的最大数,同时epoll库的 I/O效率不随描述符数目增加而线性下降,因为它只会对内核上报的“活跃”的描述符进行操作。

kqueue: 用于支持BSD系列平台的高校事件驱动模型,主要用在FreeBSD 4.1及以上版本、OpenBSD 2.0级以上版 本NetBSD级以上版本及Mac OS X 平台上,该模型也是poll库的变种,因此和epoll没有本质上的区别, 都是通过避免轮询操作提供效率。

Iocp: Windows系统上的实现方式,对应第5种(异步I/O)模型。

rtsig: 不是一个常用事件驱动,最大队列1024,不是很常用。

/dev/poll: 用于支持unix衍生平台的高效事件驱动模型,主要在Solaris 平台、HP/UX,该模型是sun公司在开发 Solaris系列平台的时候提出的用于完成事件驱动机制的方案,它使用了虚拟的/dev/poll设备,开发人员 将要见识的文件描述符加入这个设备,然后通过ioctl()调用来获取事件通知,因此运行在以上系列平台的 时候请使用/dev/poll事件驱动机制。

eventport: 该方案也是sun公司在开发Solaris的时候提出的事件驱动库,只是Solaris 10以上的版本,该驱动库看防 止内核崩溃等情况的发生。

Select:

POSIX所规定,目前几乎在所有的平台上支持,其良好跨平台支持也是它的一个优点,本质上是通过设置 或者检查存放fd标志位的数据结构来进行下一步处理。

缺点 单个进程能够监视的文件描述符的数量存在最大限制,在Linux上一般为1024,可以通过修改宏定 FD_SETSIZE,再重新编译内核实现,但是这样也会造成效率的降低单个进程可监视的fd数量被限制,默 认是1024,修改此值需要重新编译内核对socket是线性扫描,即采用轮询的方法,效率较低select 采取 了内存拷贝方法来实现内核将 FD 消息通知给用户空间,这样一个用来存放大量fd的数据结构,这样会使 得用户空间和内核空间在传递该结构时复制开销大。

poll:

本质上和select没有区别,它将用户传入的数组拷贝到内核空间,然后查询每个fd对应的设备状态其没有 最大连接数的限制,原因是它是基于链表来存储的大量的fd的数组被整体复制于用户态和内核地址空间 之间,而不管这样的复制是不是有意义poll特点是“水平触发”,如果报告了fd后,没有被处理,那么下次 poll时会再次报告该fd select是边缘触发即只通知一次。

epoll:

在Linux 2.6内核中提出的select和poll的增强版本支持水平触发LT和边缘触发ET,最大的特点在于边缘触 发,它只告诉进程哪些fd刚刚变为就需态,并且只会通知一次使用“事件”的就绪通知方式,通过epoll_ctl 注册fd,一旦该fd就绪,内核就会采用类似callback的回调机制来激活该fd,epoll_wait便可以收到通知。

优点:

没有最大并发连接的限制:能打开的FD的上限远大于1024(1G的内存能监听约10万个端口),具体查看 /proc/sys/fs/file-max,此值和系统内存大小相关。

效率提升:非轮询的方式,不会随着FD数目的增加而效率下降;只有活跃可用的FD才会调用callback函 数,即epoll最大的优点就在于它只管理“活跃”的连接,而跟连接总数无关 内存拷贝,利用mmap(Memory Mapping)加速与内核空间的消息传递;即epoll使用mmap减少复制开销。

总结:

epoll只是一组API,比起select这种扫描全部的文件描述符,epoll只读取就绪的文件描述符,再加入 基于事件的就绪通知机制,所以性能比较好。

基于epoll的事件多路复用减少了进程间切换的次数,使得操作系统少做了相对于用户任务来说的无用 功。

epoll比select等多路复用方式来说,减少了遍历循环及内存拷贝的工作量,因为活跃连接只占总并发 连接的很小一部分。

实例:最大并发连接数和内存有直接关系#内存1G
[root@centos8 ~]#free -htotal used free shared buff/cache available
Mem: 952Mi 168Mi 605Mi 12Mi 178Mi 629Mi
Swap: 2.0Gi 0B 2.0Gi[root@centos8 ~]#cat /proc/sys/fs/file-max
92953#内存2G
[root@centos8 ~]#free -h
total used free shared buff/cache available
Mem: 1.9Gi 258Mi 1.3Gi 12Mi 341Mi 1.6Gi
Swap: 2.0Gi 0B 2.0Gi[root@centos8 ~]#cat /proc/sys/fs/file-max
195920

1.4、零拷贝

1.4.1、零拷贝的诞生

传统的 Linux 系统的标准 I/O 接口(read、write)是基于数据拷贝的,也就是数据都是 copy_to_user 或者 copy_from_user,这样做的好处是,通过中间缓存的机制,减少磁盘 I/O 的操作,但是坏处也很明 显,大量数据的拷贝,用户态和内核态的频繁切换,会消耗大量的 CPU 资源,严重影响数据传输的性 能,统计表明,在Linux协议栈中,数据包在内核态和用户态之间的拷贝所用的时间甚至占到了数据包整 个处理流程时间的57.1%。

零拷贝就是上述问题的一个解决方案,通过尽量避免拷贝操作来缓解 CPU 的压力。零拷贝并没有真正做 到“0”拷贝,它更多是一种思想,很多的零拷贝技术都是基于这个思想去做的优化。

1.4.2、零拷页相关技术

MMAP ( Memory Mapping )

mmap()系统调用使得进程之间通过映射同一个普通文件实现共享内存。普通文件被映射到进程地址空间 后,进程可以向访问普通内存一样对文件进行访问。

mmap是一种内存映射文件的方法,即将一个文件或者其它对象映射到进程的地址空间,实现文件磁盘 地址和进程虚拟地址空间中一段虚拟地址的一一对映关系。

实现这样的映射关系后,进程就可以采用指针的方式读写操作这一段内存,而系统会自动回写脏页面到 对应的文件磁盘上,即完成了对文件的操作而不必再调用read,write等系统调用函数。相反,内核空间对 这段区域的修改也直接反映用户空间,从而可以实现不同进程间的文件共享。

内存映射减少数据在用户空间和内核空间之间的拷贝操作,适合大量数据传输。

上面左图为传统读写,右图为MMAP.两者相比mmap要比普通的read系统调用少了一次copy的过程。因为 read调用,进程是无法直接访问kernel space的,所以在read系统调用返回前,内核需要将数据从内核 复制到进程指定的buffer。但mmap之后,进程可以直接访问mmap的数据(page cache)。

SENDFILE

DMA 辅助的 SENDFILE

二、Nginx架构和安装

2.1、 Nginx概述

2.1.1、 Nginx介绍

Nginx:engine X ,2002年开发,分为社区版和商业版(nginx plus )。

2019年3月11日 F5 Networks 6.7亿美元的价格收购。

Nginx是免费的、开源的、高性能的HTTP和反向代理服务器、邮件代理服务器、以及TCP/UDP代理服务器 解决C10K问题(10K Connections)。

Nginx官网:http://nginx.org。

nginx的其它的二次发行版:

        Tengine:由淘宝网发起的Web服务器项目。它在Nginx的基础上,针对大访问量网站的需求,添加 了很多高级功能和特性。Tengine的性能和稳定性已经在大型的网站如淘宝网,天猫商城等得到了 很好的检验。它的最终目标是打造一个高效、稳定、安全、易用的Web平台。从2011年12月开始, Tengine成为一个开源项目官网: http://tengine.taobao.org/。

        OpenResty:基于 Nginx 与 Lua 语言的高性能 Web 平台, 章亦春团队开发,官网:http://openr esty.org/cn/。

2.1.2、Nginx 功能介绍

静态的web资源服务器html,图片,js,css,txt等静态资源。

http/https协议的反向代理。

结合FastCGI/uWSGI/SCGI等协议反向代理动态资源请求。

tcp/udp协议的请求转发(反向代理)。

imap4/pop3协议的反向代理。

2.1.3、基础特性

模块化设计,较好的扩展性。

高可靠性。

支持热部署:不停机更新配置文件,升级版本,更换日志文件。

低内存消耗:10000个keep-alive连接模式下的非活动连接,仅需2.5M内存。

event-driven,aio,mmap,sendfile。

2.1.4、Web 服务相关的功能

虚拟主机(server)。

支持 keep-alive 和管道连接(利用一个连接做多次请求)。

访问日志(支持基于日志缓冲提高其性能)。

url rewirte。

路径别名。

基于IP及用户的访问控制。

支持速率限制及并发数限制。

重新配置和在线升级而无须中断客户的工作进程。

2.2、Nginx架构和进程

2.2.1、Nginx进程结构

web请求处理机制

多进程方式:服务器每接收到一个客户端请求就有服务器的主进程生成一个子进程响应客户端,直 到用户关闭连接,这样的优势是处理速度快,子进程之间相互独立,但是如果访问过大会导致服务 器资源耗尽而无法提供请求。

多线程方式:与多进程方式类似,但是每收到一个客户端请求会有服务进程派生出一个线程和此客 户端进行交互,一个线程的开销远远小于一个进程,因此多线程方式在很大程度减轻了web服务器 对系统资源的要求,但是多线程也有自己的缺点,即当多个线程位于同一个进程内工作的时候,可 以相互访问同样的内存地址空间,所以他们相互影响,一旦主进程挂掉则所有子线程都不能工作 了,IIS服务器使用了多线程的方式,需要间隔一段时间就重启一次才能稳定。

Nginx是多进程组织模型,而且是一个由Master主进程和Worker工作进程组成。

主进程(master process)的功能:

对外接口:接收外部的操作(信号)。

对内转发:根据外部的操作的不同,通过信号管理 Worker。

监控:监控 worker 进程的运行状态,worker 进程异常终止后,自动重启 worker 进程。

读取Nginx 配置文件并验证其有效性和正确性。

建立、绑定和关闭socket连接。

按照配置生成、管理和结束工作进程。

接受外界指令,比如重启、升级及退出服务器等指令。

不中断服务,实现平滑升级,重启服务并应用新的配置。

开启日志文件,获取文件描述符。

不中断服务,实现平滑升级,升级失败进行回滚处理。

编译和处理perl脚本。

工作进程(worker process)的功能:

所有 Worker 进程都是平等的。

实际处理:网络请求,由 Worker 进程处理。

Worker进程数量:一般设置为核心数,充分利用CPU资源,同时避免进程数量过多,导致进程竞争 CPU资源。

增加上下文切换的损耗。

接受处理客户的请求。

将请求依次送入各个功能模块进行处理。

I/O调用,获取响应数据。

与后端服务器通信,接收后端服务器的处理结果。

缓存数据,访问缓存索引,查询和调用缓存数据。

发送请求结果,响应客户的请求。

接收主程序指令,比如重启、升级和退出等。

2.2.2、Nginx进程间通信

工作进程是由主进程生成的,主进程使用fork()函数,在Nginx服务器启动过程中主进程根据配置文件决 定启动工作进程的数量,然后建立一张全局的工作表用于存放当前未退出的所有的工作进程,主进程生 成工作进程后会将新生成的工作进程加入到工作进程表中,并建立一个单向的管道并将其传递给工作进 程,该管道与普通的管道不同,它是由主进程指向工作进程的单向通道,包含了主进程向工作进程发出 的指令、工作进程ID、工作进程在工作进程表中的索引和必要的文件描述符等信息。

主进程与外界通过信号机制进行通信,当接收到需要处理的信号时,它通过管道向相关的工作进程发送 正确的指令,每个工作进程都有能力捕获管道中的可读事件,当管道中有可读事件的时候,工作进程就 会从管道中读取并解析指令,然后采取相应的执行动作,这样就完成了主进程与工作进程的交互。

worker进程之间的通信原理基本上和主进程与worker进程之间的通信是一样的,只要worker进程之间能够 取得彼此的信息,建立管道即可通信,但是由于worker进程之间是完全隔离的,因此一个进程想要知道另外一 个进程的状态信息,就只能通过主进程来实现。

为了实现worker进程之间的交互,master进程在生成worker进程之后,在worker进程表中进行遍历,将该 新进程的PID以及针对该进程建立的管道句柄传递给worker进程中的其他进程,为worker进程之间的通信做 准备,当worker进程1向worker进程2发送指令的时候,首先在master进程给它的其他worker进程工作信息 中找到2的进程PID,然后将正确的指令写入指向进程2的管道,worker进程2捕获到管道中的事件后,解析指 令并进行相关操作,这样就完成了worker进程之间的通信。

另worker进程可以通过共享内存来通讯的,比如upstream中的zone,或者limit_req、limit_conn中的 zone等。操作系统提供了共享内存机制。

2.2.3、Nginx启动和HTTP连接建立

Nginx 启动时,Master 进程,加载配置文件。

Master 进程,初始化监听的 socket。

Master 进程,fork 出多个 Worker 进程。

Worker 进程,竞争新的连接,获胜方通过三次握手,建立 Socket 连接,并处理请求。

2.2.4、HTTP处理过程

2.3、Nginx模块介绍

nginx 有多种模块

核心模块:是 Nginx 服务器正常运行必不可少的模块,提供错误日志记录 、配置文件解析 、事件 驱动机制 、进程管理等核心功能。

标准HTTP模块:提供 HTTP 协议解析相关的功能,比如: 端口配置 、 网页编码设置 、 HTTP响应头设置等等。

可选HTTP模块:主要用于扩展标准的 HTTP 功能,让 Nginx 能处理一些特殊的服务,比如: Flash 多媒体传输 、解析 GeoIP 请求、 网络传输压缩 、 安全协议 SSL 支持等。

邮件服务模块:主要用于支持 Nginx 的 邮件服务 ,包括对 POP3 协议、 IMAP 协议和 SMTP协议的支持。

Stream服务模块: 实现反向代理功能,包括TCP协议代理。

第三方模块:是为了扩展 Nginx 服务器应用,完成开发者自定义功能,比如: Json 支持、 Lua 支 持等。

nginx高度模块化,但其模块早期不支持DSO机制;1.9.11 版本支持动态装载和卸载。

核心模块:core module

标准模块:

        HTTP 模块: ngx_http_*

                HTTP Core modules  # 默认功能

                 HTTP Optional modules  # 需编译时指定

        Mail 模块: ngx_mail_*

        Stream 模块 ngx_stream_*

第三方模块

2.4、Nginx安装

Nginx版本

        Mainline version 主要开发版本,一般为奇数版本号,比如1.19。

        Stable version 当前最新稳定版,一般为偶数版本,如:1.20。

        Legacy versions 旧的稳定版,一般为偶数版本,如:1.18。

Nginx安装可以使用yum或源码安装,但是推荐使用源码编译安装

        yum的版本比较旧。

        编译安装可以更方便自定义相关路径。

        使用源码编译可以自定义相关功能,更方便业务的上的使用。

编译器介绍:

源码安装需要提前准备标准的编译器,GCC的全称是(GNU Compiler collection),其有GNU开发,并以 GPL即LGPL许可,是自由的类UNIX即苹果电脑Mac OS X操作系统的标准编译器,因为GCC原本只能处理C语 言,所以原名为GNU C语言编译器,后来得到快速发展,可以处理C++,Fortran,pascal,objective C, java以及Ada等其他语言,此外还需要Automake工具,以完成自动创建Makefile的工作,Nginx的一些模块 需要依赖第三方库,比如: pcre(支持rewrite),zlib(支持gzip模块)和openssl(支持ssl模块) 等。

官方源码包下载地址:nginx: download

nginx完成安装以后,有四个主要的目录

[root@Nginx nginx-1.24.0]# ls /usr/local/nginx/
conf html logs sbinconf:保存nginx所有的配置文件,其中nginx.conf是nginx服务器的最核心最主要的配置文件,其他的.conf则是用来配置nginx相关的功能的,例如fastcgi功能使用的是fastcgi.conf和fastcgi_params两个文件,配置文件一般都有一个样板配置文件,是以.default为后缀,使用时可将其复制并将default后缀去掉即可。html目录中保存了nginx服务器的web文件,但是可以更改为其他目录保存web文件,另外还有一个50x的web文件是默认的错误页面提示页面。logs:用来保存nginx服务器的访问日志错误日志等日志,logs目录可以放在其他路径,比如/var/logs/nginx里面。sbin:保存nginx二进制启动脚本,可以接受不同的参数以实现不同的功能。

验证版本及编译参数

[root@Nginx ~]# vim ~/.bash_profile
export PATH=$PATH:/usr/local/nginx/sbin[root@Nginx ~]# source ~/.bash_profile[root@Nginx ~]# nginx -V
nginx version: nginx/1.24.0
built by gcc 11.4.1 20231218 (Red Hat 11.4.1-3) (GCC)
built with OpenSSL 3.0.7 1 Nov 2022
TLS SNI support enabled
configure arguments: --group=nginx --with-http_ssl_module --with-http_v2_module -
-with-http_realip_module --with-http_stub_status_module --withhttp_gzip_static_module --with-pcre --with-stream --with-stream_ssl_module --
with-stream_realip_module

使用安装完成的二进制文件nginx

[root@Nginx ~]# nginx -v
nginx version: nginx/1.26.1Usage: nginx [-?hvVtTq] [-s signal] [-c filename] [-p prefix] [-g directives]
Options:-?,-h : this help-v : show version and exit-V : show version and configure options then exit # 显示版本和编译参数-t : test configuration and exit # 测试配置文件是否异-T : test configuration, dump it and exit # 测试并打印-q : suppress non-error messages during configuration testing #静默模式-s signal : send signal to a master process: stop, quit, reopen, reload 
# 发送信号,reload信号 会生成新的worker,但master不会重新生成-p prefix : set prefix path (default: /etc/nginx/) # 指定Nginx 目录-c filename : set configuration file (default: /etc/nginx/nginx.conf) # 配置文件路径-g directives : set global directives out of configuration file # 设置全局指令,注意和配置文件不要同时配置,否则冲突。

nginx命令应用示例:

[root@Nginx ~]# vim /usr/local/nginx/conf/nginx.conf
nginx: [emerg] "worker_processes" directive is duplicate in
/usr/local/nginx/conf/nginx.conf:3
root@Nginx ~]# nginx -g "worker_processes 6;"
[root@Nginx ~]# ps aux | grep nginx
root 48148 0.0 0.1 9868 2052 ? Ss 14:00 0:00 nginx: master
process nginx -g worker_processes 6;
nobody 48149 0.0 0.2 14200 4868 ? S 14:00 0:00 nginx: worker
process
nobody 48150 0.0 0.2 14200 4868 ? S 14:00 0:00 nginx: worker
process
nobody 48151 0.0 0.2 14200 4868 ? S 14:00 0:00 nginx: worker
process[root@Nginx ~]# nginx -s quit
[root@Nginx ~]# ps aux | grep nginx
root 48171 0.0 0.1 221664 2176 pts/0 S+ 14:04 0:00 grep --
color=auto nginx#前台运行
[root@Nginx ~]# nginx -g "daemon off;"

Nginx 启动文件

[root@Nginx ~]# vim /lib/systemd/system/nginx.service
[Unit]
Description=The NGINX HTTP and reverse proxy server
After=syslog.target network.target remote-fs.target nss-lookup.target[Service]
Type=forking
PIDFile=/usr/local/nginx/logs/nginx.pid
ExecStartPre=/usr/local/nginx/sbin/nginx -t
ExecStart=/usr/local/nginx/sbin/nginx
ExecReload=/bin/kill -s HUP $MAINPID
ExecStop=/usr/local/nginx/sbin/nginx -s stop
PrivateTmp=true[Install]
WantedBy=multi-user.target[root@Nginx ~]# systemctl daemon-reload
[root@Nginx ~]# systemctl start nginx

2.5、平滑升级和回滚

有时候我们需要对Nginx版本进行升级以满足对其功能的需求,例如添加新模块,需要新功能,而此时 Nginx又在跑着业务无法停掉,这时我们就可能选择平滑升级

将旧Nginx二进制文件换成新Nginx程序文件(注意先备份)。

向master进程发送USR2信号。

master进程修改pid文件名加上后缀.oldbin,成为nginx.pid.oldbin。

master进程用新Nginx文件启动新master进程成为旧master的子进程,系统中将有新旧两个Nginx主 进程共同提供Web服务,当前新的请求仍然由旧Nginx的worker进程进行处理,将新生成的master进 程的PID存放至新生成的pid文件nginx.pid。

向旧的Nginx服务进程发送WINCH信号,使旧的Nginx worker进程平滑停止。

向旧master进程发送QUIT信号,关闭老master,并删除Nginx.pid.oldbin文件。

如果发现升级有问题,可以回滚∶向老master发送HUP,向新master发送QUIT。

平滑升级和回滚案例

在这其中可能在你杀死老版本的master进程的时候你的nginx版本就已经升级了,这是nginx后面的版本更新了,会在你上线新版本的nginx的进程的时候,自动更新处理事务的nginx。

[root@Nginx nginx]# tar zxf nginx-1.26.1.tar.gz
[root@Nginx nginx]# cd nginx-1.26.1/#开始编译新版本
[root@Nginx nginx-1.26.1]# ./configure --with-http_ssl_module --withhttp_v2_module --with-http_realip_module --with-http_stub_status_module --withhttp_gzip_static_module --with-pcre --with-stream --with-stream_ssl_module --with-stream_realip_module#只要make无需要make install
[root@Nginx nginx-1.26.1]# make#查看两个版本
[root@Nginx nginx-1.26.1]# ll objs/nginx /usr/local/nginx/sbin/nginx
-rwxr-xr-x 1 root root 1239416 Jul 18 15:08 objs/nginx
-rwxr-xr-x 1 root root 5671488 Jul 18 11:41 /usr/local/nginx/sbin/nginx#把之前的旧版的nginx命令备份
[root@Nginx ~]# cd /usr/local/nginx/sbin/
[root@Nginx sbin]# cp nginx nginx.24#把新版本的nginx命令复制过去
[root@Nginx sbin]# cp -f /root/nginx/nginx-1.26.1/objs/nginx   /usr/local/nginx/sbin#检测一下有没有问题
[root@Nginx sbin]# nginx -t
nginx: the configuration file /usr/local/nginx/conf/nginx.conf syntax is ok
nginx: configuration file /usr/local/nginx/conf/nginx.conf test is successful[root@Nginx sbin]# kill -USR2 48732 # nginx worker ID
#USR2 平滑升级可执行程序,将存储有旧版本主进程PID的文件重命名为nginx.pid.oldbin,并启动新的nginx
#此时两个master的进程都在运行,只是旧的master不在监听,由新的master监听80
#此时Nginx开启一个新的master进程,这个master进程会生成新的worker进程,这就是升级后的Nginx进
#程,此时老的进程不会自动退出,但是当接收到新的请求不作处理而是交给新的进程处理。
[root@Nginx sbin]# ps aux | grep nginx
root 48732 0.0 0.1 9868 2436 ? Ss 14:17 0:00 nginx: master
process /usr/local/nginx/sbin/nginx
nobody 48733 0.0 0.2 14200 4868 ? S 14:17 0:00 nginx: worker
process
root 52075 0.0 0.3 9876 6528 ? S 15:41 0:00 nginx: master
process /usr/local/nginx/sbin/nginx
nobody 52076 0.0 0.2 14208 4868 ? S 15:41 0:00 nginx: worker
process[root@Nginx sbin]# curl -I localhost
HTTP/1.1 200 OK
Server: nginx/1.24.0 ##依旧是旧版本生生效
Date: Thu, 18 Jul 2024 07:45:58 GMT
Content-Type: text/html
Content-Length: 615
Last-Modified: Thu, 18 Jul 2024 03:41:13 GMT
Connection: keep-alive
ETag: "66988ed9-267"
Accept-Ranges: bytes#回收旧版本
[root@Nginx sbin]# kill -WINCH 48732
[root@Nginx sbin]# ps aux | grep nginx
root 48732 0.0 0.1 9868 2436 ? Ss 14:17 0:00 nginx: master
process /usr/local/nginx/sbin/nginx
root 52075 0.0 0.3 9876 6528 ? S 15:41 0:00 nginx: master
process /usr/local/nginx/sbin/nginx
nobody 52076 0.0 0.2 14208 4868 ? S 15:41 0:00 nginx: worker
process#检测版本信息
[root@Nginx sbin]# curl -I localhost
HTTP/1.1 200 OK
Server: nginx/1.26.1 #新版本生效
Date: Thu, 18 Jul 2024 07:59:45 GMT
Content-Type: text/html
Content-Length: 615
Last-Modified: Thu, 18 Jul 2024 03:41:13 GMT
Connection: keep-alive
ETag: "66988ed9-267"
Accept-Ranges: bytes#回滚
#如果升级的版本发现问题需要回滚,可以重新拉起旧版本的worker
[root@Nginx sbin]# cp nginx nginx.26
[root@Nginx sbin]# ls
nginx nginx.24 nginx.26
[root@Nginx sbin]# mv nginx.24 nginx
mv: overwrite 'nginx'? y[root@Nginx sbin]# kill -HUP 48732  # 老版本的master的进程号
[root@Nginx sbin]# ps aux | grep nginx
root 48732 0.0 0.1 9868 2436 ? Ss 14:17 0:00 nginx: master
process /usr/local/nginx/sbin/nginx
root 52075 0.0 0.3 9876 6528 ? S 15:41 0:00 nginx: master
process /usr/local/nginx/sbin/nginx
nobody 52076 0.0 0.2 14208 5124 ? S 15:41 0:00 nginx: worker
process
nobody 52130 0.0 0.2 14200 4868 ? S 16:30 0:00 nginx: worker
process[root@Nginx sbin]# kill -WINCH 52075
[root@Nginx sbin]# ps aux | grep nginx
root 48732 0.0 0.1 9868 2436 ? Ss 14:17 0:00 nginx: master
process /usr/local/nginx/sbin/nginx
root 52075 0.0 0.3 9876 6528 ? S 15:41 0:00 nginx: master
process /usr/local/nginx/sbin/nginx
nobody 52130 0.0 0.2 14200 4868 ? S 16:30 0:00 nginx: worker
process
root 52137 0.0 0.1 221664 2176 pts/0 S+ 16:31 0:00 grep --
color=auto nginx[root@Nginx sbin]# curl -I localhost
HTTP/1.1 200 OK
Server: nginx/1.24.0 ##版本回滚完成
Date: Thu, 18 Jul 2024 08:31:51 GMT
Content-Type: text/html
Content-Length: 615
Last-Modified: Thu, 18 Jul 2024 03:41:13 GMT
Connection: keep-alive
ETag: "66988ed9-267"
Accept-Ranges: bytes

三、Nginx核心配置详解

nginx 官方帮助文档:http://nginx.org/en/docs/

3.1、Nginx配置文件介绍

Nginx的配置文件的组成部分:

主配置文件:nginx.conf。

子配置文件: include conf.d/*.conf。

fastcgi, uwsgi,scgi 等协议相关的配置文件。

mime.types:支持的mime类型,MIME(Multipurpose Internet Mail Extensions)多用途互联网邮。

件扩展类型,MIME消息能包含文本、图像、音频、视频以及其他应用程序专用的数据,是设定某。

种扩展名的文件用一种应用程序来打开的方式类型,当该扩展名文件被访问的时候,浏览器会自动。

使用指定应用程序来打开。多用于指定一些客户端自定义的文件名,以及一些媒体文件打开方式。

nginx 配置文件格式说明:配置文件由指令与指令块构成每条指令以;分号结尾,指令与值之间以空格符号分隔可以将多条指令放在同一行,用分号分隔即可,但可读性差,不推荐指令块以{ }大括号将多条指令组织在一起,且可以嵌套指令块include语句允许组合多个配置文件以提升可维护性使用#符号添加注释,提高可读性使用$符号使用变量部分指令的参数支持正则表达式Nginx 主配置文件的配置指令方式:
directive value [value2 ...];注意
(1) 指令必须以分号结尾
(2) 支持使用配置变量内建变量:由Nginx模块引入,可直接引用自定义变量:由用户使用set命令定义,格式: set variable_name value;引用变量:$variable_name主配置文件结构:四部分
main block:主配置段,即全局配置段,对http,mail都有效#事件驱动相关的配置
event {...
}#http/https 协议相关配置段
http {...
}#默认配置文件不包括下面两个块
#mail 协议相关配置段
mail {...
}
#stream 服务器相关配置段
stream {...
}

默认的nginx.conf 配置文件格式说明

# 全局配置端,对全局生效,主要设置nginx的启动用户/组,启动的工作进程数量,工作模式,Nginx的PID路
#径,日志路径等。user nginx nginx;
worker_processes 1; # 启动工作进程数数量。
events { # events # 设置快,主要影响nginx服务器与用户的网络连接。
# 比如是否允许同时接受多个网络连接,使用哪种事件驱动模型。
# 处理请求,每个工作进程可以同时支持的最大连接数,是否开启对多工作进程下的网络连接进行序列化等。worker_connections 1024; # 设置单个nginx工作进程可以接受的最大并发,
# 作为web服务器的时候最大并发数为 #worker_connections *worker_processes,作为反向代理的时候为(worker_connections * worker_processes)/2}http { # http块是Nginx服务器配置中的重要部分,缓存、代理和日志格式定义等绝大多数功能和第三方
# 模块都可以在这设置,http块可以包含多个server块,而一个server块中又可以包含多个location块,
# server块可以配置文件引入、MIME-Type定义、日志自定义、是否启用sendfile、连接超时时间和 
# 单个链接的请求上限等。include mime.types;default_type application/octet-stream;sendfile on; # 作为web服务器的时候打开sendfile加快静态文件传输,指定是否使用# sendfile系统调用来传输文件# sendfile系统调用在两个文件描述符之间直接传递数据(完全在内核中操作)# 从而避免了数据在内核缓冲区和用户缓冲区之间的拷贝,操作效率很高,被称之为零拷贝,# 硬盘 >> kernel buffer (快速拷贝到kernelsocketbuffer) >>协议栈。keepalive_timeout 65; # 长连接超时时间,单位是秒server { # 设置一个虚拟机主机,可以包含自己的全局快,同时也可以包含多个location模块# 比如本虚拟机监听的端口、本虚拟机的名称和IP配置,多个server 可以使用一个端口比如都使用 # 80端口提供web服务listen 80; # 配置server监听的端口server_name localhost; # 本server的名称,当访问此名称的时候nginx会调用当前serevr内部的配置进程匹配。location / { # location其实是server的一个指令,为nginx服务器提供比较多而且灵活的指令#都是在location中体现的,主要是基于nginx接受到的请求字符串#对用户请求的UIL进行匹配,并对特定的指令进行处理#包括地址重定向、数据缓存和应答控制等功能都是在这部分实现#另外很多第三方模块的配置也是在location模块中配置。root html; #相当于默认页面的目录名称,默认是安装目录的相对路径,可以使用绝对路径配置。index index.html index.htm; #默认的页面文件名称}error_page 500 502 503 504 /50x.html; #错误页面的文件名称location = /50x.html { #location处理对应的不同错误码的页面定义到/50x.html#这个跟对应其server中定义的目录下。root html; #定义默认页面所在的目录}
}#和邮件相关的配置
#mail {# ...
# } mail 协议相关配置段
#tcp代理配置,1.9版本以上支持
#stream {# ...
# } stream 服务器相关配置段#导入其他路径的配置文件#include /apps/nginx/conf.d/*.conf
}

全局配置

Main 全局配置段常见的配置指令分类

        正常运行必备的配置

        优化性能相关的配置

        用于调试及定位问题相关的配置

        事件驱动相关的配置

全局配置说明:
user nginx nginx; # 启动Nginx工作进程的用户和组。
worker_processes [number | auto]; # 启动Nginx工作进程的数量,一般设为和CPU核心数相同。
worker_cpu_affinity 00000001 00000010 00000100 00001000 | auto ;"""
将Nginx工作进程绑定到指定的CPU核心,默认Nginx是不进行进程绑定的,绑定并不是意味着当前nginx进
程独占以一核心CPU,但是可以保证此进程不运行在其他核心上,这就极大减少了nginx的工作进程在不同的
cpu核心上的来回跳转,减少了CPU对进程的资源分配与回收以及内存管理等,因此可以有效的提升nginx服务
器的性能。CPU MASK: 00000001:0号CPU00000010:1号CPU10000000:7号CPU
"""#示例
worker_cpu_affinity 0001 0010 0100 1000;第0号---第3号CPU
worker_cpu_affinity 0101 1010;#示例
worker_processes 4;
worker_cpu_affinity 00000010 00001000 00100000 10000000;[root@centos8 ~]# ps axo pid,cmd,psr | grep nginx
31093 nginx: master process /apps 1
34474 nginx: worker process 1
34475 nginx: worker process 3
34476 nginx: worker process 5
34477 nginx: worker process 7# 错误日志记录配置,语法:error_log file [debug | info | notice | warn | error | crit | alert | emerg]#error_log logs/error.log;
#error_log logs/error.log notice;
error_log /usr/local/nginx/logs/error.log error;# pid文件保存路径
pid /usr/local/nginx/logs/nginx.pid;
worker_priority 0; # 工作进程优先级,-20~20(19)。
worker_rlimit_nofile 65536; # 所有worker进程能打开的文件数量上限。# 包括:Nginx的所有连接(例如与代理服务器的连接等)# 而不仅仅是与客户端的连接# 另一个考虑因素是实际的并发连接数不能超过系统级别的最大打开文件数的限制# 最好与ulimit -n 或者limits.conf的值保持一致,# 修改pam限制
[root@Nginx ~]# sudo -u nginx ulimit -n
1024
[root@Nginx ~]# vim /etc/security/limits.conf
* - nofile 100000
[root@Nginx ~]# sudo -u nginx ulimit -n
100000daemon off; # 前台运行Nginx服务用于测试、docker等环境。
master_process off|on; # 是否开启Nginx的master-worker工作模式,仅用于开发调试场景,默认为onevents {worker_connections 65535; # 设置单个工作进程的最大并发连接数use epoll; # 使用epoll事件驱动,# Nginx支持众多的事件驱动,# 比如:select、poll、epoll,只能设置在events模块中设置accept_mutex on; # on为同一时刻一个请求轮流由work进程处理,# 而防止被同时唤醒所有worker# 避免多个睡眠进程被唤醒的设置,默认为off# 新请求会唤醒所有worker进程,此过程也称为"惊群"# 因此nginx刚安装完以后要进行适当的优化。建议设置为onmulti_accept on; # on时Nginx服务器的每个工作进程可以同时接受多个新的网络连接# 此指令默认为off,# 即默认为一个工作进程只能一次接受一个新的网络连接# 打开后几个同接受多个。建议设置为on
}

3.2、示例:实现Nginx的高并发配置

[root@webserver ~]# ulimit -n
1024
[root@webserver ~]# ab -c 5000 -n 10000 http://192.168.212.139/
This is ApacheBench, Version 2.3 <$Revision: 1903618 $>
Copyright 1996 Adam Twiss, Zeus Technology Ltd, http://www.zeustech.net/
Licensed to The Apache Software Foundation, http://www.apache.org/Benchmarking 192.168.212.139 (be patient)
socket: Too many open files (24)
[root@webserver ~]##修改配置
[root@Nginx ~]# vim /etc/security/limits.conf
* - nproc 100000
[root@Nginx ~]# vim /apps/nginx/conf/nginx.conf
worker_rlimit_nofile 100000;
[root@Nginx ~]# systemctl restart nginx

也可以通过图中的方式临时进行更改

3.3、http配置块

# 在响应报文中将指定的文件扩展名映射至MIME对应的类型
include /etc/nginx/mime.types;
default_type application/octet-stream; # 除mime.types中的类型外
# 指定其它文件的默认MIME类型,浏览
器一般会提示下载
types {text/html html;image/gif gif;image/jpeg jpg;
}

示例:识别php文件为text/html

[root@Nginx ~]# vim /usr/local/nginx/html/lee.php
<?phpphpinfo();
?>[root@webserver ~]# curl -I 192.168.212.139/liu.php
HTTP/1.1 200 OK
Server: nginx/1.26.1
Date: Mon, 11 Aug 2025 10:41:10 GMT
Content-Type: application/octet-stream
Content-Length: 24
Last-Modified: Mon, 11 Aug 2025 10:40:44 GMT
Connection: keep-alive
ETag: "6899c8ac-18"
Accept-Ranges: bytes[root@webserver ~]#

3.4、核心配置示例

基于不同的IP、不同的端口以及不用得域名实现不同的虚拟主机,依赖于核心模块 ngx_http_core_module实现。

# 新建一个 PC web 站点
# 定义子配置文件路径
[root@Nginx ~]# mkdir /usr/local/nginx/conf.d/
[root@centos8 ~]# vim /usr/local/nginx/conf/nginx.conf
http {......include /apps/nginx/conf/conf.d/*.conf; # 在配置文件的最后面添加此行# 注意不要放在最前面,会导致前面的命令无法生效
}# 创建虚拟主机网站配置
[root@Nginx ~]# vim /usr/local/nginx/conf.d/vhosts.conf
server {listen 80;server_name lee.timingliu.org;location / {root /web/nginx/timingliu.org/liu/html;}}[root@Nginx ~]# mkdir -p /web/nginx/timingliu.org/liu/html
[root@Nginx ~]# echo www.timingliu.org >
mkdir -p /web/nginx/timingliu.org/liu/html/index.html
[root@Nginx ~]# nginx -s reload#访问测试
[root@node100 ~]# curl www.timingliu.org #注意在访问主机中设解析
www.timingliu.org

root 与 alias

root:指定web的家目录,在定义location的时候,文件的绝对路径等于 root+location。

alias:定义路径别名,会把访问的路径重新定义到其指定的路径,文档映射的另一种机制;仅能用于 location上下文,此指令使用较少。

root示例:
server {listen 80;server_name www.timingliu.org;location / {root /web/nginx/timingliu.org/liu/html;}location /dirtest { #必须建立/mnt/dirtest才能访问root /mnt;}
}
[root@Nginx ~]# mkdir /mnt/dirtest/
[root@Nginx ~]# echo dirtest page > /mnt/dirtest/index.html
[root@Nginx ~]# nginx -s reload# 重启Nginx并访问测试
[root@node100 ~]# curl www.timingliu.org/dirtest/
dirtest pagealias示例:
server {listen 80;server_name www.timingliu.org;location / {root /web/nginx/timingliu.org/liu/html;}location /dirtest {root /mnt;}location /alias { # 注意about后不要加/# 使用alias的时候uri后面如果加了斜杠,则下面的路径配置必须加斜杠,否则403alias /mnt/dirtest; # 当访问alias的时候,会显示alias定义的/mnt/dirtest里面的内容}
}# 重启Nginx并访问测试
[root@node100 ~]# curl www.timingliu.org/alias/
dirtest page

root # 给定的路径对应于location中的/uri左侧的/

alias # 给定的路径对应于location中的/uri的完整路径

location的详细使用

在一个server中location配置段可存在多个,用于实现从uri到文件系统的路径映射;

ngnix会根据用户请求的URI来检查定义的所有location,按一定的优先级找出一个最佳匹配;

而后应用其配置在没有使用正则表达式的时候,nginx会先在server中的多个location选取匹配度最 高的一个uri;

uri是用户请求的字符串,即域名后面的web文件路径;

然后使用该location模块中的正则url和字符串,如果匹配成功就结束搜索,并使用此location处理 此请求。

# 语法规则:
location [ = | ~ | ~* | ^~ ] uri { ... }= # 用于标准uri前,需要请求字串与uri精确匹配,大小敏感,如果匹配成功就停止向下匹配并立即处理请求^~ # 用于标准uri前,表示包含正则表达式,并且匹配以指定的正则表达式开头#对uri的最左边部分做匹配检查,不区分字符大小写~ # 用于标准uri前,表示包含正则表达式,并且区分大小写~* # 用于标准uri前,表示包含正则表达式,并且不区分大写不带符号 #匹配起始于此uri的所有的uri\ # 用于标准uri前,表示包含正则表达式并且转义字符。可以将 . * ?等转义为普通符号# 匹配优先级从高到低:
=, ^~, ~/~*, 不带符号

匹配案例-精确匹配

在server部分使用location配置一个web界面,例如:当访问nginx 服务器的/logo.jpg的时候要显示指定 html文件的内容,精确匹配一般用于匹配组织的logo等相对固定的URL,匹配优先级最高。

[root@Nginx ~]# mkdir /web/nginx/timingliu.org/liu/images -p
[root@Nginx ~]# ls /webdata/nginx/timingliu.org/liu/images
[root@Nginx ~]# vim /usr/local/nginx/conf.d/vhosts.confserver {listen 80;server_name www.timingliu.org;location / {root /web/nginx/timingliu.org/liu/html;}location = /logo.png {root /web/nginx/timingliu.org/liu/images;}
}#上传logo.jpg图片到/web/nginx/timingliu.org/liu/images,重启Nginx并访问测试
#访问测试:http://www.timingliu.org/logo.png

匹配案例-区分大小写

~ 实现区分大小写的模糊匹配. 以下范例中。

如果访问uri中包含大写字母的logo.PNG,则以下location匹配logo.png条件不成功。

因为 ~ 区分大小写,当用户的请求被执行匹配时发现location中定义的是小写的png。

本次访问的uri匹配失败,后续要么继续往下匹配其他的location(如果有),要么报错给客户端。

server {listen 80;server_name lee.timinglee.org;location / {root /web/nginx/timingliu.org/liu/html;}location ~ /logo.PNG {root /web/nginx/timingliu.org/liu/images;}
}# 重启Nginx并访问测试
# http://www.timingliu.org/logo.PNG #访问失败,系统中没有logo.PNG文件

匹配案例-不区分大小写

~* 用来对用户请求的uri做模糊匹配,uri中无论都是大写、都是小写或者大小写混合,此模式也都会匹 配,通常使用此模式匹配用户request中的静态资源并继续做下一步操作,此方式使用较多。

注意: 此方式中,对于Linux文件系统上的文件仍然是区分大小写的,如果磁盘文件不存在,仍会提示404。

server {listen 80;server_name www.timingliu.org;location / {root /web/nginx/timingliu.org/liu/html;}location ~* /logo.PNG {root /web/nginx/timingliu.org/liu/images;}
} # 重启Nginx并访问测试
# http://www.timingliu.org/logo.png

匹配案例-URI开始

[root@Nginx ~]# mkdir /web/nginx/timingliu.org/liu/images/images{1,2}
[root@Nginx ~]# echo image1 >
/web/nginx/timingliu.org/liu/images/images1/index.html
[root@Nginx ~]# echo image2 >
/web/nginx/timingliu.org/liu/images/images2/index.htmlserver {listen 80;server_name www.timingliu.org;location / {root /web/nginx/timingliu.org/liu/html;}location ^~ /images {root /web/nginx/timingliu.org/liu/images;index index.html;}location /images1 {root /web/nginx/timingliu.org/liu/images;}
}[root@node100 ~]# curl 192.168.212.139/images1/
image1
[root@node100 ~]# curl 192.168.212.139/images2/
image2

匹配案例-文件名后缀

[root@Nginx ~]# mkdir /web/nginx/timingliu.org/liu/images
# 上传一个图片
server {listen 80;server_name www.timingliu.org;location / {root /web/nginx/timingliu.org/liu/html;}location ~* \.(gif|jpg|jpeg|bmp|png|tiff|tif|ico|wmf|js|css)$ {root /web/nginx/timingliu.org/liu/images;index index.html;}
}# 重启Nginx并访问测试
192.168.212.139/logo.png

匹配案例-优先级

server {listen 80;server_name www.timingliu.org;location / {root /web/nginx/timingliu.org/liu/html;}location ^~ /images {root /web/nginx/timingliu.org/liu/images;index index.html;}location /images1 {root /web/nginx/timingliu.org/liu/images;}location ~* \.(gif|jpg|jpeg|bmp|png|tiff|tif|ico|wmf|js)$ {root /data/nginx/static3;index index.html;}
}# 匹配优先级:=, ^~, ~/~*,/
location优先级:(location =) > (location ^~ 路径) > (location ~,~* 正则顺序) >
(location 完整路径) > (location 部分起始路径) > (/)

生产使用案例

# 直接匹配网站根会加速Nginx访问处理
location = /index.html {......;
}
location / {......;
}
# 静态资源配置方法1
location ^~ /static/ {......;
}
# 静态资源配置方法2,应用较多
location ~* \.(gif|jpg|jpeg|png|css|js|ico)$ {......;
}
# 多应用配置
location ~* /app1 {......;
}
location ~* /app2 {......;
}

Nginx账户认证功能:由 ngx_http_auth_basic_module 模块提供此功能。

[root@webserver ~]# htpasswd -cmb /usr/local/nginx/conf/.htpasswd admin liu 
# -b 表示非交互建立用户认证
Adding password for user admin[root@webserver ~]# htpasswd -mb /usr/local/nginx/conf/.htpasswd liu liu
Adding password for user liu[root@webserver ~]# cat /usr/local/nginx/conf/.htpasswd
admin:$apr1$iVehab3l$bdbLH4kR8elRG/WM220N90
liu:$apr1$f1qCcMbZ$RjmuvuThzTBngIw/wm2en1[root@webserver ~]# mkdir /web/nginx/timingliu.org/liu/login
[root@webserver ~]# echo login > /web/nginx/timingliu.org/liu/login/index.html
[root@webserver ~]# vim /usr/local/nginx/conf.d/vhosts.conf
server {listen 80;server_name www.timingliu.org;location /login {root /web/nginx/timingliu.org/liu;index index.html;auth_basic "login password";auth_basic_user_file "/usr/local/nginx/conf/.htpasswd";}
}nginx -s reload# 重启Nginx并访问测试
[root@node100 ~]# curl www.timingliu.org/login/ -u liu:liu
login
[root@node100 ~]# curl www.timingliu.org/login/ -u admin:liu
login

自定义错误页面

自定义错误页,同时也可以用指定的响应状态码进行响应, 可用位置:http, server, location, if in location                error_page code ... [=[response]] uri;

模板:
listen 80;
server_name www.timingliu.org;
error_page 500 502 503 504 /error.html;
location = /error.html {root /data/nginx/html;
}
#重启nginx并访问不存在的页面进行测试示例:自定义错误页面
[root@Nginx ~]# mkdir /web/nginx/timingliu.org/liu/errors -p
[root@Nginx ~]# echo error page > /web/nginx/timingliu.org/liu/errors/40x.html
server {listen 80;server_name www.timingliu.org;error_page 404 /40x.htmllocation = /40x.html {root /web/nginx/timingliu.org/liu/errors;}
}测试:
[root@node100 ~]# curl www.timingliu.org/haha
error page

自定义错误日志

模板:
Syntax: error_log file [level];
Default:
error_log logs/error.log error;
Context: main, http, mail, stream, server, location
level: debug, info, notice, warn, error, crit, alert, emerg示例:
[root@Nginx ~]# mkdir "/var/log/nginx" -p
[root@Nginx ~]# vim /usr/local/nginx/conf.d/vhosts.conf
server {listen 80;server_name www.timingliu.org;error_page 404 /40x.html;access_log /var/log/nginx/access.log;error_log /var/log/nginx/error.log;location = /40x.html {root /web/nginx/timingliu.org/liu/errors;}
}
# 重启nginx并访问不存在的页面进行测试并验证是在指定目录生成新的日志文件

检测文件是否存在

try_files会按顺序检查文件是否存在,返回第一个找到的文件或文件夹(结尾加斜线表示为文件夹),如 果所有文件或文件夹都找不到,会进行一个内部重定向到最后一个参数。只有最后一个参数可以引起一 个内部重定向,之前的参数只设置内部URI的指向。最后一个参数是回退URI且必须存在,否则会出现内 部500错误。

语法格式:
Syntax: try_files file ... uri;
try_files file ... =code;
Default: —
Context: server, location示例: 如果不存在页面, 就转到default.html页面
[root@Nginx ~]# echo "index.html is not exist" >
/web/nginx/timingliu.org/liu/error/default.html[root@Nginx ~]# vim /usr/local/nginx/conf.d/vhosts.conf
server {listen 80;server_name www.timingliu.org;root /web/nginx/timingliu.org/liu;error_page 404 /40x.html;access_log /var/log/nginx/access.log;error_log /var/log/nginx/error.log;try_files $uri $uri.html $uri/index.html /error/default.html;location = /40x.html {root /web/nginx/timingliu.org/liu/errors;}
}
测试:
curl www.timingliu.org

长连接配置

模板:
keepalive_timeout timeout [header_timeout]; # 设定保持连接超时时长,0表示禁止长连接,默认为75s# 通常配置在http字段作为站点全局配置
keepalive_requests 数字; # 在一次长连接上所允许请求的资源的最大数量# 默认为100次,建议适当调大,比如:500示例:
keepalive_requests 3;
keepalive_timeout 65 60;
# 开启长连接后,返回客户端的会话保持时间为60s,单次长连接累计请求达到指定次数请求或65秒就会被断
开,第二个数字60为发送给客户端应答报文头部中显示的超时时间设置为60s:如不设置客户端将不显示超时时
间。
Keep-Alive:timeout=60 # 浏览器收到的服务器返回的报文# 如果设置为0表示关闭会话保持功能,将如下显示:# Connection:close 浏览器收到的服务器返回的报文# 使用命令测试:
[root@webserver ~]# telnet www.timingliu.org 80
Trying 192.168.212.139...
Connected to www.timingliu.org.
Escape character is '^]'.
GET / HTTP/1.1  # 输入动作
HOST: www.timingliu.org  # 输入域名
# 回车HTTP/1.1 200 OK
Server: nginx/1.26.1
Date: Mon, 11 Aug 2025 11:09:48 GMT
Content-Type: text/html
Content-Length: 615
Last-Modified: Tue, 29 Jul 2025 08:04:42 GMT
Connection: keep-alive
ETag: "6888809a-267"
Accept-Ranges: bytes192.168.212.139
GET / HTTP/1.1 # 第二次操作
HOST: www.timingliu.org # 第二次操作
# 第二次操作HTTP/1.1 200 OK
Server: nginx/1.26.1
Date: Mon, 11 Aug 2025 11:09:48 GMT
Content-Type: text/html
Content-Length: 615
Last-Modified: Tue, 29 Jul 2025 08:04:42 GMT
Connection: keep-alive
ETag: "6888809a-267"
192.168.212.139
Connection closed by foreign host. # 自动断开链接

作为下载服务器配置

ngx_http_autoindex_module 模块处理以斜杠字符 "/" 结尾的请求,并生成目录列表,可以做为下载服务配置使用。

相关指令:
autoindex on | off; # 自动文件索引功能,默为off。
autoindex_exact_size on | off; # 计算文件确切大小(单位bytes),off 显示大概大小(单位K、M),默认on。
autoindex_localtime on | off ; # 显示本机时间而非GMT(格林威治)时间,默认off。
autoindex_format html | xml | json | jsonp; # 显示索引的页面文件风格,默认html。
limit_rate rate; # 限制响应客户端传输速率(除GET和HEAD以外的所有方法),单位B/s,bytes/second, 
# 默认值0,表示无限制,此指令由ngx_http_core_module提供。
set $limit_rate 4k; # 也可以通变量限速,单位B/s,同时设置,此项优级高。示例:实现
# 注意:download不需要index.html文件
[root@Nginx ~]# mkdir -p /web/nginx/timingliu.org/liu/download
[root@Nginx ~]# cp /root/anaconda-ks.cfg
/web/nginx/timingliu.org/liu/download[root@Nginx ~]# vim /usr/local/nginx/conf.d/vhosts.conf
server {listen 80;server_name www.timingliu.org;root /web/nginx/timingliu.org/liu;access_log /var/log/nginx/access.log;error_log /var/log/nginx/error.log;try_files $uri $uri.html $uri/index.html /error/default.html;location = /40x.html {root /web/nginx/timingliu.org/liu/errors;}location /download {autoindex on; # 自动索引功能autoindex_exact_size on; # 计算文件确切大小(单位bytes),此为默认值,off只显示大概大小(单位kb、mb、gb)下载站点autoindex_localtime on; # on表示显示本机时间而非GMT(格林威治)时间,默为为off显示GMT时间limit_rate 1024k;  # 限速,默认不限速 }
}# 重启Nginx并访问测试下载页面

四、Nginx高级配置

4.1、Nginx 状态页

        基于nginx 模块 ngx_http_stub_status_module 实现,

        在编译安装nginx的时候需要添加编译参数 --with-http_stub_status_module,

        否则配置完成之后监测会是提示法错误。

注意: 状态页显示的是整个服务器的状态,而非虚拟主机的状态。

# 配置示例:
location /nginx_status {stub_status;auth_basic "auth login";auth_basic_user_file /apps/nginx/conf/.htpasswd;allow 192.168.0.0/16;allow 127.0.0.1;deny all;
}
# 状态页用于输出nginx的基本状态信息:
# 输出信息示例:
Active connections: 291
server accepts handled requests16630948 16630948 31070465# 上面三个数字分别对应accepts,handled,requests三个值
Reading: 6 Writing: 179 Waiting: 106Active connections: # 当前处于活动状态的客户端连接数# 包括连接等待空闲连接数=reading+writing+waiting
accepts: # 统计总值,Nginx自启动后已经接受的客户端请求连接的总数。
handled: # 统计总值,Nginx自启动后已经处理完成的客户端请求连接总数
# 通常等于accepts,除非有因worker_connections限制等被拒绝的连接requests: # 统计总值,Nginx自启动后客户端发来的总的请求数
Reading: # 当前状态,正在读取客户端请求报文首部的连接的连接数
# 数值越大,说明排队现象严重,性能不足
Writing: # 当前状态,正在向客户端发送响应报文过程中的连接数,数值越大,说明访问量很大
Waiting: # 当前状态,正在等待客户端发出请求的空闲连接数
# 开启 keep-alive的情况下,这个值等于active –(reading+writing)

4.2、Nginx压缩功能

Nginx支持对指定类型的文件进行压缩然后再传输给客户端,而且压缩还可以设置压缩比例,压缩后的文 件大小将比源文件显著变小,样有助于降低出口带宽的利用率,降低企业的IT支出,不过会占用相 应的CPU资源。

Nginx对文件的压缩功能是依赖于模块 ngx_http_gzip_module,默认是内置模块。

配置指令如下:
# 启用或禁用gzip压缩,默认关闭
gzip on | off;
# 压缩比由低到高从1到9,默认为1,值越高压缩后文件越小,但是消耗cpu比较高。基本设定未4或者5
gzip_comp_level 4;
# 禁用IE6 gzip功能,早期的IE6之前的版本不支持压缩
gzip_disable "MSIE [1-6]\.";
# gzip压缩的最小文件,小于设置值的文件将不会压缩
gzip_min_length 1k;
# 启用压缩功能时,协议的最小版本,默认HTTP/1.1
gzip_http_version 1.0 | 1.1;
# 指定Nginx服务需要向服务器申请的缓存空间的个数和大小,平台不同,默认:32 4k或者16 8k;
gzip_buffers number size;
# 指明仅对哪些类型的资源执行压缩操作;默认为gzip_types text/html,不用显示指定,否则出错
gzip_types mime-type ...;
# 如果启用压缩,是否在响应报文首部插入“Vary: Accept-Encoding”,一般建议打开
gzip_vary on | off;
# 预压缩,即直接从磁盘找到对应文件的gz后缀的式的压缩文件返回给用户,无需消耗服务器CPU
# 注意: 来自于ngx_http_gzip_static_module模块
gzip_static on | off;示例:重启nginx并进行访问测试压缩功能[root@Nginx ~]# mkdir /web/nginx/timingliu.org/liu/data
[root@Nginx ~]# cp /usr/local/nginx/logs/access.log
/web/nginx/timingliu.org/liu/data/data.txt
[root@Nginx ~]# echo test > /web/nginx/timingliu.org/liu/data/test.html 
# 小于1k的文件测试是否会压缩[root@Nginx ~]# vim /usr/local/nginx/conf/nginx.conf
@@@@省略内容@@@@
gzip on;
gzip_comp_level 5;
gzip_min_length 1k;gzip_types text/plain application/javascript application/x-javascript text/css
application/xml text/javascript application/x-httpd-php image/gif image/png;gzip_vary on;# 重启Nginx并访问测试:
[root@client ~]# curl --head --compressed www.timingliu.org/data/test.html
HTTP/1.1 200 OK
Server: nginx/1.26.1
Date: Sun, 21 Jul 2024 15:42:46 GMT
Content-Type: text/html
Content-Length: 5
Last-Modified: Sun, 21 Jul 2024 15:40:35 GMT
Connection: keep-alive
ETag: "669d2bf3-5"
Accept-Ranges: bytes[root@client ~]# curl --head --compressed www.timingliu.org/data/data.txt
HTTP/1.1 200 OK
Server: nginx/1.26.1
Date: Sun, 21 Jul 2024 15:43:17 GMT
Content-Type: text/plain
Last-Modified: Sun, 21 Jul 2024 15:40:13 GMT
Connection: keep-alive
Vary: Accept-Encoding
ETag: W/"669d2bdd-3e25b5"
Content-Encoding: gzip

4.3、Nginx的版本隐藏

用户在访问nginx的时候,我们可以从报文中获得nginx的版本,相对于裸漏版本号的nginx,我们把其隐藏起来更安全。

[root@Nginx nginx-1.26.1]# vim src/core/nginx.h# define nginx_version 1026001
# define NGINX_VERSION "1.0"
# define NGINX_VER "HAHA/" NGINX_VERSION

4.4、Nginx变量使用

nginx的变量可以在配置文件中引用,作为功能判断或者日志等场景使用,

变量可以分为内置变量和自定义变量,

内置变量是由nginx模块自带,通过变量可以获取到众多的与客户端访问相关的值。

常用内置变量:
$remote_addr;
# 存放了客户端的地址,注意是客户端的公网IP$args;
# 变量中存放了URL中的所有参数
# 例如:https://search.jd.com/Search?keyword=手机&enc=utf-8
# 返回结果为: keyword=手机&enc=utf-8$is_args
# 如果有参数为? 否则为空$document_root;
# 保存了针对当前资源的请求的系统根目录,例如:/webdata/nginx/timinglee.org/lee。$document_uri;
# 保存了当前请求中不包含参数的URI,注意是不包含请求的指令
# 比如:http://lee.timinglee.org/var?\id=11111会被定义为/var
# 返回结果为:/var$host;
# 存放了请求的host名称limit_rate 10240;
echo $limit_rate;
# 如果nginx服务器使用limit_rate配置了显示网络速率,则会显示,如果没有设置, 则显示0$remote_port;
# 客户端请求Nginx服务器时随机打开的端口,这是每个客户端自己的端口$remote_user;
# 已经经过Auth Basic Module验证的用户名$request_body_file;
# 做反向代理时发给后端服务器的本地资源的名称$request_method;
# 请求资源的方式,GET/PUT/DELETE等$request_filename;
# 当前请求的资源文件的磁盘路径,由root或alias指令与URI请求生成的文件绝对路径,
# 如:webdata/nginx/timinglee.org/lee/var/index.html$request_uri;
# 包含请求参数的原始URI,不包含主机名,相当于:$document_uri?$args,
# 例如:/main/index.do?id=20190221&partner=search$scheme;
# 请求的协议,例如:http,https,ftp等$server_protocol;
# 保存了客户端请求资源使用的协议的版本,例如:HTTP/1.0,HTTP/1.1,HTTP/2.0等$server_addr;
# 保存了服务器的IP地址$server_name;
# 虚拟主机的主机名$server_port;
# 虚拟主机的端口号$http_user_agent;
# 客户端浏览器的详细信息$http_cookie;
# 客户端的所有cookie信息$cookie_<name>
# name为任意请求报文首部字部cookie的key名$http_<name>
# name为任意请求报文首部字段,表示记录请求报文的首部字段,name的对应的首部字段名需要为小写,如果有
横线需要替换为下划线# 示例:
echo $http_user_agent;
echo $http_host;$sent_http_<name>
# name为响应报文的首部字段,name的对应的首部字段名需要为小写,如果有横线需要替换为下划线,此变量有
问题echo $sent_http_server;
$arg_<name>
# 此变量存放了URL中的指定参数,name为请求url中指定的参数
echo $arg_id;
示例:
[root@Nginx ~]# vim /usr/local/nginx/conf.d/vhosts.confserver {listen 80;server_name www.timingliu.org;root /web/nginx/timingliu.org/liu;location /var {default_type text/html;echo $remote_addr;echo $args;echo $document_root;echo $document_uri;echo $host;echo $http_user_agent;echo $request_filename;echo $scheme;echo $scheme://$host$document_uri?$args;echo $http_cookie;echo $cookie_key2;echo $http_Accept;}
}[root@client ~]# curl -b "title=liu;key1=liu,key2=timingliu"
"www.timingliu.org/var?search=liu&&id=666666"
192.168.212.139
search=liu&&id=666666
/web/nginx/timingliu.org/liu
/var
www.timingliu.org
curl/7.29.0
/web/nginx/timingliu.org/liu/var
http
http://www.timingliu.org/var?search=liu&&id=666666
title=liu;key1=liu,key2=timingliu
timingliu
*/*

自定义变量

假如需要自定义变量名称和值,使用指令set $variable value;

语法格式:
Syntax: set $variable value;
Default: —
Context: server, location, if示例:set $name timingliu;
echo $name;
set $my_port $server_port;
echo $my_port;
echo "$server_name:$server_port";[root@Nginx ~]# vim /usr/local/nginx/conf.d/vhosts.conf
server {listen 80;server_name www.timingliu.org;root /web/nginx/timingliu.org/liu;location /var {default_type text/html;set $name timingliu;echo $name;set $web_port $server_port;echo $web_port;}
}测试输出
[root@webserver ~]# curl www.timingliu.org/var
timingliu
80

五、Nginx Rewrite相关功能

Nginx服务器利用 ngx_http_rewrite_module 模块解析和处理rewrite请求

此功能依靠 PCRE(perl compatible regular expression),因此编译之前要安装PCRE库

rewrite是nginx服务器的重要功能之一,用于实现URL的重写,URL的重写是非常有用的功能

比如它可以在我们改变网站结构之后,不需要客户端修改原来的书签,也无需其他网站修改我们的 链接,就可以设置为访问

另外还可以在一定程度上提高网站的安全性。

5.1、ngx_http_rewrite_module 模块指令

官方文档: https://nginx.org/en/docs/http/ngx_http_rewrite_module.html

if指令

用于条件匹配判断,并根据条件判断结果选择不同的Nginx配置,可以配置在server或location块中进行 配置,Nginx的if语法仅能使用if做单次判断,不支持使用if else或者if elif这样的多重判断,用法如下:

if (条件匹配) {action
}

使用正则表达式对变量进行匹配,匹配成功时if指令认为条件为true,否则认为false,变量与表达式之间 使用以下符号链接:

= # 比较变量和字符串是否相等,相等时if指令认为该条件为true,反之为false
!= # 比较变量和字符串是否不相等,不相等时if指令认为条件为true,反之为false
~ # 区分大小写字符,可以通过正则表达式匹配,满足匹配条件为真,不满足匹配条件为假
!~ # 区分大小写字符,判断是否匹配,不满足匹配条件为真,满足匹配条件为假
~* # 不区分大小写字符,可以通过正则表达式匹配,满足匹配条件为真,不满足匹配条件为假
!~* # 不区分大小字符,判断是否匹配,满足匹配条件为假,不满足匹配条件为真
-f 和 !-f # 判断请求的文件是否存在和是否不存在
-d 和 !-d # 判断请求的目录是否存在和是否不存在
-x 和 !-x # 判断文件是否可执行和是否不可执行
-e 和 !-e # 判断请求的文件或目录是否存在和是否不存在(包括文件,目录,软链接)
# 注意:
# 如果$变量的值为空字符串或0,则if指令认为该条件为false,其他条件为true。
# nginx 1.0.1之前$变量的值如果以0开头的任意字符串会返回false
示例:
location /test {index index.html;default_type text/html;if ( $scheme = http ){echo "if ---------> $scheme";}if ( $scheme = https ){echo "if ---------> $scheme";}
}location /test2 {if ( !-e $request_filename ){echo "$request_filename is not exist";return 409;}
}测试:
[root@webserver ~]# curl www.timingliu.org/test/
if ---------> http
[root@webserver ~]# curl www.timingliu.org/test2/test
<html>
<head><title>409 Conflict</title></head>
<body>
<center><h1>409 Conflict</h1></center>
<hr><center>nginx/1.26.1</center>
</body>
</html>
[root@webserver ~]#

set指令

指定key并给其定义一个变量,变量可以调用Nginx内置变量赋值给key 另外set定义格式为set $key value,value可以是text, variables和两者的组合

[root@Nginx ~]# vim /usr/local/nginx/conf.d/vhosts.conf
server {listen 80;server_name www.timingliu.org;root /web/nginx/timingliu.org/liu;location /test3{set $name lee;echo $name;}
}
测试:
[root@client ~]# curl www.timingliu.org/test3
liu

break指令

用于中断当前相同作用域(location)中的其他Nginx配置

与该指令处于同一作用域的Nginx配置中,位于它前面的配置生效

位于后面的 ngx_http_rewrite_module 模块中指令就不再执行

Nginx服务器在根据配置处理请求的过程中遇到该指令的时候,回到上一层作用域继续向下读取配置

该指令可以在server块和locationif块中使用

注意: 如果break指令在location块中后续指令还会继续执行,只是不执行 ngx_http_rewrite_module 模块的指令,其它指令还会执行

return指令

return用于完成对请求的处理,并直接向客户端返回响应状态码,比如:可以指定重定向URL(对于特殊重 定向状态码,301/302等) 或者是指定提示文本内容(对于特殊状态码403/500等),处于此指令后的所有配 置都将不被执行,return可以在server、if 和 location块进行配置

语法格式:
return code; # 返回给客户端指定的HTTP状态码
return code [text]; # 返回给客户端的状态码及响应报文的实体内容# 可以调用变量,其中text如果有空格,需要用单或双引号
return code URL; # 返回给客户端的URL地址location /test {default_type application/json;return 200 '{"status:"success"}';
}示例:
server {listen 80;server_name www.timingliu.org;root /web/nginx/timingliu.org/liu;location /return {default_type text/html;if ( !-e $request_filename){return 301 http://www.baidu.com;# return 666 "$request_filename is not exist";}echo "$request_filename is exist";}
}测试:
[root@client ~]# curl www.timingliu.org/return
/web/nginx/timingliu.org/liu/return is exist
[root@client ~]# curl www.timingliu.org/return1
/web/nginx/timingliu.org/liu/return1 is not exist
# 测试return 301 http://www.baidu.com;
可在浏览器直接访问www.timingliu.org/return1

rewrite指令

通过正则表达式的匹配来改变URI,可以同时存在一个或多个指令,按照顺序依次对URI进行匹配, rewrite主要是针对用户请求的URL或者是URI做具体处理

语法格式 :
rewrite regex replacement [flag];

rewrite将用户请求的URI基于regex所描述的模式进行检查,匹配到时将其替换为表达式指定的新的URI

注意:如果在同一级配置块中存在多个rewrite规则,那么会自下而下逐个检查;被某条件规则替换完成 后,会重新一轮的替换检查,隐含有循环机制,但不超过10次;如果超过,提示500响应码,[flag]所表示的 标志位用于控制此循环机制

如果替换后的URL是以http://或https://开头,则替换结果会直接以重定向返回给客户端, 即永久重定向 301

正则表达式格式
. # 匹配除换行符以外的任意字符
\w # 匹配字母或数字或下划线或汉字
\s # 匹配任意的空白符
\d # 匹配数字
\b # 匹配单词的开始或结束
^ # 匹配字付串的开始
$ # 匹配字符串的结束
* # 匹配重复零次或更多次
+ # 匹配重复一次或更多次
? # 匹配重复零次或一次
(n) # 匹配重复n次
{n,} # 匹配重复n次或更多次
{n,m} # 匹配重复n到m次
*? # 匹配重复任意次,但尽可能少重复
+? # 匹配重复1次或更多次,但尽可能少重复
?? # 匹配重复0次或1次,但尽可能少重复
{n,m}? # 匹配重复n到m次,但尽可能少重复
{n,}? # 匹配重复n次以上,但尽可能少重复
\W # 匹配任意不是字母,数字,下划线,汉字的字符
\S # 匹配任意不是空白符的字符
\D # 匹配任意非数字的字符
\B # 匹配不是单词开头或结束的位置
[^x] # 匹配除了x以外的任意字符
[^lee] # 匹配除了lee 这几个字母以外的任意字符

rewrite flag

利用nginx的rewrite的指令,可以实现url的重新跳转,rewrite有四种不同的flag,分别是redirect(临时 重定向302)、permanent(永久重定向301)、break和last。其中前两种是跳转型的flag,后两种是代理型

        跳转型指由客户端浏览器重新对新地址进行请求

        代理型是在WEB服务器内部实现跳转      

rewrite 格式
Syntax: rewrite regex replacement [flag]; #通过正则表达式处理用户请求并返回替换后的数据包。
Default: —
Context: server, location, if

  

flag 说明
redirect;
# 临时重定向,重写完成后以临时重定向方式直接返回重写后生成的新URL给客户端
# 由客户端重新发起请求;使用相对路径,或者http://或https://开头,状态码:302permanent;
# 重写完成后以永久重定向方式直接返回重写后生成的新URL给客户端
# 由客户端重新发起请求,状态码:301break;
# 重写完成后,停止对当前URL在当前location中后续的其它重写操作
# 而后直接跳转至重写规则配置块之后的其它配置,结束循环,建议在location中使用
# 适用于一个URL一次重写last;
# 重写完成后,停止对当前URI在当前location中后续的其它重写操作,
# 而后对新的URL启动新一轮重写检查,不建议在location中使用
# 适用于一个URL多次重写,要注意避免出现超过十次以及URL重写后返回错误的给用户

5.1.2、rewrite案例: 域名永久与临时重定向

域名的临时的调整,后期可能会变,之前的域名或者URL可能还用、或者跳转的目的域名和URL还会跳 转,这种情况浏览器不会缓存跳转,临时重定向不会缓存域名解析记录(A记录),但是永久重定向会缓存。

示例: 因业务需要,将访问源域名 www.timinglee.org 的请求永久重定向到www.timinglee.com

location / {root /data/nginx/html/pc;index index.html;rewrite / http://www.timingliu.org permanent;#rewrite / http://www.timingliu.org redirect;
}
# 重启Nginx并访问域名 http://www.timingliu.org 进行测试

永久重定向301

域名永久型调整,即域名永远跳转至另外一个新的域名,之前的域名再也不使用,跳转记录可以缓存到客户端浏览器。

永久重定向会缓存DNS解析记录, 浏览器中有 from disk cache 信息,即使nginx服务器无法访问,浏览器也 会利用缓存进行重定向。

京东早期的域名 www.360buy.com 由于与360公司类似,于是后期永久重定向到www.jd.com。

临时重定向302

域名临时重定向,告诉浏览器域名不是固定重定向到当前目标域名,后期可能随时会更改,因此浏览器 不会缓存当前域名的解析记录,而浏览器会缓存永久重定向的DNS解析记录,这也是临时重定向与永久 重定向最大的本质区别。

即当nginx服务器无法访问时,浏览器不能利用缓存,而导致重定向失败。

[root@Nginx ~]# vim /usr/local/nginx/conf.d/vhosts.conf
server {listen 80;server_name lee.timingliu.org;root /webdata/nginx/timingliu.org/lee;location / {rewrite / http://lee.timingliu.com redirect;#rewrite / http://lee.timingliu.com permanent;}
}server {listen 80;server_name lee.timingliu.com;root /webdata/nginx/timingliu.com/lee;
}

5.1.3、rewrite 案例: break 与 last

访问break请求被rewrite至test1,而访问test1转递请求再次被rewrite发送至test2,此测试last和break 分别有什么区别?

break和last区别案例

[root@nginx]# mkdir /data/web/html/{test1,test2,break,last}
[root@nginx]# echo test1 > /data/web/html/test1/index.html
[root@nginx]# echo test2 > /data/web/html/test2/index.html
[root@nginx]# echo last > /data/web/html/last/index.html
[root@nginx]# echo break > /data/web/html/break/index.html[root@nginx nginx]# vim conf.d/vhosts.conf
server {listen 80;server_name www.timingliu.org;root /data/web/html;index index.html;location /break {root /data/web/html;rewrite ^/break/(.*) /test1/$1 break;rewrite ^/test1/(.*) /test2/$1 ;}location /last {root /data/web/html;rewrite ^/last/(.*) /test1/$1 last;rewrite ^/test1/(.*) /test2/$1 ;}location /test1 {default_type text/html;return 666 "new test1";}location /test2 {root /data/web/html;}
}#测试:
[root@client ~]# curl -L www.timingliu.org/break/index.html
test1
[root@client ~]# curl -L www.timingliu.org/last/index.html
new test1[root@client ~]#

5.1.4、rewrite案例: 自动跳转 https

案例:基于通信安全考虑公司网站要求全站 https,因此要求将在不影响用户请求的情况下将http请求全 部自动跳转至 https,另外也可以实现部分 location 跳转。

在配置nginx前,你需要先创建ssl的认证

[root@centos8 ~]#vim /usr/local/nginx/conf.d/pc.conf
server {listen 443 ssl;listen 80;ssl_certificate /apps/nginx/certs/www.timingliu.org.crt;ssl_certificate_key /apps/nginx/certs/www.timingliu.org.key;ssl_session_cache shared:sslcache:20m;ssl_session_timeout 10m;server_name www.timnigliu.org;location / { # 针对全站跳转root /data/nginx/html/pc;index index.html;if ($scheme = http ){ # 如果没有加条件判断,会导致死循环rewrite / https://$host redirect;}}location /login { # 针对特定的URL进行跳转httpsif ($scheme = http ){ # 如果没有加条件判断,会导致死循环rewrite / https://$host/login redirect;}}
}# 重启Nginx并访问测试
[root@centos7 ~]#curl -ikL www.timingliu.org
HTTP/1.1 302 Moved Temporarily
Server: nginx/1.18.0
Date: Thu, 08 Oct 2020 15:23:48 GMT
Content-Type: text/html
Content-Length: 145
Connection: keep-alive
Location: https://www.timingliu.org
HTTP/1.1 200 OK
Server: nginx/1.18.0
Date: Thu, 08 Oct 2020 15:23:48 GMT
Content-Type: text/html
Content-Length: 7
Last-Modified: Sat, 26 Sep 2020 01:18:32 GMT
Connection: keep-alive
ETag: "5f6e96e8-7"
Accept-Ranges: bytes
pc web

5.1.5、rewrite 案例: 判断文件是否存在

案例:当用户访问到公司网站的时输入了一个错误的URL,可以将用户重定向至官网首页。

[root@centos8 ~]#vim /usr/lcoal/nginx/conf.d/pc.conf
location / {root /data/nginx/html/pc;index index.html;if (!-e $request_filename) {rewrite .* http://www.timingliu.org/index.html; # 实现客户端浏览器的302跳转#rewrite .* /index.html; # web服务器内部跳转}
}
# 重启Nginx并访问测试

5.2、Nginx 防盗链

防盗链基于客户端携带的referer实现,referer是记录打开一个页面之前记录是从哪个页面跳转过来的标 记信息,如果别人只链接了自己网站图片或某个单独的资源,而不是打开了网站的整个页面,这就是盗 链,referer就是之前的那个网站域名,正常的referer信息有以下几种:

none:  # 请求报文首部没有referer首部,# 比如用户直接在浏览器输入域名访问web网站,就没有referer信息。blocked: # 请求报文有referer首部,但无有效值,比如为空。server_names: # referer首部中包含本主机名及即nginx 监听的server_name。arbitrary_string: # 自定义指定字符串,但可使用*作通配符。示例: *.timingliu.org
www.timingliu.*regular expression: # 被指定的正则表达式模式匹配到的字符串,要使用~开头,例如:
~.*\.timingliu\.com

5.2.1、实现盗链

在一个web 站点盗链另一个站点的资源信息,比如:图片、视频等。

#新建一个主机172.25.254.20,盗取另一台主机lee.timingliu.org/images/liu.png的图片
[root@client ~]# yum install httpd -y
[root@client html]# vim /var/www/html/index.html
#准备盗链web页面:
<html><head><meta http-equiv=Content-Type content="text/html;charset=utf-8"><title>盗链</title></head><body><img src="http://www.timingliu.org/images/liu.png" ><h1 style="color:red">欢迎大家</h1><p><a href=http://www.timingliu.org>狂点</a>出门见喜</p></body>
</html>
~
# 重启apache并访问http://192.168.212.139 测试
# 验证两个域名的日志,是否会在被盗连的web站点的日志中出现以下盗链日志信息:[root@Nginx ~]# cat /usr/local/nginx/logs/access.log
172.25.254.1 - - [22/Jul/2024:09:50:01 +0800] "GET /images/logo.png HTTP/1.1" 304
0 "http://192.168.212.139/" "Mozilla/5.0 (Windows NT 10.0; Win64; x64)
AppleWebKit/537.36 (KHTML, like Gecko) Chrome/126.0.0.0 Safari/537.36
Edg/126.0.0.0"
172.25.254.1 - - [22/Jul/2024:09:50:18 +0800] "GET / HTTP/1.1" 304 0
"http://192.168.212.139/" "Mozilla/5.0 (Windows NT 10.0; Win64; x64)
AppleWebKit/537.36 (KHTML, like Gecko) Chrome/126.0.0.0 Safari/537.36
Edg/126.0.0.0"

5.2.2、实现防盗链

基于访问安全考虑,nginx支持通过ngx_http_referer_module模块,检查访问请求的referer信息是否有效 实现防盗链功能。

官方文档:Module ngx_http_referer_module

示例: 定义防盗链:

[root@Nginx ~]# vim /usr/local/nginx/conf.d/vhosts.conf
server {listen 80;server_name www.timingliu.org;root /data/web/html;index index.html;location / {valid_referers none blocked server_names *.timingliu.org ~/.baidu/.;if ($invalid_referer){return 404;}}location /images {valid_referers none blocked server_names *.timingliu.org ~/.baidu/.;if ($invalid_referer){rewrite ^/ http://www.timingliu.org/daolian.png permanent; # 注意此图片不能和正常图片放在一个目录中}}
}
# 重启Nginx并访问测试
http://192.168.212.139

六、Nginx反向代理功能

反向代理:reverse proxy,指的是代理外网用户的请求到内部的指定的服务器,并将数据返回给用户的 一种方式,这是用的比较多的一种方式。

Nginx 除了可以在企业提供高性能的web服务之外,另外还可以将 nginx 本身不具备的请求通过某种预 定义的协议转发至其它服务器处理,不同的协议就是Nginx服务器与其他服务器进行通信的一种规范,主 要在不同的场景使用以下模块实现不同的功能。

ngx_http_proxy_module: # 将客户端的请求以http协议转发至指定服务器进行处理
ngx_http_upstream_module # 用于定义为proxy_pass,fastcgi_pass,uwsgi_pass# 等指令引用的后端服务器分组ngx_stream_proxy_module: # 将客户端的请求以tcp协议转发至指定服务器处理
ngx_http_fastcgi_module: # 将客户端对php的请求以fastcgi协议转发至指定服务器助理
ngx_http_uwsgi_module: # 将客户端对Python的请求以uwsgi协议转发至指定服务器处理

同构代理:用户不需要其他程序的参与,直接通过http协议或者tcp协议访问后端服务器。

异构代理:用户访问的资源时需要经过处理后才能返回的,比如php,python,等等,这种访问资源需 要经过处理才能被访问。

6.1、实现 http 反向代理

官方文档: https://nginx.org/en/docs/http/ngx_http_proxy_module.html

http 协议反向代理

# 官方文档:https://nginx.org/en/docs/http/ngx_http_proxy_module.html
# proxy_pass
proxy_pass; # 用来设置将客户端请求转发给的后端服务器的主机# 可以是主机名(将转发至后端服务做为主机头首部)、IP地址:端口的方式# 也可以代理到预先设置的主机群组,需要模块ngx_http_upstream_module支持# 示例:
location /web {index index.html;proxy_pass http://172.25.254.30:8080; # 8080后面无uri,即无 / 符号,# 需要将location后面url 附加到proxy_pass指定的url后面# 此行为类似于root# proxy_pass指定的uri不带斜线将访问的/web# 等于访问后端服务器proxy_pass http://172.25.254.40:8080/; # 8080后面有uri,即有 / 符号# 相当于置换,即访问/web时实际返回proxy_pass后面uri内容# 此行为类似于alias# proxy_pass指定的uri带斜线#等于访问后端服务器的# http://172.25.254.40:8080/index.html# 内容返回给客户端
}                 # http://nginx/web/index.html ==>
http://1:8080# 重启Nginx测试访问效果:
#curl -L http://www.timingliu.org/web
# 如果location定义其uri时使用了正则表达式模式(包括~,~*,但不包括^~),则proxy_pass之后必须不能使用uri
# 即不能有/ ,用户请求时传递的uri将直接附加至后端服务器之后server {...server_name HOSTNAME;location ~|~* /uri/ {proxy_pass http://host:port; #proxy_pass后面的url 不能加/
}...
}http://HOSTNAME/uri/ --> http://host/uri/
proxy_hide_header field; # 用于nginx作为反向代理的时候# 在返回给客户端http响应时# 隐藏后端服务器相应头部的信息# 可以设置在http,server或location块# 示例: 隐藏后端服务器ETag首部字段
location /web {index index.html;proxy_pass http://10.0.0.18:8080/;proxy_hide_header ETag;
}
proxy_pass_header field; # 透传
# 默认nginx在响应报文中不传递后端服务器的首部字段Date, Server, X-Pad, X-Accel等参数
# 如果要传递的话则要使用 proxy_pass_header field声明将后端服务器返回的值传递给客户端
# field 首部字段大小不敏感# 示例:透传后端服务器的Server和Date首部给客户端,同时不再响应报中显示前端服务器的Server字段
proxy_pass_header Server;
proxy_pass_header Date;proxy_pass_request_body on | off;
# 是否向后端服务器发送HTTP实体部分,可以设置在http,server或location块,默认即为开启proxy_pass_request_headers on | off;
# 是否将客户端的请求头部转发给后端服务器,可以设置在http,server或location块,默认即为开启proxy_set_header;
# 可更改或添加客户端的请求头部信息内容并转发至后端服务器,比如在后端服务器想要获取客户端的真实IP的时候,就要更改每一个报文的头部。# 示例:
location ~ /web {proxy_pass http://172.25.254.20:80;proxy_hide_header ETag;proxy_pass_header Server;proxy_pass_request_body on;proxy_pass_request_headers on;proxy_set_header X-Forwarded-For $remote_addr;
}
[root@apache20 ~]# vim /etc/httpd/conf/httpd.conf
LogFormat "\"%{X-Forwarded-For}i\" %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%
{User-Agent}i\"" combined访问后看后端服务器日志
proxy_connect_timeout time;
# 配置nginx服务器与后端服务器尝试建立连接的超时时间,默认为60秒#用法如下:proxy_connect_timeout 6s;
# 60s为自定义nginx与后端服务器建立连接的超时时间,超时会返回客户端504响应码proxy_read_timeout time;
# 配置nginx服务器向后端服务器或服务器组发起read请求后,等待的超时时间,默认60sproxy_send_timeout time;
# 配置nginx项后端服务器或服务器组发起write请求后,等待的超时 时间,默认60sproxy_http_version 1.0;
# 用于设置nginx提供代理服务的HTTP协议的版本,默认http 1.0proxy_ignore_client_abort off;
# 当客户端网络中断请求时,nginx服务器中断其对后端服务器的请求。即如果此项设置为on开启,则服务器、会忽略客户端中断并一直等着代理服务执行返回,如果设置为off,则客户端中断后Nginx也会中断客户端请求并立即记录499日志,默认为off。

6.1.1、实战案例: 反向代理单台 web 服务器

要求:将用户对域 www.timingliuiu.org 的请求转发给后端服务器处理

[root@centos8 ~]# cat /apps/nginx/conf/conf.d/pc.conf
server {listen 80;server_name www.timingliu.org;location / {proxy_pass http://192.168.212.10;}
}
#重启Nginx 并访问测试

6.1.2、实战案例: 指定 location 实现反向代理

针对指定的 location

server {listen 80;server_name www.timingliu.org;location / {proxy_pass http://192.168.212.10;}location ~ /static {proxy_pass http://192.168.212.20:8080;}
}# 后端web服务器必须要有相对于的访问URL
[root@apache20 ~]# mkdir /var/www/html/static
[root@apache20 ~]# echo static 192.168.212.20 > /var/www/html/static/index.html
[root@apache30 ~]# echo 192.168.212.10 > /var/www/html/index.html# 重启Nginx并访问测试:
[2024-07-25 17:09.35] ~
[Administrator.DESKTOP-P19CNDN] ➤ curl www.timingliu.org/static/
static 192.168.212.20
[2024-07-25 17:09.39] ~
[Administrator.DESKTOP-P19CNDN] ➤ curl www.timingliu.org
192.168.212.10

针对特定的资源实现代理

[root@Nginx ~]# vim /apps/nginx/conf.d/vhost.conf
server {listen 80;server_name www.timingliu.org;location / {proxy_pass http://192.168.212.10;}location ~ \.(png|jpg|gif) {proxy_pass http://192.168.212.20:8080;}
}

6.1.3、反向代理示例: 缓存功能

缓存功能默认关闭状态,需要先动配置才能启用

proxy_cache zone_name | off; 默认off
# 指明调用的缓存,或关闭缓存机制;Context:http, server, location
# zone_name 表示缓存的名称.需要由proxy_cache_path事先定义proxy_cache_key string;
# 缓存中用于“键”的内容,默认值:proxy_cache_key $scheme$proxy_host$request_uri;proxy_cache_valid [code ...] time;
# 定义对特定响应码的响应内容的缓存时长,定义在http{...}中示例:
proxy_cache_valid 200 302 10m;
proxy_cache_valid 404 1m;
proxy_cache_path;
# 定义可用于proxy功能的缓存;Context:http
proxy_cache_path path [levels=levels] [use_temp_path=on|off]
keys_zone=zone_name:size [inactive=time] [max_size=size] [manager_files=number]
[manager_sleep=time] [manager_threshold=time] [loader_files=number]
[loader_sleep=time] [loader_threshold=time] [purger=on|off]
[purger_files=number] [purger_sleep=time] [purger_threshold=time];# 示例:在http配置定义缓存信息
proxy_cache_path /var/cache/nginx/proxy_cache # 定义缓存保存路径,proxy_cache会自动创建levels=1:2:2 # 定义缓存目录结构层次# 1:2:2可以生成2^4x2^8x2^8=2^20=1048576个目录keys_zone=proxycache:20m # 指内存中缓存的大小,主要用于存放key和metadata(如:使用次数)# 一般1M可存放8000个左右的keyinactive=120s # 缓存有效时间max_size=10g; # 最大磁盘占用空间,磁盘存入文件内容的缓存空间最大值# 调用缓存功能,需要定义在相应的配置段,如server{...};或者location等
proxy_cache proxycache;
proxy_cache_key $request_uri; # 对指定的数据进行MD5的运算做为缓存的key
proxy_cache_valid 200 302 301 10m; # 指定的状态码返回的数据缓存多长时间
proxy_cache_valid any 1m; # 除指定的状态码返回的数据以外的缓存多长时间,必须设置,否则不会缓存
proxy_cache_use_stale error | timeout | invalid_header | updating | http_500 |
http_502 | http_503 | http_504 | http_403 | http_404 | off ; #默认是off
# 在被代理的后端服务器出现哪种情况下,可直接使用过期的缓存响应客户端# 示例
proxy_cache_use_stale error http_502 http_503;
proxy_cache_methods GET | HEAD | POST ...;
# 对哪些客户端请求方法对应的响应进行缓存,GET和HEAD方法总是被缓存

非缓存场景压测

# 准备后端httpd服务器
[root@apache20 app1]# pwd
/var/www/html/static
[root@apache20 static]# cat /var/log/messages > ./log.html # 准备测试页面
[root@apache30 ~]# ab -n1000 -c100 http://www.timingliu.org/static/index.html
Concurrency Level: 100
Time taken for tests: 23.238 seconds
Complete requests: 1000
Failed requests: 0
Total transferred: 2011251000 bytes
HTML transferred: 2010991000 bytes
Requests per second: 43.03 [#/sec] (mean)
Time per request: 2323.789 [ms] (mean)
Time per request: 23.238 [ms] (mean, across all concurrent requests)
Transfer rate: 84521.97 [Kbytes/sec] received

准备缓存配置

[root@Nginx ~]# vim /apps/nginx/conf/nginx.conf
@@@@内容省略@@@@
# gzip on;
proxy_cache_path /apps/nginx/proxy_cache levels=1:2:2 keys_zone=proxycache:20m
inactive=120s max_size=1g; # 配置在nginx.conf http配置段
[root@Nginx ~]# vim /apps/nginx/conf.d/vhost.conf
location ~ /static { # 要缓存的URL 或者放在server配置项对所有URL都进行缓存proxy_pass http://192.168.212.10:8080;proxy_cache proxycache;proxy_cache_key $request_uri;proxy_cache_valid 200 302 301 10m;proxy_cache_valid any 1m; # 必须指定哪些响应码的缓存
}
# /data/nginx/proxycache/ 目录会自动生成
[root@Nginx ~]# ll /apps/nginx/proxy_cache/ -d
drwx------ 3 nginx root 4096 7月 25 20:07 /apps/nginx/proxy_cache/
[root@Nginx ~]# tree /apps/nginx/proxy_cache/
/data/nginx/proxycache/
0 directories, 0 files

访问并验证缓存文件

#访问web并验证缓存目录
[root@apache30 ~]# ab -n1000 -c100 http://www.timingliu.org/static/index.html
[root@centos8 ~]# ab -n 2000 -c200 http://www.timingliu.org/static/log.html
Concurrency Level: 100
Time taken for tests: 10.535 seconds
Complete requests: 1000
Failed requests: 0
Total transferred: 2011251000 bytes
HTML transferred: 2010991000 bytes
Requests per second: 94.92 [#/sec] (mean)
Time per request: 1053.507 [ms] (mean)
Time per request: 10.535 [ms] (mean, across all concurrent requests)
Transfer rate: 186435.60 [Kbytes/sec] received# 验证缓存目录结构及文件大小
[root@Nginx ~]# tree /apps/nginx/proxy_cache/
/apps/nginx/proxy_cache/
└── e
└── 50
└── 99
└── 319432ef3663735a9d3cb4e0c1d9950e
3 directories, 0 files

6.2、http 反向代理负载均衡

在上一个节中Nginx可以将客户端的请求转发至单台后端服务器但是无法转发至特定的一组的服务器,而 且不能对后端服务器提供相应的服务器状态监测,Nginx 可以基于ngx_http_upstream_module模块提 供服务器分组转发、权重分配、状态监测、调度算法等高级功能。

官方文档: https://nginx.org/en/docs/http/ngx_http_upstream_module.html

http upstream配置参数

# 自定义一组服务器,配置在http块内
upstream name {server ...........
}
# 示例
upstream backend {server backend1.example.com weight=5;server 127.0.0.1:8080 max_fails=3 fail_timeout=30s;server unix:/tmp/backend3;server backup1.example.com backup;
}
server address [parameters];
# 配置一个后端web服务器,配置在upstream内,至少要有一个server服务器配置。# server支持的parameters如下:
weight=number # 设置权重,默认为1,实现类似于LVS中的WRR,WLC等
max_conns=number # 给当前后端server设置最大活动链接数,默认为0表示没有限制
max_fails=number # 后端服务器的下线条件,当客户端访问时,对本次调度选中的后端服务器连续进行检
测多少次,如果都失败就标记为不可用,默认为1次,当客户端访问时,才会利用TCP触发对探测后端服务器健康性检查,而非周期性的探测。fail_timeout=time # 后端服务器的上线条件,对已经检测到处于不可用的后端服务器,每隔此时间间隔再
次进行检测是否恢复可用,如果发现可用,则将后端服务器参与调度,默认为10秒。backup # 设置为备份服务器,当所有后端服务器不可用时,才会启用此备用服务器
down # 标记为down状态,可以平滑下线后端服务器
resolve # 当server定义的是主机名的时候,当A记录发生变化会自动应用新IP而不用重启
Nginxhash KEY [consistent];
# 基于指定请求报文中首部字段或者URI等key做hash计算,使用consistent参数,将使用ketama一致性
hash算法,适用于后端是Cache服务器(如varnish)时使用,consistent定义使用一致性hash运算,一致
性hash基于取模运算hash $request_uri consistent; # 基于用户请求的uri做hashhash $cookie_sessionid # 基于cookie中的sessionid这个key进行hash调度,实现会话绑定ip_hash;
# 源地址hash调度方法,基于的客户端的remote_addr(源地址IPv4的前24位或整个IPv6地址)做hash计算,以实现会话保持least_conn;
# 最少连接调度算法,优先将客户端请求调度到当前连接最少的后端服务器,相当于LVS中的WLC

6.2.1、反向代理示例: 后端多台 web服务器

环境说明:
192.168.212.139 #Nginx 代理服务器
192.168.212.10 #后端web A,Apache部署
192.168.212.20 #后端web B,Apache部署部署后端 Apache服务器:
[root@apache10 ~]# yum install httpd -y
[root@apache10 ~]# echo "web1 192.168.212.10" > /var/www/html/index.html
[root@apache10 ~]# systemctl enable --now httpd
[root@apache20 ~]# yum install httpd -y
[root@apache20 ~]# echo "web2 192.168.212.20" >> /var/www/html/index.html
[root@apache20 ~]# systemctl enable --now httpd
#访问测试
[root@centos8 ~]# curl http://192.168.212.10
web1 192.168.212.10
[root@centos8 ~]# curl http://192.168.212.20
web2 192.168.212.20配置Nginx反向代理:
注意: 本节实验过程中先关闭缓存
[root@centos8 ~]# cat /apps/nginx/conf/conf.d/pc.conf
upstream webserver {#ip_hash;#hash $request_uri consistent;#hash $cookie_lee#least_conn;server 192.168.212.10:8080 weight=1 fail_timeout=15s max_fails=3;server 192.168.212.20:80 weight=1 fail_timeout=15s max_fails=3;server 192.168.212.101:80 backup;
}server {listen 80;server_name www.timingliu.org;location ~ / {proxy_pass http://webserver;}
}# 重启Nginx 并访问测试
[Administrator.DESKTOP-P19CNDN] ➤ curl www.timingliu.org
192.168.212.10 web
[Administrator.DESKTOP-P19CNDN] ➤ curl www.timingliu.org
192.168.212.20 web
# 关闭192.168.212.10和192.168.212.20,测试nginx backup服务器可用性:
[Administrator.DESKTOP-P19CNDN] ➤ while true;do curl
http://www.timingliu.org;sleep 1;done

6.3、实战案例: 基于Cookie 实现会话绑定

[root@Nginx ~]# vim /apps/nginx/conf.d/vhost.conf
http {upstream websrvs {hash $cookie_hello; #hello是cookie的key的名称server 192.168.212.10:80 weight=2;server 192.168.212.20:80 weight-1;}
}[root@centos8 ~]# vim /apps/nginx/conf/conf.d/pc.conf
upstream webserver {#ip_hash;#hash $request_uri consistent;hash $cookie_lee;#least_conn;server 192.168.212.10:8080 weight=1 fail_timeout=15s max_fails=3;server 192.168.212.20:80 weight=1 fail_timeout=15s max_fails=3;#server 192.168.212.100:80 backup;
}server {listen 80;server_name www.timingliu.org;location ~ / {proxy_pass http://webserver;}
}
# 测试
[Administrator.DESKTOP-P19CNDN] ➤ curl -b liu=1 www.timingliu.org

6.4、实现 Nginx 四层负载均衡

Nginx在1.9.0版本开始支持tcp模式的负载均衡,在1.9.13版本开始支持udp协议的负载,udp主要用于 DNS的域名解析,其配置方式和指令和http 代理类似,其基于ngx_stream_proxy_module模块实现tcp 负载,另外基于模块ngx_stream_upstream_module实现后端服务器分组转发、权重分配、状态监测、 调度算法等高级功能。

如果编译安装,需要指定 --with-stream 选项才能支持ngx_stream_proxy_module模块

官方文档: https://nginx.org/en/docs/stream/ngx_stream_proxy_module.html

6.4.1、tcp负载均衡配置参数

注意:tcp的负载均衡要卸载http语句块之外

stream { # 定义stream相关的服务;
Context:mainupstream backend { # 定义后端服务器hash $remote_addr consistent; # 定义调度算法server backend1.example.com:12345 weight=5; # 定义具体serverserver 127.0.0.1:12345 max_fails=3 fail_timeout=30s;server unix:/tmp/backend3;}upstream dns { # 定义后端服务器server 10.0.0.1:53; # 定义具体serverserver dns.example.com:53;}server { # 定义serverlisten 12345; # 监听IP:PORTproxy_connect_timeout 1s; # 连接超时时间proxy_timeout 3s; # 转发超时时间proxy_pass backend; # 转发到具体服务器组}server {listen 127.0.0.1:53 udp reuseport;proxy_timeout 20s;proxy_pass dns;}server {listen [::1]:12345;proxy_pass unix:/tmp/stream.socket;}
}

6.4.2、负载均衡实例: MySQL

后端服务器安装 MySQL

#在apache20中安装mysql
[root@apache10 ~]# yum install mariadb-server -y
[root@apache10 ~]# vim /etc/my.cnf.d/mariadb-server.cnf
[mysqld]
server-id=10
[root@apache10 ~]# systemctl start mariadb
[root@apache10 ~]# mysql -e "grant all on *.* to liu@'%' identified by 'liu';"
[root@apache20 ~]# mysql -ulee -plee -h192.168.212.10 -e "select @@server_id"
+-------------+
| @@server_id |
+-------------+
| 10 |
+-------------+
#在apache20重复以上步骤并在apache10上测试nginx配置
[root@Nginx ~]# vim /apps/nginx/conf/tcp/tcp.conf
stream {
upstream mysql_server {server 192.168.212.10:3306 max_fails=3 fail_timeout=30s;server 192.168.212.20:3306 max_fails=3 fail_timeout=30s;
}
server {listen 192.168.212.10:3306;proxy_pass mysql_server;proxy_connect_timeout 30s;proxy_timeout 300s;}
}
# 重启nginx并访问测试:
[root@Nginx ~]# nginx -s reload
#测试通过nginx负载连接MySQL:
[root@apache20 ~]# mysql -ulee -plee -h192.168.212.139 -e "select @@server_id"
+-------------+
| @@server_id |
+-------------+
| 10 |
+-------------+
[root@apache20 ~]# mysql -ulee -plee -h192.168.212.139 -e "select @@server_id"
+-------------+
| @@server_id |
+-------------+
| 20 |
+-------------+
#在192.168.212.10停止MySQL服务
[root@apache10 ~]# systemctl stop mariadb
#再次测试访问,只会看到mysql-server1.timingliu.org进行响应
[root@apache30 ~]# mysql -uliu -pliu -h192.168.212.139 -e "select @@server_id"
+-------------+
| @@server_id |
+-------------+
| 20 |
+-------------+
[root@apache30 ~]# mysql -uliu -pliu -h192.168.212.139 -e "select @@server_id"
+-------------+
| @@server_id |
+-------------+
| 20 |
+-------------+

6.4.3、udp 负载均衡实例: DNS

stream {upstream dns_server{server 192.168.212.10:53 max_fails=3 fail_timeout=30s;server 192.168.212.20:53 max_fails=3 fail_timeout=30s;}server {listen 192.168.212.139:53 udp;proxy_pass dns_server;proxy_timeout 1s;proxy_responses 1; # 使用UDP协议时,设置代理服务器响应客户端期望的数据报文数# 该值作为会话的终止条件error_log logs/dns.log;}
}测试:
[root@apache20 named]# dig www.timingliu.org @192.168.212.139; <<>> DiG 9.16.23 <<>> www.timingliu.org @192.168.212.139
;; global options: +cmd
;; Got answer:
;; ->>HEADER<<- opcode: QUERY, status: NOERROR, id: 33888
;; flags: qr aa rd ra; QUERY: 1, ANSWER: 1, AUTHORITY: 0, ADDITIONAL: 1;; OPT PSEUDOSECTION:
; EDNS: version: 0, flags:; udp: 1232
; COOKIE: 701447f1bdd8acea0100000066a27b465426b2b4bc7f1dc3 (good)
;; QUESTION SECTION:
;www.timingliu.org. IN A
;; ANSWER SECTION:
www.timingliu.org. 86400 IN A 172.25.254.20
;; Query time: 2 msec
;; SERVER: 172.25.254.10#53(172.25.254.10)
;; WHEN: Fri Jul 26 00:20:22 CST 2024
;; MSG SIZE rcvd: 90
[root@apache20 named]# dig www.timingliu.org @192.168.212.139
; <<>> DiG 9.16.23 <<>> www.timingliu.org @192.168.212.139
;; global options: +cmd
;; Got answer:
;; ->>HEADER<<- opcode: QUERY, status: NOERROR, id: 8932
;; flags: qr aa rd ra; QUERY: 1, ANSWER: 1, AUTHORITY: 0, ADDITIONAL: 1
;; OPT PSEUDOSECTION:
; EDNS: version: 0, flags:; udp: 1232
; COOKIE: 8ecb61bbfe2716df0100000066a27b47a3bb0c3d8e537858 (good)
;; QUESTION SECTION:
;www.timingliu.org. IN A
;; ANSWER SECTION:
www.timingliu.org. 86400 IN A 172.25.254.30;; Query time: 1 msec
;; SERVER: 192.168.212.139#53(172.25.254.10)
;; WHEN: Fri Jul 26 00:20:23 CST 2024
;; MSG SIZE rcvd: 90

6.5、实现 FastCGI

CGI的由来:

最早的Web服务器只能简单地响应浏览器发来的HTTP请求,并将存储在服务器上的HTML文件返回给浏 览器,也就是静态html文件,但是后期随着网站功能增多网站开发也越来越复杂,以至于出现动态技 术,比如像php(1995年)、java(1995)、python(1991)语言开发的网站,但是nginx/apache服务器并不 能直接运行 php、java这样的文件,apache实现的方式是打补丁,但是nginx缺通过与第三方基于协议实 现,即通过某种特定协议将客户端请求转发给第三方服务处理,第三方服务器会新建新的进程处理用户 的请求,处理完成后返回数据给Nginx并回收进程,最后nginx在返回给客户端,那这个约定就是通用网 关接口(common gateway interface,简称CGI),CGI(协议) 是web服务器和外部应用程序之间的接口 标准,是cgi程序和web服务器之间传递信息的标准化接口。

为什么会有FastCGI?

CGI协议虽然解决了语言解析器和 Web Server 之间通讯的问题,但是它的效率很低,因为 Web Server 每收到一个请求都会创建一个CGI进程,PHP解析器都会解析php.ini文件,初始化环境,请求结束的时候 再关闭进程,对于每一个创建的CGI进程都会执行这些操作,所以效率很低,而FastCGI是用来提高CGI性 能的,FastCGI每次处理完请求之后不会关闭掉进程,而是保留这个进程,使这个进程可以处理多个请 求。这样的话每个请求都不用再重新创建一个进程了,大大提升了处理效率。

什么是PHP-FPM?

PHP-FPM(FastCGI Process Manager:

        FastCGI进程管理器)是一个实现了Fastcgi的程序,并且提供进程管理的功能。

        进程包括master进程和worker进程。master进程只有一个,负责监听端口,接受来自web                 server 的请求。

        worker进程一般会有多个,每个进程中会嵌入一个PHP解析器,进行PHP代码的处理。

6.5.1、FastCGI配置指令

Nginx基于模块ngx_http_fastcgi_module实现通过fastcgi协议将指定的客户端请求转发至php-fpm处 理,其配置指令如下:

fastcgi_pass address:port;
#转发请求到后端服务器,address为后端的fastcgi server的地址,可用位置:location, if in locationfastcgi_index name;
# fastcgi默认的主页资源,示例:fastcgi_index index.php;fastcgi_param parameter value [if_not_empty];
# 设置传递给FastCGI服务器的参数值,可以是文本,变量或组合,可用于将Nginx的内置变量赋值给自定义
keyfastcgi_param REMOTE_ADDR $remote_addr; # 客户端源IP
fastcgi_param REMOTE_PORT $remote_port; # 客户端源端口
fastcgi_param SERVER_ADDR $server_addr; # 请求的服务器IP地址
fastcgi_param SERVER_PORT $server_port; # 请求的服务器端口
fastcgi_param SERVER_NAME $server_name; # 请求的server nameNginx默认配置示例:
location ~ \.php$ {root /scripts;fastcgi_pass 127.0.0.1:9000;fastcgi_index index.php;fastcgi_param SCRIPT_FILENAME /scripts$fastcgi_script_name; # 默认脚本路径#fastcgi_param SCRIPT_FILENAME $document_root$fastcgi_script_name;include fastcgi_params; # 此文件默认系统已提供,存放的相对路径为prefix/conf
}

6.5.2、FastCGI实战案例 : Nginx与php-fpm在同一服务器

编译安装更方便自定义参数或选项,所以推荐大家使用源码编译

官方网站:www.php.net

源码编译php

#利用yum解决php依赖
[root@Nginx ~]# yum install -y bzip2 systemd-devel libxml2-devel sqlite-devel
libpng-devel libcurl-devel oniguruma-devel
#解压源码并安装
[root@Nginx ~]# ./configure \
--prefix=/usr/local/php \ # 安装路径
--with-config-file-path=/usr/local/php/etc \ # 指定配置路径
--enable-fpm \ #用cgi方式启动程序
--with-fpm-user=nginx \ # 指定运行用户身份
--with-fpm-group=nginx \
--with-curl \ # 打开curl浏览器支持
--with-iconv \ # 启用iconv函数,转换字符编码
--with-mhash \ # mhash加密方式扩展库
--with-zlib \ # 支持zlib库,用于压缩http压缩传输
--with-openssl \ # 支持ssl加密
--enable-mysqlnd \ # mysql数据库
--with-mysqli \
--with-pdo-mysql \
--disable-debug \ # 关闭debug功能
--enable-sockets \ # 支持套接字访问
--enable-soap \ # 支持soap扩展协议
--enable-xml \ # 支持xml
--enable-ftp \ # 支持ftp
--enable-gd \ # 支持gd库
--enable-exif \ # 支持图片元数据
--enable-mbstring \ # 支持多字节字符串
--enable-bcmath \ # 打开图片大小调整,用到zabbix监控的时候用到了这个模块
--with-fpm-systemd # 支持systemctl 管理cgi

php相关配置优化

[root@Nginx ~]# cd /usr/local/php/etc
[root@Nginx etc]# cp php-fpm.conf.default php-fpm.conf
[root@Nginx etc]# vim php-fpm.conf去掉注释
pid = run/php-fpm.pid # 指定pid文件存放位置[root@Nginx etc]# cd php-fpm.d/
[root@Nginx php-fpm.d]# cp www.conf.default www.conf# 生成主配置文件
[root@Nginx php-fpm.d]# cd /root/php-8.3.9/
[root@Nginx php-8.3.9]# cp php.ini-production /usr/local/php/etc/php.ini
[root@Nginx ~]# vim /usr/local/php/etc/php.ini
[Date]
; Defines the default timezone used by the date functions
; https://php.net/date.timezone
date.timezone = Asia/Shanghai # 修改时区# 生成启动文件
[root@Nginx ~]# cd /root/php-8.3.9/
[root@Nginx php-8.3.9]# cp sapi/fpm/php-fpm.service /lib/systemd/system/
# Mounts the /usr, /boot, and /etc directories read-only for processes invoked by
this unit.
# ProtectSystem=full # 注释该内容
[root@Nginx php-8.3.9]# systemctl start php-fpm.service
[root@Nginx php-8.3.9]# netstat -antlupe | grep php
tcp 0 0 127.0.0.1:9000 0.0.0.0:* LISTEN 0
820758 176202/php-fpm: mas

准备php测试页面

[root@Nginx ~]# mkdir /data/php -p
[root@centos8 ~]# cat /data/php/index.php # php测试页面
<?phpphpinfo();
?>

Nginx配置转发

Nginx安装完成之后默认生成了与fastcgi的相关配置文件,一般保存在nginx的安装路径的conf目录当 中,比如/apps/nginx/conf/fastcgi.conf、/apps/nginx/conf/fastcgi_params。

[root@Nginx ~]# vim /apps/nginx/conf.d/php.conf
server {listen 80;server_name www.timingliu.org;root /data/php;location ~ \.php$ {fastcgi_pass 127.0.0.1:9000;fastcgi_index index.php;include fastcgi.conf;}
}
# 重启Nginx并访问web测试
[root@Nginx ~]# nginx -s reload

添加php环境变量

[root@Nginx ~]# vim .bash_profile
# .bash_profile# Get the aliases and functions
if [ -f ~/.bashrc ]; then. ~/.bashrc
fi
# User specific environment and startup programsPATH=$PATH:$HOME/bin:/apps/nginx/sbin:/usr/local/php/bin
export PATH
[root@Nginx ~]# source .bash_profile

6.5.3、php的动态扩展模块(php的缓存模块)

软件下载:http://pecl.php.net/package/memcache

安装memcache模块

[root@Nginx ~]# tar zxf memcache-8.2.tgz
[root@Nginx ~]# cd memcache-8.2/
[root@Nginx memcache-8.2]# yum install autoconf
[root@Nginx memcache-8.2]# phpize
[root@Nginx memcache-8.2]# ./configure && make && make install
Installing shared extensions: /usr/local/php/lib/php/extensions/no-debug-nonzts-20230831/
[root@Nginx memcache-8.2]# ls /usr/local/php/lib/php/extensions/no-debug-non-zts20230831/
memcache.so opcache.so

复制测试文件到nginx发布目录中

[root@Nginx ~]# cd memcache-8.2/
[root@Nginx memcache-8.2]# ls
autom4te.cache config.log configure.ac example.php Makefile.fragments
README
build config.m4 config.w32 include Makefile.objects runtests.php
config9.m4 config.nice CREDITS libtool memcache.la src
config.h config.status docker LICENSE memcache.php
tests
config.h.in configure Dockerfile Makefile modules[root@Nginx memcache-8.2]# cp example.php memcache.php /data/php/
[root@Nginx ~]# vim /data/php/memcache.php
define('ADMIN_USERNAME','admin'); // Admin Username
define('ADMIN_PASSWORD','liu'); // Admin Password
define('DATE_FORMAT','Y/m/d H:i:s');
define('GRAPH_SIZE',200);
define('MAX_ITEM_DUMP',50);$MEMCACHE_SERVERS[] = 'localhost:11211'; // add more as an array
#$MEMCACHE_SERVERS[] = 'mymemcache-server2:11211'; // add more as an array

配置php加载memcache模块

[root@Nginx ~]# vim /usr/local/php/etc/php.ini
;extension=zip
extension=memcache
;zend_extension=opcache
[root@Nginx ~]# systemctl reload php-fpm
[root@Nginx no-debug-non-zts-20230831]# php -m | grep mem
memcache

部署memcached

[root@Nginx ~]# yum install memcached -y
[root@Nginx ~]# systemctl enable --now memcached.service
[root@Nginx ~]# netstat -antlupe | grep memcache
tcp 0 0 127.0.0.1:11211 0.0.0.0:* LISTEN
976 1037243 186762/memcached
[root@Nginx ~]# cat /etc/sysconfig/memcached
PORT="11211"
USER="memcached"
MAXCONN="1024"
CACHESIZE="64"
OPTIONS="-l 127.0.0.1,::1"

测试

访问 http://php.timingliu.org/example.php 不断刷新
访问 http://php.timingliu.org/memcache.php 查看命中效果

性能对比

[root@apache10 ~]# ab -n500 -c10 http://www.timingliu.org/index.php
@@@内容忽略@@@
Concurrency Level: 10
Time taken for tests: 0.514 seconds
Complete requests: 500
Failed requests: 44(Connect: 0, Receive: 0, Length: 44, Exceptions: 0)[root@apache10 ~]# ab -n500 -c10 http://www.timingliu.org/example.php
@@@内容忽略@@@
Concurrency Level: 10
Time taken for tests: 0.452 seconds
Complete requests: 500
Failed requests: 0

6.5.4、php高速缓存

部署方法:

在我们安装的nginx中默认不支持memc和srcache功能,需要借助第三方模块来让nginx支持此功能,所以nginx需要重新编译。

[root@Nginx ~]# rm -fr /apps/nginx/
[root@Nginx ~]# tar zxf srcache-nginx-module-0.33.tar.gz
[root@Nginx ~]# tar zxf memc-nginx-module-0.20.tar.gz
[root@Nginx ~]# cd nginx-1.26.1/
[root@Nginx nginx-1.26.1]# ./configure --prefix=/apps/nginx --user=nginx --
group=nginx --with-http_ssl_module --with-http_v2_module --withhttp_realip_module --with-http_stub_status_module --with-http_gzip_static_module
--with-pcre --with-stream --with-stream_ssl_module --with-stream_realip_module --
add-module=/root/memc-nginx-module-0.20 --add-module=/root/srcache-nginx-module0.33[root@Nginx nginx-1.26.1]# make && make install
[root@Nginx ~]# vim /apps/nginx/conf.d/php.conf
upstream memcache {server 127.0.0.1:11211;keepalive 512;
}
server {listen 80;server_name www.timingliu.org;root /data/php;location /memc {internal;memc_connect_timeout 100ms;memc_send_timeout 100ms;memc_read_timeout 100ms;set $memc_key $query_string; # 使用内置变量$query_string来作为keyset $memc_exptime 300; # 缓存失效时间300秒memc_pass memcache;}location ~ \.php$ {set $key $uri$args; # 设定key的值srcache_fetch GET /memc $key; # 检测mem中是否有要访问的phpsrcache_store PUT /memc $key; # 缓存为加载的php数据fastcgi_pass 127.0.0.1:9000;fastcgi_index index.php;include fastcgi.conf;}
}
[root@Nginx ~]# systemctl start nginx.service

测试结果

[root@apache20 ~]# ab -n500 -c10 http://www.timingliu.org/index.php
Concurrency Level: 10
Time taken for tests: 0.255 seconds
Complete requests: 500
Failed requests: 0

七、Nginx二次开发版本

7.1、openresty

Nginx 是俄罗斯人发明的, Lua 是巴西几个教授发明的,中国人章亦春把 LuaJIT VM 嵌入到 Nginx 中, 实现了 OpenResty 这个高性能服务端解决方案。

OpenResty® 是一个基于 Nginx 与 Lua 的高性能 Web 平台,其内部集成了大量精良的 Lua 库、第三方 模块以及大多数的依赖项。用于方便地搭建能够处理超高并发、扩展性极高的动态 Web 应用、Web 服 务和动态网关。

OpenResty® 通过汇聚各种设计精良的 Nginx 模块(主要由 OpenResty 团队自主开发),从而将Nginx 有效地变成一个强大的通用 Web 应用平台。这样,Web 开发人员和系统工程师可以使用 Lua 脚本语言 调动 Nginx 支持的各种 C 以及 Lua 模块,快速构造出足以胜任 10K 乃至 1000K 以上单机并发连接的高 性能 Web 应用系统。

OpenResty 由于有功能强大且方便的的API,可扩展性更强,如果需要实现定制功能,OpenResty是个不错的 选择。

官网: http://openresty.org/cn/

7.2、编译安装 openresty

[root@Nginx ~]#dnf -yq install gcc pcre-devel openssl-devel perl
[root@Nginx ~]#useradd -r -s /sbin/nologin nginx
[root@Nginx ~]#cd /usr/local/src
[root@Nginx src]#wget https://openresty.org/download/openresty-1.17.8.2.tar.gz
[root@Nginx src]#tar xf openresty-1.17.8.2.tar.gz
[root@Nginx src]#cd openresty-1.17.8.2/
[root@Nginx openresty-1.17.8.2]#./configure \
--prefix=/apps/openresty \
--user=nginx --group=nginx \
--with-http_ssl_module \
--with-http_v2_module \
--with_http_realip_module \
--with-http_stub_status_module \
--with-http_gzip_static_module
--with-pcre --with-stream \
--with-stream_ssl_module \
--with-stream_realip_module[root@Nginx openresty-1.17.8.2]#make && make install[root@Nginx openresty-1.17.8.2]#ln -s /apps/openresty/bin/* /usr/bin/
[root@Nginx openresty-1.17.8.2]#openresty -v
nginx version: openresty/1.17.8.2[root@Nginx openresty-1.17.8.2]#openresty[root@Nginx openresty-1.17.8.2]#ps -ef |grep nginx
[root@Nginx ~]#curl 10.0.0.18

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/95204.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/95204.shtml
英文地址,请注明出处:http://en.pswp.cn/diannao/95204.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

《算法导论》第 16 章 - 贪心算法

大家好&#xff01;今天我们来深入探讨《算法导论》第 16 章的核心内容 —— 贪心算法。贪心算法是一种在每一步选择中都采取在当前状态下最好或最优&#xff08;即最有利&#xff09;的选择&#xff0c;从而希望导致结果是全局最好或最优的算法。它在许多优化问题中都有广泛应…

Redis面试精讲 Day 18:Redis网络优化与连接管理

【Redis面试精讲 Day 18】Redis网络优化与连接管理 开篇 欢迎来到"Redis面试精讲"系列第18天&#xff0c;今天我们将深入探讨Redis网络优化与连接管理技术。在分布式系统中&#xff0c;Redis的网络性能和连接管理直接影响整个系统的响应速度和稳定性。掌握这些优化…

Centos8系统在安装Git包时,报错:“没有任何匹配: git”

报错类型&#xff1a; sudo dnf install git Repository AppStream is listed more than once in the configuration Repository BaseOS is listed more than once in the configuration Repository extras is listed more than once in the configuration Repository fasttrac…

glide缓存策略和缓存命中

一 缓存策略 1 Glide 的 diskCacheStrategy() 一共有 5 种枚举值&#xff08;DiskCacheStrategy&#xff09;&#xff0c;每种的作用和区别如下&#xff1a;1. DiskCacheStrategy.ALL 作用&#xff1a;同时缓存原始图片&#xff08;原图数据&#xff09;和经过变换&#xff08;…

如何将PDF文档进行高效编辑处理!

PDF文件可以在任何设备上以相同的格式查看&#xff0c;无论操作系统或软件环境如何&#xff0c;可以确保修改后的文档仍然保持原有的布局和格式。它完全免费&#xff0c;下载后双击即可运行&#xff0c;无需安装&#xff0c;使用非常方便。它具备出色的文本编辑功能&#xff0c…

应用层模拟面试题

模拟面试-C第一题(开发音视频处理模块)在开发音视频处理模块时&#xff0c;FFmpeg资源&#xff08;AVFrame*&#xff09;需要自动释放。如何用unique_ptr定制删除器替代手动av_frame_free()&#xff1f;写出代码并解释RAII优势。参考答案&#xff1a;auto frame_deleter[](AVFr…

分享一款基于STC8H8K32U-45I-LQFP48单片机的4路数字量输入输出模块

4路数字量输入输出模块产品说明产品特性输入部分&#xff1a; 4路光耦隔离数字量输入通道支持NPN和PNP两种输入方式&#xff0c;可通过拨码开关切换输入电压范围&#xff1a;10-30VDC典型应用&#xff1a;可连接按钮开关、接近开关、光电传感器等数字信号设备输出部分&#xff…

redis常见的性能问题

Redis 的性能问题通常源于配置不当、数据结构误用、资源瓶颈或架构缺陷。以下是 Redis 常见的性能问题及优化方案&#xff0c;结合线上经验整理&#xff1a;&#x1f9e0; ​一、内存相关问题​​1. 内存不足&#xff08;OOM&#xff09;​​​现象​&#xff1a;OOM errors、响…

Blender 基础操作

基础操作 一、视角控制 ①旋转视角 &#xff1a; 拖动鼠标中键 ②平移视角 &#xff1a; shift 鼠标中键 ③放大\缩小 &#xff1a;鼠标滚轮 二、物体控制 1、重要 ① 移动物体 : G ② 旋转物体 : R ③ 缩放物体 : S 2、不重要 ④ 新建物体 : shift A ⑤ 复制物体 : shift D…

Go 语言三大核心数据结构深度解析:数组、切片(Slice)与映射(Map)

&#x1f680;Go 语言三大核心数据结构深度解析&#xff1a;数组、切片&#xff08;Slice&#xff09;与映射&#xff08;Map&#xff09; 在 Go 语言的开发领域&#xff0c;数组、切片与映射 这三大核心数据结构犹如构建程序的基石&#xff0c;支撑着各类数据的存储与处理。它…

《Webpack与Vite热模块替换机制深度剖析与策略抉择》

从早期简单的文件合并工具,到如今功能强大、高度自动化的Webpack和Vite,它们重塑了前端开发的流程与效率。而热模块替换(HMR, Hot Module Replacement)机制,作为其中关键的一环,更是成为开发者提升开发体验、加速项目迭代的秘密武器。Webpack,作为前端构建领域的先驱者,…

虚拟乐队“天鹅绒落日”:AI生成音乐引发的行业风暴

引言近日&#xff0c;音乐行业掀起了一阵关于一支名为“The Velvet Sundown”&#xff08;天鹅绒落日&#xff09;乐队的新闻热潮。原因何在&#xff1f;这支乐队很可能并非真正的乐队&#xff0c;其音乐也或许是由人工智能生成的。事实上&#xff0c;越来越多的共识认为&#…

c++ final override 关键字

1.finalfinal 防止子类继承&#xff0c;用于类或虚函数&#xff0c;限制继承或重写class Base final {}; // Base类不能被继承class Base { public:virtual void foo() final; // 禁止子类重写foo() };2.overrideoverride 子类中重写父类中函数&#xff0c;&#xff0c;仅用于…

剑桥大学最新研究:基于大语言模型(LLM)的分子动力学模拟框架,是MD的GPT时刻还是概念包装?

近期&#xff0c;剑桥大学 Michele Vendruscolo 团队在预印本平台上发布了一项最新研究&#xff0c;提出了一个名为 MD-LLM 的框架&#xff0c;旨在为高效研究蛋白质动态提供一种全新的思路。简单来说&#xff0c;他们希望借助大语言模型&#xff08;LLM&#xff09;&#xff0…

MySQL梳理:其他

MySQL数据库技术知识合集&#xff0c;涵盖InnoDB存储引擎的区管理机制、缓冲池机制等核心技术要点。本文档将持续补充MySQL相关的重要技术知识点。 &#x1f4cb; 目录 模块一&#xff1a;InnoDB区状态管理机制 1.1 核心设计思想1.2 四种区状态详解1.3 渐进式空间分配策略1.4…

影刀 —— 飞书电子表格

以获取列上第一个可用行为例我们需要获取的分别是 凭证 和 表格唯一标识首先来看如何获取凭证在飞书开发者后台创建应用然后添加权限发版拿App ID 和 App Secret下面来创建电子表格&#xff01;&#xff01;&#xff01;注意这个表格一定不要创建到知识库里面如果创建到知识库里…

1.二维图像处理(完整版)

目录 1.变换矩阵 2.在矩阵的基础上添加各种变换形式 3.开始变换 4.计算变换矩阵参数 新算子 二、阈值分割 新算子 三、blob分析案例 1.焊点 2.石头 3.木材 4.车牌 5.骰子 新算子 四、傅里叶变换频域分析 问题一 五、滤波处理 1.均值滤波 2.中值滤波 3.高斯…

【linux基础】Linux 文本处理核心命令指南

Linux 文本处理核心命令指南 文本处理是 Linux 系统管理的核心能力&#xff0c;约 80% 的配置文件操作都依赖于文本处理技术。本指南详细讲解 echo、重定向、cat、grep、wc 和 vim 等关键命令&#xff0c;涵盖从基础操作到高级技巧的完整知识体系&#xff0c;并配有实用案例演示…

基于深度学习YOLOv12的草莓成熟度检测系统(YOLOv12+YOLO数据集+UI界面+登录注册界面+Python项目源码+模型)https://www.bilibili.com/video/BV1

一、项目介绍 本项目构建了一套基于深度学习 YOLOv12 的草莓成熟度识别检测系统&#xff0c;旨在实现对草莓在不同成熟阶段的高精度、实时检测与分类。系统采用 YOLO 格式数据集&#xff0c;将草莓分为 3 个类别&#xff1a;生&#xff08;raw&#xff09;、半熟&#xff08;tu…

深入理解Android Kotlin Flow:响应式编程的现代实践

引言在现代Android开发中&#xff0c;处理异步数据流是一个核心需求。Kotlin Flow作为协程库的一部分&#xff0c;提供了一种声明式的、可组合的异步数据流处理方式。本文将深入探讨Flow的设计理念、核心组件、高级用法以及在实际项目中的最佳实践。一、Flow基础概念1.1 什么是…