前言

之前的示例中，基于Linux的使用read&write函数完成数据I/O，基于Windows的则使用send&recv函数。这次的Linux示例也将使用send& recv函数，并讲解其与read&write函数相比的优点。还将介绍几种其他的I/O函数。

一、send & recv 函数

1.Linux 中的 send & recv

#include <sys/socket.h>
ssize_t send(int sockfd, const void * buf, size_t nbytes, int flags);
// 成功时返回发送的字节数，失败时返回-1。
// sockfd：表示与数据传输对象的连接的套接字文件描述符。
// buf：保存待传输数据的缓冲地址值。
// nbytes：待传输的字节数。
// flags：传输数据时指定的可选项信息。

#include <sys/socket.h>
ssize_t recv(int sockfd, void * buf, size_t nbytes, int flags);
// 成功时返回接收的字节数（收到EOF时返回0），失败时返回-1。
// sockfd：表示数据接收对象的连接的套接字文件描述符。
// buf：保存接收数据的缓冲地址值。
// nbytes：可接收的最大字节数。
// flags：接收数据时指定的可选项信息。

send函数和recv函数的最后一个参数是收发数据时的可选项。该可选项可利用位或（bitOR）
运算（运算符）同时传递多个信息。通过表查看选项的种类及含义。
可选项(Option) 含义 send recv
MSG_OOB 用于传输带外数据（Out-of-band data) * *
MSG_PEEK 验证输人缓冲中是否存在接收的数据 *
MSG_DONTROUTE 数据传输过程中不参照路由（Routing)表，在本地（Local)网络中寻找目的地 *
MSG_DONTWAIT 调用I/O函数时不阻塞，用于使用非阻塞（Non-blocking)I/O * *
MSG_WAITALL 防止函数返回，直到接收全部请求的字节数 *
另外，不同操作系统对上述可选项的支持也不同。因此，为了使用不同可选项，各位需要对实际开发中采用的操作系统有一定了解。下面选取表中的一部分（主要是不受操作系统差异影响的）进行详细讲解。

2.MSG_OOB：发送紧急消息

MSG_OOB可选项用于发送“带外数据”紧急消息。假设医院里有很多病人在等待看病，此时若有急诊患者该怎么办？
“当然应该优先处理。”
如果急诊患者较多，需要得到等待看病的普通病人的谅解。正因如此，医院一般会设立单独的急诊室。需紧急处理时，应采用不同的处理方法和通道。MSG_OOB可选项就用于创建特殊发送方法和通道以发送紧急消息。下列示例将通过MSG_OOB可选项收发数据。使用MSG_OOB时

#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <string.h>
#include <sys/socket.h>
#include <arpa/inet.h>#define BUF_SIZE 30
void error_handling(char *message);int main(int argc, char *argv[])
{int sock;struct sockaddr_in recv_adr;if(argc!=3) {printf("Usage : %s <IP> <port>\n", argv[0]);exit(1);}sock=socket(PF_INET, SOCK_STREAM, 0);memset(&recv_adr, 0, sizeof(recv_adr));recv_adr.sin_family=AF_INET;recv_adr.sin_addr.s_addr=inet_addr(argv[1]);recv_adr.sin_port=htons(atoi(argv[2]));if(connect(sock, (struct sockaddr*)&recv_adr, sizeof(recv_adr))==-1)error_handling("connect() error!");write(sock, "123", strlen("123"));send(sock, "4", strlen("4"), MSG_OOB);write(sock,"567",strlen("567"));send(sock, "890", strlen("890"), MSG_OOB);close(sock);return 0;
}void error_handling(char *message)
{fputs(message,stderr);fputc('\n', stderr);exit(1);
}

第29~32行：传输数据。第30和第32行紧急传输数据。正常顺序应该是123、4、567、890，但紧急传输了4和890，由此可知接收顺序也将改变。

从上述示例可以看出，紧急消息的传输比即将介绍的接收过程要简单，只需在调用send函数时指定MSG_OOB可选项。接收紧急消息的过程要相对复杂一些。

#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <string.h>
#include <signal.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <fcntl.h>#define BUF_SIZE 30
void error_handling(char*message);
void urg_handler(int signo);int acpt_sock;
int recv_sock;int main(int argc, char *argv[])
{struct sockaddr_in recv_adr, serv_adr;int str_len, state;socklen_t serv_adr_sz;struct sigaction act;char buf[BUF_SIZE];if(argc!=2){printf("Usage: %s <port>\n", argv[0]);exit(1);}act.sa_handler=urg_handler;sigemptyset(&act.sa_mask);act.sa_flags=0;acpt_sock=socket(PF_INET, SOCK_STREAM, 0);memset(&recv_adr, 0, sizeof(recv_adr));recv_adr.sin_family=AF_INET;recv_adr.sin_addr.s_addr=htonl(INADDR_ANY);recv_adr.sin_port=htons(atoi(argv[1]));if(bind(acpt_sock,(struct sockaddr*)&recv_adr, sizeof(recv_adr))==-1)error_handling("bind() error");listen(acpt_sock, 5);serv_adr_sz=sizeof(serv_adr);recv_sock=accept(acpt_sock, (struct sockaddr*)&serv_adr, &serv_adr_sz);fcntl(recv_sock, F_SETOWN, getpid());state=sigaction(SIGURG, &act, 0);while((str_len=recv(recv_sock, buf, sizeof(buf), 0))!= 0){if(str_len==-1)continue;buf[str_len]=0;puts(buf);}close(recv_sock);close(acpt_sock);return 0;
}void urg_handler(int signo)
{int str_len;char buf[BUF_SIZE];str_len=recv(recv_sock, buf, sizeof(buf)-1, MSG_OOB);buf[str_len]=0;printf("Urgent message: %s \n", buf);
}void error_handling(char *message){fputs(message, stderr);fputc('\n', stderr);exit(1);
}

第29、47行：该示例中需要重点观察SIGURG信号相关部分。收到MSG_OOB紧急消息时，操作系统将产生SIGURG信号，并调用注册的信号处理函数。另外需要注意的是，第61行的信号处理函数内部调用了接收紧急消息的recv函数。第46行：调用fcntl函数，关于此函数将单独说明。

上面的v示例中插人了未曾讲解的函数调用语句，关于此函数只讲解必要部分，过多的解释将脱离本章主题（之后将再次说明）。
fcntl(recv_sock, F_SETOwN, getpid(O));
fcntl函数用于控制文件描述符，上述调用语句的含义：
“将文件描述符recv_sock指向的套接字拥有者（F_SETOWN）改为把getpid函数返回值用作ID的进程。”
大家或许感觉“套接字拥有者”的概念有些生疏。操作系统实际创建并管理套接字，所以从严格意义上说，“套接字拥有者”是操作系统。只是此处所谓的“拥有者”是指负责套接字所有事务的主体。上面的描述可简要概括成这样：
“文件描述符recv_sock指向的套接字引发的SIGURG信号处理进程变为将getpid函数返回值用作ID的进程。”

当然，上述描述中的“处理SIGURG信号”指的是“调用SIGURG信号处理函数”。但之前讲过，多个进程可以共同拥有1个套接字的文件描述符。例如，通过调用fork函数创建子进程并同时复制文件描述符。此时如果发生SIGURG信号，应该调用哪个进程的信号处理函数呢？可以肯定的是，不会调用所有进程的信号处理函数（想想就知道这会引发更多问题）。因此，处理SIGURG
信号时必须指定处理信号的进程，而getpid函数返回调用此函数的进程ID。上述调用语句指定当前进程为处理SIGURG信号的主体。该程序中只创建了1个进程，因此，理应由该进程处理SIGURG信号。接下来先给出运行结果，再讨论剩下的问题。
在这里插入图片描述
输出结果可能出乎大家预料，尤其是如下事实令人极为失望：
“通过MSG_OOB可选项传递数据时只返回1个字节？而且也不是很快啊!”
的确！令人遗憾的是，通过MSG_OOB可选项传递数据时不会加快数据传输速度，而且通过信号处理函数urg_handler读取数据时也只能读1个字节。剩余数据只能通过未设置MSG_OOB可选项的普通输人函数读取。这是因为TCP不存在真正意义上的“带外数据”。实际上，MSG_OOB中的OOB是指Out-of-band，而“带外数据”的含义是：
“通过完全不同的通信路径传输的数据。”
即真正意义上的Out-of-band需要通过单独的通信路径高速传输数据，但TCP不另外提供，只利用TCP的紧急模式（Urgent mode）进行传输。

3.紧急模式工作原理

先给出结论，再补充说明紧急模式。MSG_OOB可选项可以带来如下效果：
– “嗨！这里有数据需要紧急处理，别磨蹭啦!” –
MSG_OOB的真正的意义在于督促数据接收对象尽快处理数据。这是紧急模式的全部内容，而且TCP“保持传输顺序”的传输特性依然成立。
“那怎能称为紧急消息呢!”
这确实是紧急消息！因为发送消息者是在催促数据处理的情况下传输数据的。急诊患者的及时救治需要如下两个条件：
■ 迅速入院
■ 医院急救
无法快速把病人送到医院，并不意味着不需要医院进行急救。TCP的紧急消息无法保证及时人院，但可以要求急救。当然，急救措施应由程序员完成。之前的示例oob_recv.c的运行过程中也传递了紧急消息，这可以通过事件处理函数确认。这就是MSG_OOB模式数据传输的实际意义。
在这里插入图片描述
send(sock, “890”, strlen(“890”), MSG_OOB);
如果将缓冲最左端的位置视作偏移量为0，字符0保存于偏移量为2的位置。另外，字符0右侧偏移量为3的位置存有紧急指针（UrgentPointer)。紧急指针指向紧急消息的下一个位置（偏移量加1)，同时向对方主机传递如下信息：
– “紧急指针指向的偏移量为3之前的部分就是紧急消息！” –
也就是说，实际只用1个字节表示紧急消息信息。
在这里插入图片描述
TCP数据包实际包含更多信息，但图中只标注了与我们的主题相关的内容。TCP头中含有如下两种信息：
■ URG=1：载有紧急消息的数据包
■ URG指针：紧急指针位于偏移量为3的位置
指定MSG_OOB选项的数据包本身就是紧急数据包，并通过紧急指针表示紧急消息所在位置。但通过图无法得知以下事实：
“紧急消息是字符串890，还是90?如若不是，是否为单个字符0?”
但这并不重要。如前所述，除紧急指针的前面1个字节外，数据接收方将通过调用常用输人函数读取剩余部分。换言之，紧急消息的意义在于督促消息处理，而非紧急传输形式受限的消息。

4.检查输入缓冲

同时设置MSG_PEEK选项和MSG_DONTWAIT选项，以验证输入缓冲中是否存在接收的数据。设置MSG_PEEK选项并调用recv函数时，即使读取了输人缓冲的数据也不会删除。因此，该选项通常与MSG_DONTWAIT合作，用于调用以非阻塞方式验证待读数据存在与否的函数。下面我们通过示例了解二者含义。

#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <string.h>
#include <sys/socket.h>
#include <arpa/inet.h>
void error_handling(char *message);int main(int argc, char *argv[])
{int sock;struct sockaddr_in send_adr;if(argc!=3) {printf("Usage : %s <IP> <port>\n", argv[0]);exit(1);}sock=socket(PF_INET,SOCK_STREAM,0);memset(&send_adr,0, sizeof(send_adr));send_adr.sin_family=AF_INET;send_adr.sin_addr.s_addr=inet_addr(argv[1]);send_adr.sin_port=htons(atoi(argv[2]));if(connect(sock, (struct sockaddr*)&send_adr, sizeof(send_adr))==-1)error_handling("connect() error!");write(sock,"123456789", strlen("123456789"));close(sock);return 0;
}void error_handling(char *message)
{fputs(message, stderr);fputc('\n', stderr);exit(1);
}

上述示例在第24行发起连接请求，第27行发送字符串123。下个例子给出了使用MSG_PEEK和MSG_DONTWAIT选项的结果。

#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <string.h>
#include <sys/socket.h>
#include <arpa/inet.h>#define BUF_SIZE 30
void error_handling(char *message);int main(int argc, char *argv[])
{int acpt_sock, recv_sock;struct sockaddr_in acpt_adr, recv_adr;int str_len, state;socklen_t recv_adr_sz;char buf[BUF_SIZE];if(argc!=2) {printf("Usage : %s <port>\n", argv[0]);exit(1);}acpt_sock=socket(PF_INET, SOCK_STREAM, 0);memset(&acpt_adr, 0, sizeof(acpt_adr));acpt_adr.sin_family=AF_INET;acpt_adr.sin_addr.s_addr=htonl(INADDR_ANY);acpt_adr.sin_port=htons(atoi(argv[1]));if(bind(acpt_sock, (struct sockaddr*)&acpt_adr, sizeof(acpt_adr))==-1)error_handling("bind() error");listen(acpt_sock, 5);recv_adr_sz=sizeof(recv_adr);recv_sock=accept(acpt_sock, (struct sockaddr*)&recv_adr, &recv_adr_sz);while(1){str_len=recv(recv_sock, buf,sizeof(buf)-1, MSG_PEEK|MSG_DONTWAIT);if(str_len>0)break;}buf[str_len]=0;printf("Buffering %d bytes: %s \n", str_len, buf);str_len=recv(recv_sock, buf, sizeof(buf)-1, 0);buf[str_len]=0;printf("Read again: %s \n",buf);close(acpt_sock);close(recv_sock);return 0;
}void error_handling(char *message)
{fputs(message, stderr);fputc('\n',stderr);exit(1);
}

第38行：调用recv函数的同时传递MSG_PEEK可选项，这是为了保证即使不存在待读取数据也不会进入阻塞状态。
第46行：再次调用recv函数。这次并未设置任何可选项，因此，本次读取的数据将从输入缓冲中删除。
在这里插入图片描述
通过运行结果可以验证，仅发送1次的数据被读取了2次，因为第一次调用recv函数时设置了MSG_PEEK可选项。以上就是MSG_PEEK可选项的功能啦！

二、readv & writev 函数

这次介绍的readv&writev函数有助于提高数据通信效率。先介绍这些函数的使用方法，再讨论其合理的应用场景哦。

1.使用readv & writev 函数

readv&writev函数的功能可概括如下：
“对数据进行整合传输及发送的函数。”
也就是说，通过writev函数可以将分散保存在多个缓冲中的数据一并发送，通过readv函数可以由多个缓冲分别接收。因此，适当使用这2个函数可以减少I/O函数的调用次数。下面先介绍writev函数。

#include <sys/uio.h>
ssize_t writev(int filedes, const struct iovec * iov, int iovcnt);
// 成功时返回发送的字节数，失败时返回-1。
// filedes：表示数据传输对象的套接字文件描述符。但该函数并不只限于套接字，因此，可以像read函数一样向其传递文件或标准输出描述符。
// iov：iovec结构体数组的地址值，结构体iovec中包含待发送数据的位置和大小信息。
// iovcnt：向第二个参数传递的数组长度。

可以看到，结构体iovec由保存待发送数据的缓冲（char型数组）地址值和实际发送的数据长度信息构成。
在这里插入图片描述
图13-4中writev的第一个参数1是文件描述符，因此向控制台输出数据，ptr是存有待发送数据信息的iovec数组指针。第三个参数为2，因此，从ptr指向的地址开始，共浏览2个iovec结构体变量，发送这些指针指向的缓冲数据。接下来仔细观察图中的iovec结构体数组。ptr[0]（数组第一个元素）的iov_base指向以A开头的字符串，同时iov_len为3，故发送ABC。而ptr[1]（数组的第二个元素）的iov_base指向数字1，同时iov_len为4，故发送1234。
相信大家已掌握writev函数的使用方法和特性，接下来栗子来了：

#include <stdio.h>
#include <sys/uio.h>int main(int argc, char *argv[])
{struct iovec vec[2];char buf1[]="ABCDEFG";char buf2[]="1234567";int str_len;vec[0].iov_base=buf1;vec[0].iov_len=3;vec[1].iov_base=buf2;vec[1].iov_len=4;str_len=writev(1, vec, 2);puts("");printf("Write bytes: %d \n", str_len);return 0;
}

第11、12行：写入第一个传输数据的保存位置和大小。
第13、14行：写入第二个传输数据的保存位置和大小。
第16行：writev函数的第一个参数为1，故向控制台输出数据。
在这里插入图片描述
下面介绍readv函数，它与writev函数正好相反：

#include <sys/uio.h>
ssize_t readv(int filedes, const struct iovec * iov, int iovcnt);
// 成功时返回接收的字节数，失败时返回-1。
// filedes：传递接收数据的文件（或套接字）描述符。
// iov：包含数据保存位置和大小信息的iovec结构体数组的地址值。
// iovcnt：第二个参数中数组的长度。

我们已经学习了writev函数，因此直接通过例子给出readv函数的使用方法。

#include <stdio.h>
#include <sys/uio.h>
#define BUF_SIZE 100int main(int argc, char *argv[])
{struct iovec vec[2];char buf1[BUF_SIZE]={0, };char buf2[BUF_SIZE]={0, };int str_len;vec[0].iov_base=buf1;vec[0].iov_len=5;vec[1].iov_base=buf2;vec[1].iov_len=BUF_SIZE;str_len=readv(0, vec, 2);printf("Read bytes: %d \n",str_len);printf("First message: %s \n",buf1);printf("Second message: %s \n",buf2);return 0;
}

第12、13行：设置第一个数据的保存位置和大小。接收数据的大小已指定为5，因此，无论buf1的大小是多少，最多仅能保存5个字节。
第14、15行：vec[0]中注册的缓冲中保存5个字节，剩余数据将保存到vec[1]中注册的缓冲。结构体iovec的成员iov_len中应写入接收的最大字节数。
第17行：「eadv函数的第一个参数为0，因此从标准输入接收数据。
在这里插入图片描述

2.合理使用 readv&writev函数

哪种情况适合使用readv和writev函数？实际上，能使用该函数的所有情况都适用。例如，需要传输的数据分别位于不同缓冲（数组）时，需要多次调用write函数。此时可以通过1次writev函数调用替代操作，当然会提高效率。同样，需要将输人缓冲中的数据读人不同位置时，可以不必多次调用read函数，而是利用1次readv函数就能大大提高效率。
即使仅从C语言角度看，减少函数调用次数也能相应提高性能。但其更大的意义在于减少数据包个数。假设为了提高效率而在服务器端明确阻止了Nagle算法。其实writev函数在不采用Nagle算法时更有价值。
这个示例中待发送的数据分别存在3个不同的地方，此时如果使用write函数则需要3次函数调用。但若为提高速度而关闭了Nagle算法，则极有可能通过3个数据包传递数据。反之，若使用writev函数将所有数据一次性写人输出缓冲，则很有可能仅通过1个数据包传输数据。所以writev函数和readv函数非常有用。
再考虑一种情况：将不同位置的数据按照发送顺序移动（复制）到1个大数组，并通过1次write函数调用进行传输。这种方式是否与调用writev函数的效果相同？当然！但使用writev函数更为便利。因此，如果遇到writev函数和readv函数的适用情况，希望大家不要错过机会。