初识Linux · 五种IO模型和非阻塞IO-小浪学习网

前言：

在之前的讲解中，我们已经完成了网络基本原理的介绍。整个过程围绕TCP/IP四层协议展开，详细讲述了应用层、传输层、网络层以及数据链路层的相关内容。至于一些小主题，比如ARP欺骗、http协议的工作机制、Cookie与Session等细节，我们将在后续进行补充说明。

从本文开始，我们将重点转向IO相关的问题。通过了解不同的IO模型，逐步引出多路复用的核心概念，并深入讲解select、poll和epoll的实现方式，最终还会单独介绍Reactor模式。至此，关于网络的基本知识也将告一段落。

话不多说，我们直接进入对五种IO模型的解析。

提到IO这个话题，其实它贯穿了我们学习编程的各个阶段。从c语言中的printf和scanf函数，到文件操作中的read和write，再到linux系统中的文件描述符概念，甚至在网络通信中也频繁使用文件描述符，这些都体现了IO在编程中的重要地位。

那么问题来了，虽然我们一直将IO理解为输入输出，但其背后的过程远不止如此。以scanf为例，当程序运行到该函数时会处于阻塞状态，直到用户输入数据为止。这说明IO过程中存在一个“等待”的环节。

实际上，完整的IO操作包含两个核心部分：等待和拷贝。也就是说，只有当数据准备就绪（例如用户输入），系统才会将其从内核缓冲区复制到应用程序的缓冲区中。

目前我们所接触到的基本上都是阻塞IO，当然也存在其他类型的IO模型，我们将在下文中逐一介绍。值得一提的是，在mysql索引优化中提到的“减少IO次数”就是为了提升效率，而高效的IO正是通过降低“等待”在整个IO过程中的占比来实现的。

为了帮助理解，我们可以借助钓鱼的场景来类比五种IO模型：

接下来我们就具体来看每种模型的实际含义。

这是我们最熟悉的IO方式。像

read()

、

recvfrom()

、

scanf()

等函数默认都是阻塞调用。如果当前没有可用数据，程序会一直等待直到数据到达。若强行设置为非阻塞模式但未准备好数据，则返回错误码11（EAGaiN/EWOULDBLOCK）。

初识Linux · 五种IO模型和非阻塞IO

顾名思义，这种模型不会让进程长时间挂起。但它需要不断尝试读写操作（即轮询），因此可能会浪费大量CPU资源。适用于特定高并发场景。

初识Linux · 五种IO模型和非阻塞IO

通过注册信号处理函数（如SIGIO），当数据就绪时由内核主动通知应用程序。这种方式避免了持续轮询，但仍属于同步IO范畴。

初识Linux · 五种IO模型和非阻塞IO

本质上是阻塞IO的一种扩展形式，允许单个线程同时监听多个文件描述符。典型的实现包括

select()

、

poll()

和

epoll()

，它们能有效减少等待时间，是高性能服务器常用技术。

初识Linux · 五种IO模型和非阻塞IO

真正意义上的非阻塞IO。应用程序发起请求后立即返回，之后由操作系统完成数据准备和复制工作，并通过信号或回调通知应用程序。由于全程不阻塞主线程，因此称为异步。

初识Linux · 五种IO模型和非阻塞IO

在这五种模型中，IO多路复用因其高效性被广泛采用，也是我们后续重点研究的方向。

如果我们希望将原本阻塞的IO操作改为非阻塞模式，可以使用

fcntl()

函数修改文件描述符的状态标志位。例如：

void SetNoBlock() {     int n = ::fcntl(0, F_GETFL);     if (n < 0) {         // 错误处理     }     n |= O_NONBLOCK;     fcntl(0, F_SETFL, n); }

此时再次调用

read()

函数，如果没有可读数据，它将立刻返回-1并设置错误码为

EWOULDBLOCK

或

EAGAIN

，这两个宏值实际上是相同的（均为11）。

初识Linux · 五种IO模型和非阻塞IO

文章版权归作者所有，未经允许请勿转载。

THE END