Linux 阻塞与非阻塞

网络编程常见同步Sync /异步Async 阻塞Block/非阻塞Unblock四种调用方式

同步

在发出一个功能调用时没有得到结果之前该调用就不返回也就是事一件一件做一件做完了才做下一件事

异步

调用者不能立刻得到结果处理这个调用的部件在完成后通过状态通知和回调来通知调用者
ajax请求异步请求通过事件触发->服务器处理（这是浏览器仍然可以作其他事情）->处理完毕

阻塞

调用结果返回之前当前线程会被挂起（线程进入非可执行状态 cpu不会给线程分配时间片即线程暂停运行）函数只有在得到结果之后才会返回

非阻塞

在不能立刻得到结果之前该函数不会阻塞当前线程而会立刻返回
对象的阻塞模式和阻塞函数调用
对象是否处于阻塞模式和函数是不是阻塞调用有很强的相关性阻塞对象上可以有非阻塞的调用方式
可以通过一定的API去轮询状态在适当的时候调用阻塞函数就可以避免阻塞
而对于非阻塞对象调用特殊的函数也可以进入阻塞调用函数select就是这样的一个例子
1 同步调用一个功能该功能没有结束前我死等结果
2 异步调用一个功能不需要知道该功能结果该功能有结果后通知我（回调通知）
3 阻塞函数没有接收完数据或者没有得到结果之前我不会返回
4 非阻塞函数立即返回通过select通知调用者
同步IO和异步IO 区别数据拷贝的时候进程是否阻塞
阻塞IO和非阻塞IO 区别应用程序的调用是否立即返回

Linux下的五种I/O模型

阻塞I/O（blocking I/O）
非阻塞I/O （nonblocking I/O）
I/O复用(select 和poll) （I/O multiplexing）
信号驱动I/O （signal driven I/O (SIGIO)）
异步I/O （asynchronous I/O (the POSIX aio_functions)）
前四种都是同步只有最后一种才是异步IO

阻塞I/O模型

阻塞I/O模型在调用recv()/recvfrom（）函数时发生在内核中等待数据和复制数据的过程
调用recv()函数时系统首先查是否有准备好的数据如果数据没有准备好那么系统就处于等待状态当数据准备好后将数据从系统缓冲区复制到用户空间然后该函数返回在套接应用程序中调用recv()函数时未必用户空间就已经存在数据那么此时recv()函数就会处于等待状态
使用socket()函数和WSASocket()函数创建套接字时默认的套接字都是阻塞的
这意味着当调用Windows Sockets API不能立即完成时线程处于等待状态直到操作完成
并不是所有Windows Sockets API以阻塞套接字为参数调用都会发生阻塞
例如以阻塞模式的套接字为参数调用bind() listen()函数时函数会立即返回将可能阻塞套接字的Windows Sockets

API调用分为以下四种

1 输入 recv() recvfrom() WSARecv()和WSARecvfrom()函数阻塞套接字为参数调用该函数接收数据套接字缓冲区内没有数据可读则调用线程在数据到来前一直睡眠
2 输出 send() sendto() WSASend()和WSASendto()函数以阻塞套接字为参数调用该函数发送数据套接字缓冲区没可用空间线程一直睡眠直到有空间
3 接受连接 accept()和WSAAcept()函数以阻塞套接字为参数调用该函数等接受对方连接请求如果此时没有连接请求线程就会进入睡眠状态
4 外出连接 connect()和WSAConnect()函数对于TCP连接客户端以阻塞套接字为参数调用该函数向服务器发起连接该函数在收到服务器的应答前不会返回
TCP连接总会等待至少到服务器的一次往返时间
阻塞模式的套接字网络程序简单易实现当希望能立即发送和接收数据且处理的套接字数量比较少阻塞模式开发网络程序较合适

不足表现
大量建好的套接字线程间通信比较困难使用生产者-消费者模型开发网络程序为每个套接字分别分配读线程处理数据线程和同步的事件会加大系统开销
最大缺点是同时处理大量套接字无从下手扩展性差

非阻塞IO模型

通过进程反复调用IO函数（多次系统调用并马上返回）在数据拷贝的过程中进程是阻塞的

把 SOCKET接口设置为非阻塞就是告诉内核当所请求的I/O操作无法完成时不要将进程睡眠而是返回一个错误
这样的I/O操作函数将不断的测试数据是否已经准备好如果没有准备好继续测试直到数据准备好为止在这个不断测试的过程中会大量的占用CPU的时间

把SOCKET设置为非阻塞模式即通知系统内核在调用Windows Sockets API时不要让线程睡眠而应该让函数立即返回在返回时该函数返回一个错误代码
一个非阻塞模式套接字多次调用recv()函数的过程前三次调用recv()函数时内核数据还没有准备好因此该函数立即返回WSAEWOULDBLOCK错误代码
第四次调用recv()函数时数据已经准备好被复制到应用程序的缓冲区中 recv()函数返回成功指示应用程序开始处理数据

当使用socket()函数和WSASocket()函数创建套接字时默认是阻塞的
在创建套接字之后通过调用 ioctlsocket()函数将该套接字设置为非阻塞模式 Linux下函数 fcntl()
套接字设置为非阻塞模式后在调用Windows Sockets API函数时调用函数会立即返回大多数情况下这些函数调用都会调用“失败”
并返回WSAEWOULDBLOCK错误代码说明请求的操作在调用期间内没有时间完成通常应用程序需要重复调用该函数直到获得成功返回代码
并非所有的Windows Sockets API在非阻塞模式下调用都会返回WSAEWOULDBLOCK错误

例如以非阻塞模式的套接字为参数调用bind()函数时就不会返回该错误代码
当然在调用WSAStartup()函数时更不会返回该错误代码
因为该函数是应用程序第一调用的函数当然不会返回这样的错误代码
要将套接字设置为非阻塞模式除了使用ioctlsocket()函数之外还可以使用WSAAsyncselect()和WSAEventselect()函数
当调用该函数时套接字会自动地设置为非阻塞方式

由于使用非阻塞套接字在调用函数时会经常返回 WSAEWOULDBLOCK错误所以应仔细检查返回代码并作好对失败的准备应用程序连续不断地调用这个函数直到它返回成功指示为止上面的程序清单中在While循环体内不断地调用recv()函数以读入1024个字节的数据这种做法很浪费系统资源

要完成这样的操作较好的做法是使用套接字的 I/O模型来判断非阻塞套接字是否可读可写
非阻塞模式套接字与阻塞模式套接字相比不容易使用使用非阻塞模式套接字需要编写更多的代码以便在每个Windows Sockets API函数调用中对收到的WSAEWOULDBLOCK错误进行处理因此非阻塞套接字便显得有些难于使用
但是非阻塞套接字在控制建立的多个连接在数据的收发量不均时间不定时明显具有优势这种套接字在使用上存在一定难度但只要排除了这些困难它在功能上还是非常强大的通常情况下可考虑使用套接字的“I/O模型” 它有助于应用程序通过异步方式同时对一个或多个套接字的通信加以管理

IO复用模型

主要是select和epoll 对一个IO端口两次调用两次返回比阻塞IO并没有什么优越性关键是能实现同时对多个IO端口进行监听
I/O复用模型用到select poll epoll函数这几个函数会使进程阻塞但是和阻塞I/O所不同这两个函数可以同时阻塞多个I/O操作且同时对多个读操作多个写操作的I/O函数进行检测直到有数据可读或可写时才真正调用I/O操作函数

信号驱动IO

两次调用两次返回
允许套接口进行信号驱动I/O 安装一个信号处理函数进程继续运行不阻塞当数据准备好进程会收到一个SIGIO信号在信号处理函数调用I/O操作函数处理数据

异步IO模型

数据拷贝时进程无需阻塞当异步过程调用发出后调用者不能立刻得到结果实际处理这个调用的部件在完成后通过状态通知和回调调用者的输入输出操作
同步IO引起进程阻塞直至IO操作完成异步IO不会引起进程阻塞 IO复用是先通过 select调用阻塞

5个I/O模型的比较

select poll epoll简介
epoll 跟 select 提供多路I/O复用解决方案 Linux内核里支持 epoll是Linux所特有而select 应该是POSIX所规定一般操作系统均实现

select 本质 是通过设置或者检查存放fd标志位的数据结构进行下一步处理
缺点是
1 单个进程可监视 fd数量被限制即能监听端口的大小有限这个数目和系统内存关系很大具体数目 cat /proc/sys/fs/file-max察看 32位机默认 1024个 64位机默认是2048
2 对socket 扫描时是线性扫描即采用轮询的方法效率低套接字多的时候每次select()都要通过遍历FD_SETSIZE个Socket来完成调度不管哪个Socket是活跃的都遍历一遍浪费很多CPU时间如果能给套接字注册回调函数当他们活跃时自动完成相关操作就避免了轮询是epoll与kqueue做的
3 需要维护一个用来存放大量fd的数据结构使得用户空间和内核空间在传递该结构时复制开销大

poll 本质 和select没有区别将用户传入的数组拷贝到内核空间后查询每个fd对应的设备状态如果设备就绪则在设备等待队列中加入一项并继续遍历
如果遍历完所有fd后没有发现就绪设备则挂起当前进程直到设备就绪或者主动超时被唤醒后它又要再次遍历fd 这个过程经历了多次无谓的遍历
它没有最大连接数的限制原因是它是基于链表来存储的
同样有缺点
1 大量的fd的数组被整体复制于用户态和内核地址空间之间不管复制是不是有意义
2 poll还有一个特点是“水平触发” 如果报告了fd后没有被处理那么下次poll 会再次报告该fd

epoll
支持水平触发和边缘触发最大的特点在于边缘触发它只告诉进程哪些fd刚刚变为就需态并且只会通知一次还有一个特点是 epoll使用“事件”的就绪通知方式通过epoll_ctl注册fd 一旦该fd就绪内核就会采用类似callback的回调机制来激活该fd epoll_wait便可以收到通知
epoll的优点
1 没有最大并发连接的限制能打开的FD的上限远大于1024（1G的内存上能监听约10万个端口）
2 效率提升不是轮询的方式不会随着FD数目的增加效率下降只有活跃可用的FD才会调用callback函数
即Epoll最大的优点就在于它只管你“活跃”的连接而跟连接总数无关因此在实际的网络环境中 Epoll的效率就会远远高于select和poll
3 内存拷贝利用mmap()文件映射内存加速与内核空间的消息传递；即epoll使用mmap减少复制开销

select poll epoll 区别总结
1 支持一个进程所能打开的最大连接数
select    单个进程能打开的最大连接数有FD_SETSIZE宏定义其大小是32个整数的大小（在32位的机器上大小就是32*32 64位机器 FD_SETSIZE为32*64）可以进行修改然后重新编译内核但是性能可能会受到影响这需要进一步的测试
poll    poll本质上和select没有区别但是它没有最大连接数的限制原因是它是基于链表来存储的
epoll    虽然连接数有上限但是很大 1G内存的机器上可以打开10万左右的连接 2G内存的机器可以打开20万左右的连接
2 FD剧增后带来的IO效率问题
select    因为每次调用时都会对连接进行线性遍历所以随着FD的增加会造成遍历速度慢的“线性下降性能问题”
poll    同上
epoll    因为epoll内核中实现是根据每个fd上的 callback函数来实现的只有活跃的socket才会主动调用callback 所以在活跃socket较少的情况下使用epoll没有前面两者的线性下降的性能问题但是所有socket都很活跃的情况下可能会有性能问题
3 消息传递方式
select    内核需要将消息传递到用户空间都需要内核拷贝动作
poll    同上
epoll    epoll通过内核和用户空间共享一块内存来实现的
在选择select poll epoll时要根据具体的使用场合以及这三种方式的自身特点
1 表面上看epoll的性能最好但是在连接数少并且连接都十分活跃的情况下 select和poll的性能可能比epoll好毕竟epoll的通知机制需要很多函数回调
2 select低效是因为每次它都需要轮询但低效也是相对的视情况而定也可通过良好的设计改善

Linux 阻塞与非阻塞

同步

异步

阻塞

非阻塞

Linux下的五种I/O模型

阻塞I/O模型

API调用分为以下四种

非阻塞IO模型

IO复用模型

信号驱动IO

异步IO模型

5个I/O模型的比较

0篇笔记写笔记

尊贵的董事大人

Linux 阻塞与非阻塞

同步

异步

阻塞

非阻塞

Linux下的五种I/O模型

阻塞I/O模型

API调用分为以下四种

非阻塞IO模型

IO复用模型

信号驱动IO

异步IO模型

5个I/O模型的比较

0篇笔记写笔记

尊贵的董事大人

分类导航

Advertisement

微信关注