导航：首页 > 网络安全 >

IO多路复用--epoll

发表于：2024-11-26 作者：千家信息网编辑

千家信息网最后更新 2024年11月26日，epoll就是为了处理大批量句柄而改进的poll，相比与select,poll最大的好处在于它不会随着坚挺fd的数目增长而效率降低。因为在内核中的select是采用轮询来处理的，轮询fd的数目越多，

千家信息网最后更新 2024年11月26日IO多路复用--epoll

epoll就是为了处理大批量句柄而改进的poll，相比与select,poll最大的好处在于它不会随着坚挺fd的数目增长而效率降低。因为在内核中的select是采用轮询来处理的，轮询fd的数目越多，自然耗时越多，并且slelct的监听数目有限（虽然可以通过头文件来改变，但并不治本）

一.epoll的相关系统调用

epoll只有三个简单地接口分别为epoll_creat,epoll_ctl,epoll_wait

（1）int epoll_creat(int size)

创建一个epoll句柄，当创建好一个epoll句柄后，它就会占一个 fd值，所以在使用完以后要调用close()函数关闭，否则fd可能被耗尽

（2）int epoll_ctl(int epfd,int op,int fd,struct epoll_event* event)

epoll的事件注册函数，它不同于 select函数在监听事件的时候告诉内核要监听什么类型的事件，而是在这里先注册要监听的事件类型

第一个参数是epoll_creat的返回值

第二个参数表示动作，用三个宏来表示

EPOLL_CTL_ADD:注册新的fd到epfd中

EPOLL_CTL_MOD;修改已经注册到的fd的监听事件

EPOLL_CTL_DEL:从epfd中删除一个fd

第三个参数是要监听的fd

第四个参数告诉内核需要监听什么事件

event可以是以下几个宏的集合

EPOLLIN:表示对应的文件描述符可以读（包括对socket正常关闭）

EPOLLOUT:表示对应的文件描述符可以写

EPOLLPRI:表示对应的文件描述符有紧急的数据可读

EPOLLERR:对应的文件描述符发生错误

EPOLLET:将EPOLL设置为边沿除法模式，这是相对于水平触发而言

EPOLLONESET:只监听一次事件，如果之后还需要监听的话，需要再次把这个socket键入到EPOLL队列里

（3）int epoll_wait(int epfd,struct epoll_event* events,int maxevents,int timeout)

收集epoll监控的事件中已经发生的事件参数event是分配好的epoll_event结构体数组。epoll把发生的事件赋值到events数组中（events不可以是空指针，内核只负责把数据复制到数组中，但不会帮用户开辟内存），maxevents告诉这个内核有多大这个maxevents的值不能大于创建的epoll_ctreat()时的size,阐述timeout是超时事件（毫秒，0立即返回，-1将不确定，也就是永久阻塞）如果函数调用成功，返回对应已准备好的文件描述符数目，如果返回0表示超时

二. epoll工作原理

epoll只告诉那些就绪的文件描述符，而且当你调用epoll_wait()获得就绪文件描述符的时候，返回的不是实际的文件描述符，而是一个代表就绪描述符数量值，你只是需要去epoll指定的一个数组中一次获得相应数量的文件描述符即可。

另一个本质的改进在于epoll采用基于事件的就绪通知方式，在select/poll中进程只有在调用一定的方法之后，内核才对所有监视的文件描述符进行扫描，而epoll先通过采用epoll_ctl()来注册一个文件描述符，当进程调用epoll_wait（）时便得到通知。

三. epoll的工作方式-水平触发（LT）-边沿触发(ET)

LT(level triggered)是epoll缺省的工作方式，并且同时支持block和no-block socket.在这种做法中，内核告诉你一个文件描述符是否就绪了，然后你可以对这个就绪的fd进行IO操作。如果你不作任何操作，内核还是会继续通知你的，所以，这种模式编程出错误可能性要小一点。传统的select/poll都是这种模型的代表．

ET (edge-triggered)是高速工作方式，只支持no-block socket，它效率要比LT更高。ET与LT的区别在于，当一个新的事件到来时，ET模式下当然可以从epoll_wait调用中获取到这个事件，可是如果这次没有把这个事件对应的套接字缓冲区处理完，在这个套接字中没有新的事件再次到来时，在ET模式下是无法再次从epoll_wait调用中获取这个事件的。而LT模式正好相反，只要一个事件对应的套接字缓冲区还有数据，就总能从epoll_wait中获取这个事件。

因此，LT模式下开发基于epoll的应用要简单些，不太容易出错。而在ET模式下事件发生时，如果没有彻底地将缓冲区数据处理完，则会导致缓冲区中的用户请求得不到响应

四.epoll的优点

（1）支持一个进程打开大数目的socket描述符（FD）

select所能够打开的fd是有限的一般为1024，对于那些支持上万条链接数目的服务器来说太少了，epoll就没有这个限制，它所支持的FD上限是最大可以打开文件数目这个树种子一般大于2048；

（2）IO效率不随FD的数目增加而线性下降

传统的select/poll致命弱点是当拥有一个很大的集合的时候，每次都用都会轮询扫描集合，导致效率下降，但是epoll只对活跃的socket进行操作--因为在内核中epoll根据每个fd上面的callback函数实现的，只有活跃的函数才会调用 callback函数

五.linux下epoll如何处理百万句柄

（1）首先调用epoll_creat建立一个epoll对象，参数 size是内核保证能够正确处理的最大句柄数

（2）epoll_ctl操作上面建立好的epoll，例如让刚建立的socket加入到epoll中让其监控，或者把epoll正在监控的某个socke句柄移除epoll

（3）epoll_wait在给定的timeout时间内当监控的所有句柄发审核变化时就返回用户态进程（毫秒，0立即返回，-1将不确定，也就是永久阻塞）如果函数调用成功，返回对应已准备好的文件描述符数目，如果返回0表示超时

从上面调用方式可以看出epoll比select/poll的优越之处：因为后者每次调用时都会给你返回所要监控所有socket给select/poll系统调用，这意味着需要将用户态的socket列表拷贝到内核态，如果数以万计的句柄会导致每次都要copy几十几百KB的内存到内核态，非常低效，但epoll_wait不用传递socket句柄给内核，因为内核已经在 epoll_ctl中拿到了要监控的句柄列表

下面是代码部分

1.创建监听套接字，设置端口服用127.0.0.1 指定簇为 IPv4，指定端口号并转化为网络字节序列，指定ip地址并转化为网络字节序列

2.调用epoll_creat得到一个epoll模型，判断若创建成功，则调用epoll_ctl函数注册要监听事件的类型，本代码中设置的监听事件类型为EPOLLIN:表示对应的文件描述符可以读