Linux网络包从中断到接收的示例分析
这期内容当中小编将会给大家带来有关Linux网络包从中断到接收的示例分析,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。
linux
既然要讲,那就把一个包的整个包生都说了算了
触发中断
在非虚拟化环境下,网卡通过DMA将packet写入内核的rx_ring环形队列缓冲区,并触发中断。
如果在虚拟化环境下,VMM配置GIC ITS (Interrupt Translation Service) ,建立物理中断与虚拟中断的映射完成中断虚拟化使得网卡能直接向VM发出中断,同时通过IO虚拟化,网卡通过IOMMU将packet直接写入虚拟机内核的rx_ring
Top Half
CPU在收到中断之后,调用网卡ISR也就是所谓的中断handler
分配sk_buf并入input_pkt_queue(如果队列已满则丢弃)
发出一个软中断NET_RX_SOFTIRQ,软中断可以被调度例如通过tasklet
Bottom Half
sk_buf从input_pkt_queue传入process_queue,根据协议类型调用网络层协议的handler
ip_rcv执行包头检查,ip_router_input()进行路由,决定本机/转发/丢弃
tcp_v4_rcv执行包头检查,tcp_v4_lookup查询对应的socket和connection,如果正常,tcp_prequeue将skb放进socket接收队列
socket随即唤醒所在的进程
kqueue
因为epoll没有论文,就说说kqueue是怎么做的吧,kqueue会根据socket绑定的knote链表(每个监听的kqueue都可能创建一个knote),将knote通过反向指针获得kqueue,将knote加入kqueue的就绪队列末尾。如果此时恰好有进程正在监听的话,将会唤醒进程,kqueue会被扫描,并从就绪队列处获得所有的event,从而了解已经就绪的所有socket。
唤醒的进程调用socket recv系统调用,如果是TCP则调用tcp_recvmsg从sk_buffer拷贝数据
Batch
netif_receive_skb_list()
Linux的NAPI还会继续延迟软中断的处理,等待其积累足够的skb后进行轮询,一次性处理所有的skb。
SKB
skb并不是直接存储报文,而是存储指针,指针只需要移动,就能完成解包,而本身的报文并不需要修改。上一层的协议栈会在处理当前层的同时设置好下一层的头指针,并且移动data指针。与此同时,skb本身是双向链表实现的队列。qlen为链表元素长度,lock为添加元素时的锁。
skb结构
谈到指针的用法,这里举个做OS lab时印象深刻的奇淫巧技,也是C的指针变态的地方
#define list_entry(ptr, type, field) \ container_of(ptr, type, field) #define container_of(ptr, type, field) \ ((type *)((void *)(ptr) - (u64)(&(((type *)(0))->field))))
(u64)(&(((type *)(0))->field))))指的是field在结构体type中的偏移量,通过减去这个偏移量我们就能找出某个对象所在上级type对象的地址,也就是container。
一般来说,我们都会使用下面这样的方式,让链表节点去包裹数据。
struct page_list_node { struct page p; struct list_node *prev; struct list_node *next; };
但是,通过指针操作,却可以让数据去包裹链表节点
struct list_head { struct list_head *prev; struct list_head *next; }; struct page{ struct list_head list_node; }
在仅仅知道链表节点的情况下,借助成员偏移量即可知道容器对象的位置并取出
list_entry(somenode,struct page,list_node);
list_head本身可以存在于任何对象上,而他们的entry却能根据参数而指向不同的类型,感觉有点泛型的味道了。
内容来自SJTU,IPADS OS-16-Network
上述就是小编为大家分享的Linux网络包从中断到接收的示例分析了,如果刚好有类似的疑惑,不妨参照上述分析进行理解。如果想知道更多相关知识,欢迎关注行业资讯频道。