发布网友 发布时间:2024-10-10 06:48
共1个回答
热心网友 时间:2024-10-29 00:38
收到个读者的问题,他在面试的时候,被搞懵了,因为面试官问了他这么一个网络问题:
不过这道网络题可能是提问的读者表述有问题,因为如果FIN报文比数据包先抵达客户端,此时FIN报文其实是一个乱序的报文,此时客户端的TCP连接并不会从FIN_WAIT_2状态转换到TIME_WAIT状态。
因此,我们要关注到点是看「在FIN_WAIT_2状态下,是如何处理收到的乱序到FIN报文,然后TCP连接又是什么时候才进入到TIME_WAIT状态?」。
我这里先直接说结论:
在FIN_WAIT_2状态时,如果收到乱序的FIN报文,那么就被会加入到「乱序队列」,并不会进入到TIME_WAIT状态。
等再次收到前面被网络延迟的数据包时,会判断乱序队列有没有数据,然后会检测乱序队列中是否有可用的数据,如果能在乱序队列中找到与当前报文的序列号保持的顺序的报文,就会看该报文是否有FIN标志,如果发现有FIN标志,这时才会进入TIME_WAIT状态。
我也画了一张图,大家可以结合着图来理解。
接下来,我带大家看看源码,听到要源码分析,可能有的同学就怂了。
其实要分析我们今天这个问题,只要懂ifelse就行了,我也会用中文来表述代码的逻辑,所以单纯看我的文字也是可以的。
这次我们重点分析的是,在FIN_WAIT_2状态下,收到FIN报文是如何处理的。
在Linux内核里,当IP层处理完消息后,会通过回调tcp_v4_rcv函数将消息转给TCP层,所以这个函数就是TCP层收到消息的入口。
处于FIN_WAIT_2状态下的客户端,在收到服务端的报文后,最终会调用tcp_v4_do_rcv函数。
接下来,tcp_v4_do_rcv方法会调用tcp_rcv_state_process,在这里会根据TCP状态做对应的处理,这里我们只关注FIN_WAIT_2状态。
在上面这个代码里,可以看到如果shutdown关闭了读方向,那么在收到对方发来的数据包,则会回复RST报文。
而我们这次的题目里,shutdown只关闭了写方向,所以会继续往下调用tcp_data_queue函数(因为caseTCP_FIN_WAIT2代码块里并没有break语句,所以会走到该函数)。
在上面的tcp_data_queue函数里,如果收到的报文的序列号是我们预期的,也就是有序的话:
会判断该报文有没有FIN标志,如果有的话就会调用tcp_fin函数,这个函数负责将FIN_WAIT_2状态转换为TIME_WAIT。
接着还会看乱序队列有没有数据,如果有的话会调用tcp_ofo_queue函数,这个函数负责检查乱序队列中是否有数据包可用,即能不能在乱序队列找到与当前数据包保持序列号连续的数据包。
而当收到的报文的序列号不是我们预期的,也就是乱序的话,则调用tcp_data_queue_ofo函数,将报文加入到乱序队列,这个队列的数据结构是红黑树。
我们的题目里,客户端收到的FIN报文实际上是一个乱序的报文,因此此时并不会调用tcp_fin函数进行状态转换,而是将报文通过tcp_data_queue_ofo函数加入到乱序队列。
然后当客户端收到被网络延迟的数据包后,此时因为该数据包的序列号是期望的,然后又因为上一次收到的乱序FIN报文被加入到了乱序队列,表明乱序队列是有数据的,于是就会调用tcp_ofo_queue函数。
我们来看看tcp_ofo_queue函数。
在上面的tcp_ofo_queue函数里,在乱序队列中找到能与当前报文的序列号保持的顺序的报文后,会看该报文是否有FIN标志,如果有的话,就会调用tcp_fin()函数。
最后,我们来看看tcp_fin函数的处理。
之前有不少同学问我,我是怎么看TCP源码的?
其实我看TCP源码,并不是直接打开Linux源码直接看,因为Linux源码实在太庞大了,如果我不知道TCP入口函数在哪,那简直就是大海捞针。
所以,在看TCP源码,我们可以去网上搜索下别人的源码分析,网上已经有很多前辈帮我们分析了TCP源码了,而且各个函数的调用链路,他们都有写出来了。
比如,你想了解TCP三次握手/四次挥手的源码实现,你就可以以「TCP三次握手/四次挥手的源码分析」这样关键字来搜索,大部分文章的注释写的还是很清晰,我最开始就按这种方式来学习TCP源码的。
网上的文章一般只会将重点的部分,很多代码细节没有贴出来,如果你想完整的看到函数的所有代码,那就得看内核代码了。
这里推荐个看Linux内核代码的在线网站:
elixir.bootlin.com/linux/latest/source
我觉得还是挺好用的,左侧各个版本的代码都有,右上角也可以搜索函数。
所以,我看TCP源码的经验就是,先在网上找找前辈写的TCP源码分析,然后知道整个函数的调用链路后,如果想具体了解某个函数的具体实现,可以在我说的那个看Linux内核代码的在线网站上搜索该函数,就可以看到完整的函数的实现。如果中途遇到看不懂的代码,也可以将这个代码复制到百度或者谷歌搜索,一般也能找到别人分析的过程。
学会了看TCP源码其实有助于我们分析一些异常问题,就比如今天这道网络题目,在网上其实是搜索不出答案的,而且我们也很难用实验的方式来模拟。
所以要想知道答案,只能去看源码。
本文分享自华为云社区《TCP四次挥手收到乱序的FIN包会如何处理?》,作者:小林coding