百摩网
当前位置: 首页 生活百科

深入理解linux网络技术内幕详情(网络协议从入门到底层原理)

时间:2023-08-13 作者: 小编 阅读量: 3 栏目名: 生活百科

在TCP/IP协议框架体系内,下层协议对上层协议透明,即上层协议无需关注下层协议的实现逻辑和机制。这里我们仅对Linux内核中网络层接收,发送以及转发数据的流程进行简单介绍。

1. 前言

本文主要对 Linux 系统内核协议栈中网络层接收,发送以及转发数据包的流程进行简要介绍,同时对 Netfilter 数据包过滤框架的基本原理以及使用方式进行简单阐述。

内容如有理解错误而导致说明错误的地方,还请指正。如存在引用而没有添加说明的,也请及时告知,非常感谢!

2. 基础网络知识

2.1 网络分层模型

OSI 模型中将网络划分为七层,但在目前实际广泛使用的 TCP/IP 协议框架体系内,我们一般将网络划分为五层,从下到上依次为物理层,链路层,网络层,传输层以及应用层。两者的区别在于 OSI 模型在应用层对数据包做了更细致的划分。两者的关系如下图所示:

图片来源:http://www.cnblogs.com/qishui/p/5428938.html

在 TCP/IP 协议框架体系的五层网络模型中,每一层负责处理的数据包协议或类型均存在差异,物理层主要负责在物理载体上的数据包传输,如 WiFi,以太网,光纤,电话线等;数据链路层主要负责链路层协议解析(主要为以太网帧,其他类型此处暂不考虑),网络层主要负责 IP 协议(包括 IPv4 和 IPv6)解析,传输层负责传输层协议解析(主要为 TCP,UDP 等),而传输层以上我们均归类为应用层,主要包括各类应用层协议,如我们常用的 HTTP,FTP,SMTP,DNS,DHCP 等。

在 TCP/IP 协议框架体系内,下层协议对上层协议透明,即上层协议无需关注下层协议的实现逻辑和机制。

2.2 数据包协议分层

在 TCP/IP 协议框架体系内,上层协议报文被作为下层协议的数据载荷(Data Payload),存储在下层协议的数据段区域中进行传输。结合这一特性,我们常见的几类网络协议嵌套关系如下图所示:

从上图我们可以清晰地看到各类协议之间的嵌套关系,如使用 HTTP 协议的应用 App1 在传输层封装在 TCP 协议中,TCP 协议在网络层又封装到 IP 协议中,最后交到数据链路层中。其他应用层 App 也类似。

网际报文控制协议(ICMP,使用该协议的 Ping 工具),以及网际组管理协议(IGMP,组播多播中的控制报文)是直接嵌套到 IP 数据包中,而不依赖于 TCP 或 UDP。

地址解析协议(ARP)和反解析协议(RARP)则是直接嵌套在数据链路层数据包中进行传输。

注:在本文中,我们只大概了解整体的网络框架,各协议的具体内容这里不做赘述。

2.3 sk_buff 结构

在 Linux 内核中,系统使用 sk_buff 数据结构对数据包进行存储和管理。在数据包接收过程中,该数据结构从网卡驱动收包开始,一直贯穿到内核网络协议栈的顶层,直到用户态程序从内核获取数据。使用图形表示 sk_buff 的结构如下:

在 sk_buff 数据结构中包含了诸多关于数据包存储,定位和管理的指针,数据包在网络协议栈各层次之间进行传输的过程中,内核通过操作指针的方式对数据包进行逐层解析,避免频繁的大数据段拷贝操作,从而提高数据包处理效率(但在某些特殊情况下依然会采用数据包拷贝操作)。

2.4 收发包整体框架

这里我们从客户端和服务端整体框架层面来看数据收发流程:

  • 用户态(User Space)程序 Client 向另一台主机上的 Server 发送数据,需要通过调用内核态(Kernel Space)提供给用户态的 Socket 抽象层接口发送数据;
  • Socket 抽象层接口收到用户态数据后,向下交给传输层接口(TCP 或 UDP);
  • 传输层负责创建 sk_buff,并将用户数据(应用层数据)填充到缓冲区,做合法性检查后,添加传输层头部,并通过网络层注册的接口将数据包交给网络层处理;
  • 网络层收到传输层数据包后,会查询路由表,决定数据包去向,如果是需要发出的数据包,会填充网络层头部,并交到内核虚拟网络接口设备的发送队列中;
  • 虚拟网络接口从发送队列获取数据,调用对应网卡驱动发送数据;

Server 端接收数据时,按照相反的过程从网卡驱动中将数据包一层层上交,直到通过 Socket 抽象层接口将用户数据上交到用户态 Server 进程处理。

3. 网络层(IPv4)收发包流程

数据包在实际现网传输过程中,会经过各类交换机,路由器的转发处理,在这个过程中,路由器一般只处理到网络层。这里我们仅对 Linux 内核中网络层接收,发送以及转发数据的流程进行简单介绍。

下图为基于 Linux 2.6.38 版本内核的网络层相关接口在数据包收发过程的调用逻辑图:

注:

1)不同版本内核在函数名上可能存在一定差异,但整体调用逻辑基本不变;

2)该图仅展示 IPv4 的处理流程,IPv6 不在该图的函数中处理,但整体流程基本相似;

3)该图展示的流程仅为普通单播并且未进行 IP 分片的数据包处理流程,组播,多播,IP 分片的数据包在某些流程上存在差异;

  • 从图中可以看到,*ip_rcv*函数为网络层向下层开放的入口,数据包通过该函数进入网络层进行处理,该函数主要对上传到网络层的数据包进行前期合法性检查,通过后交由 Netfilter 的钩子节点;
  • 绿色方框内的IP_PRE_ROUTING为 Netfilter 框架的 Hook 点,该节点会根据预设的规则对数据包进行判决并根据判决结果做相关的处理,比如执行 NAT 转换;
  • IP_PRE_ROUTING节点处理完成后,数据包将交由*ip_rcv_finish*处理,该函数根据路由判决结果,决定数据包是交由本机上层应用处理,还是需要进行转发;如果是交由本机处理,则会交由*ip_local_deliver*走本地上交流程;如果需要转发,则交由*ip_forward*函数走转发流程;
  • 在数据包上交本地的流程中,IP_LOCAL_INPUT节点用于监控和检查上交到本地上层应用的数据包,该节点是 Linux 防火墙的重要生效节点之一;
  • 在数据包转发流程中,Netfilter 框架的IP_FORWARD节点会对转发数据包进行检查过滤;
  • 而对于本机上层发出的数据包,网络层通过注册到上层的*ip_local_out*函数接收数据处理,处理 OK 进一步交由IP_LOCAL_OUT节点检测;
  • 对于即将发往下层的数据包,需要经过IP_POST_ROUTING节点处理;网络层处理结束,通过*dev_queue_xmit*函数将数据包交由 Linux 内核中虚拟网络设备做进一步处理,从这里数据包即离开网络层进入到下一层;

4. Netfilter 框架

Netfilter 是 Linux 内核中进行数据包过滤,连接跟踪(Connect Track),网络地址转换(NAT)等功能的主要实现框架;该框架在网络协议栈处理数据包的关键流程中定义了一系列钩子点(Hook 点),并在这些钩子点中注册一系列函数对数据包进行处理。这些注册在钩子点的函数即为设置在网络协议栈内的数据包通行策略,也就意味着,这些函数可以决定内核是接受还是丢弃某个数据包,换句话说,这些函数的处理结果决定了这些网络数据包的“命运”。

下图为 Netfilter 框架的整体组件图:

图片来源:http://wiki.dreamrunner.org/public_html/Linux/Networks/netfilter.html

从图中我们可以看到,Netfilter 框架采用模块化设计理念,并且贯穿了 Linux 系统的内核态和用户态。在用户态层面,根据不同的协议类型,为上层用户提供了不同的系统调用工具,比如我们常用的针对 IPv4 协议 iptables,IPv6 协议的 ip6tables,针对 ARP 协议的 arptables,针对网桥控制的 ebtables,针对网络连接追踪的 conntrack 等等。不同的用户态工具在内核中有对应的模块进行实现,而底层都需要调用 Netfilter hook API 接口进行实现。

从图中我们可以看到,我们常用的 Linux 防火墙工具 iptables 其实也是 Netfilter 框架中的一个组件。接下来我们就以 IPv4 为例,描述 iptables 在 Netfilter 框架中生效的基本原理,同时,我们也看一下如果我们希望在内核中添加我们自己的处理函数,我们该怎么做。

4.1 IPv4 网络层的 Netfilter Hook 点

在第二章已经提及,Linux 内核中,Netfiler 在网络层设置了多个 Hook 点,这里我们不考虑实际的处理函数,仅看 Netfilter 的钩子节点,从而将网络层处理流程进行简化,如下图:

其中,矩形方框中的即为 Netfilter 的钩子节点。从图中可以看到,三个方向的数据包需要经过的钩子节点不完全相同:

  • 发往本地:NF_INET_PRE_ROUTING–>NF_INET_LOCAL_IN
  • 转发:NF_INET_PRE_ROUTING–>NF_INET_FORWARD–>NF_INET_POST_ROUTING
  • 本地发出:NF_INET_LOCAL_OUT–>NF_INET_POST_ROUTING

4.2 iptables 工具

iptables 在用户态提供了表格和链的概念。包含的表格有 filter,nat,mangle 以及 raw。而每个表格下包含不同的链,如下图所示:

iptables 中每个表格的作用不同,以我们比较常用的 filter 表为例,其主要起到数据包过滤和拦截作用,包含 INPUT,FORWARD 和 OUTPUT 三个链,根据链的名字我们可以知道,这三个链分别被放置到 Netfilter 三个不同的钩子节点中生效。INPUT 链是在NF_INET_LOCAL_IN节点,FORWARD 链是在NF_INET_FORWARD节点,OUTPUT 链则是在NF_INET_LOCAL_OUT节点。其他表格的链也类似。

以如下 iptables 指令为例:

iptables -t filter -A INPUT -s 172.16.0.0/16 -p udp --dport 53 -j DROP

该指令是在 filter 表的 INPUT 链中添加一条过滤规则,凡是收到源地址为 172.16.0.0/16,传输层协议为 UDP 并且目的端口为 53 的数据包(即 DNS 数据包),都将该数据包丢弃。在 Linux 内核中,这一个指令会在 Netfilter 网络层NF_INET_LOCAL_IN节点生成处理操作,凡是经过这个钩子节点的数据包,在前面规则都通过的情况下,都必须经过这一规则的检查,如果符合这条规则的匹配条件,则该数据包会被丢弃;如果不符合,则进行下一条规则的匹配。

在 Linux 内核内部,使用 iptables 工具下发的指令规则,会存储在内核中的 Xtables 模块中,这部分内容这里不再深入分析。

4.3 Netfilter 重要数据结构及相关函数

  • 钩子点枚举类型

上面提到的网络层中 Netfilter 的几个钩子节点,在内核中是以枚举数据类型进行标记的。如下:

// include/linux/netfilter.henum nf_inet_hooks {NF_INET_PRE_ROUTING,NF_INET_LOCAL_IN,NF_INET_FORWARD,NF_INET_LOCAL_OUT,NF_INET_POST_ROUTING,NF_INET_NUMHOOKS};
  • 注册和解注册钩子函数
// include/linux/netfilter.h/* Function to register/unregister hook points. */int nf_register_hook(struct nf_hook_ops *reg);void nf_unregister_hook(struct nf_hook_ops *reg);int nf_register_hooks(struct nf_hook_ops *reg, unsigned int n);void nf_unregister_hooks(struct nf_hook_ops *reg, unsigned int n);

这些函数用于将自定义的钩子操作(struct nf_hook_ops)注册到指定的钩子节点中。

  • 钩子操作数据结构
// include/linux/netfilter.hstruct nf_hook_ops {struct list_head list;/* User fills in from here down. */nf_hookfn *hook;struct module *owner;u_int8_t pf;unsigned int hooknum;/* Hooks are ordered in ascending priority. */int priority;};

这个结构体中存储了自定义的钩子函数(nf_hookfn),函数优先级(priority),处理协议类型(pf),钩子函数生效的钩子节点(hooknum)等信息。

  • 钩子函数声明
// include/linux/netfilter.htypedef unsigned int nf_hookfn(unsigned int hooknum,struct sk_buff *skb,const struct net_device *in,const struct net_device *out,int (*okfn)(struct sk_buff *));

如果我们自己实现一个内核模块,该模块需要在 Netfilter 框架的几个钩子节点中对经过的数据包进行处理,则该内核模块需要向 Netfilter 中的钩子节点注册钩子函数,我们需要按照 nf_hookfn 函数的声明类型,提供我们自己的实现,再按照之前提供的注册接口将相关数据类型注册到内核中使之生效。

4.4 一个 Demo

如下为在网络上找到的一个内核模块 Demo,该模块的基本功能是将经过 IPv4 网络层 NF_INET_LOCAL_IN 节点的数据包的源 Mac 地址,目的 Mac 地址以及源 IP,目的 IP 打印出来。代码如下所示:

#include <linux/module.h>#include <linux/kernel.h>#include <linux/types.h>#include <linux/skbuff.h>#include <linux/ip.h>#include <linux/udp.h>#include <linux/tcp.h>#include <linux/netfilter.h>#include <linux/netfilter_ipv4.h>MODULE_LICENSE("GPLv3");MODULE_AUTHOR("SHI");MODULE_DESCRIPTION("Netfliter test");static unsigned intnf_test_in_hook(unsigned int hook, struct sk_buff *skb, const struct net_device *in,const struct net_device *out, int (*okfn)(struct sk_buff*));static struct nf_hook_ops nf_test_ops[] __read_mostly = {{.hook = nf_test_in_hook,.owner = THIS_MODULE,.pf = NFPROTO_IPV4,.hooknum = NF_INET_LOCAL_IN,.priority = NF_IP_PRI_FIRST,},};void hdr_dump(struct ethhdr *ehdr) {printk("[MAC_DES:%x,%x,%x,%x,%x,%x" "MAC_SRC: %x,%x,%x,%x,%x,%x Prot:%x]n", ehdr->h_dest[0],ehdr->h_dest[1],ehdr->h_dest[2],ehdr->h_dest[3], ehdr->h_dest[4],ehdr->h_dest[5],ehdr->h_source[0],ehdr->h_source[1], ehdr->h_source[2],ehdr->h_source[3],ehdr->h_source[4], ehdr->h_source[5],ehdr->h_proto);}#define NIPQUAD(addr)((unsigned char *)&addr)[0],((unsigned char *)&addr)[1],((unsigned char *)&addr)[2],((unsigned char *)&addr)[3]#define NIPQUAD_FMT "%u.%u.%u.%u"static unsigned intnf_test_in_hook(unsigned int hook, struct sk_buff *skb, const struct net_device *in,const struct net_device *out, int (*okfn)(struct sk_buff*)) {struct ethhdr *eth_header;struct iphdr *ip_header;eth_header = (struct ethhdr *)(skb_mac_header(skb));ip_header = (struct iphdr *)(skb_network_header(skb));hdr_dump(eth_header);printk("src IP:'"NIPQUAD_FMT"', dst IP:'"NIPQUAD_FMT"' n",NIPQUAD(ip_header->saddr), NIPQUAD(ip_header->daddr));return NF_ACCEPT;}static int __init init_nf_test(void) {int ret;ret = nf_register_hooks(nf_test_ops, ARRAY_SIZE(nf_test_ops));if (ret < 0) {printk("register nf hook failn");return ret;}printk(KERN_NOTICE "register nf test hookn");return 0;}static void __exit exit_nf_test(void) {nf_unregister_hooks(nf_test_ops, ARRAY_SIZE(nf_test_ops));}module_init(init_nf_test);module_exit(exit_nf_test);

该 Demo 网络上找到的 Demo 程序,地址:http://wiki.dreamrunner.org/public_html/Linux/Networks/netfilter.html

这个 Demo 程序是个内核模块,模块入口为module_init传入的init_nf_test函数。

init_nf_test函数中,其通过 Netfilter 提供的 nf_register_hooks 接口将自定义的nf_test_opt注册到钩子节点中。nf_test_optstruct nf_hook_ops类型的结构体数组,其内部包含了所有关键元素,比如钩子函数的注册节点(此处为NF_INET_LOCAL_IN)以及钩子函数(**nf_test_in_hook**)。

nf_test_in_hook函数内部,其检查每一个传递过来的数据包,并将其源 Mac 地址,目的 Mac 地址,源 IP 地址以及目的 IP 地址打印出来。最后返回NF_ACCEPT,将数据包交给下一个钩子函数处理。

4.5 NAT 和 conntrack

NAT(Network Address Translation)技术现如今被广泛应用于路由器等网络设备中,其在解决 IPv4 地址紧缺的问题上起到了至关重要的作用,但与此同时也存在一定的安全隐患。

而 conntrack(连接追踪)也是广泛应用于路由器网络设备中的模块,其根据数据包的五元组以及 NAT 的转换结果,记录每一条连接的状态,在提升设备转发效率上起到了很大的作用,但另一方面,记录连接信息需要消耗一部分资源,也会导致设备出现性能瓶颈。

5. 总结

Linux 网络协议栈是 Linux 内核中非常重要的子系统之一,虽然上层应用的开发维护工作极少涉及修改内核网络部分的工作,但了解其设计思想,基本工作原理,也可以为我们日常工作带来比较不少的帮助,特别是涉及到前后台网络交互,服务器网络性能相关的工作时。

这篇文章所涉及的内容也仅仅是 Linux 网络协议栈中网络层的极小一部分,如下为 Linux 内核中数据包流向的整体脉络图以及 Netfilter 的整体生效节点:

图片来源:http://wiki.dreamrunner.org/public_html/Linux/Networks/netfilter.html

从上图可以看到,除了在网络层,链路层中 Netfilter 也被广泛地应用,ebtables 是 Netfilter 提供给用户态的链路层配置接口(工具),其生效机制与 iptables 基本类似。

6. 扩展

这篇文章仅仅对 Linux 内核中网络层数据处理流程以及 Netfilter 基本原理进行简单介绍,在此基础上,关于 Linux 内核网络协议栈的其他技术还包括:

  • Linux TC(Traffic Control)模块:Linux 提供的 QoS 功能支持模块;
  • 网桥和 VLAN 技术;
  • Wireshark(tcpdump)等网络抓包工具的基本实现原理;

7. 参考

博客

  • Linux Netfilter and Traffic Control
  • OSI 七层模型与 TCP/IP 五层模型

书籍

  • 《TCP/IP 详解 卷 I:协议》
  • 《深入理解 Linux 网络技术内幕》
    推荐阅读
  • 万和安装燃气热水器收费标准(燃热水器售后满意度排名出炉)

    近日,东南亚标准化研究院顾客满意度测评中心发布了2021年第二批五类家电产品顾客满意度调查结果,引起不少人的关注,让售后服务满意度再度掀起了浪潮。提供1小时响应,24小时限时达送货、服务商配件快速供应等方式保证服务时效。正是有着快速反应、积极解决问题、为保障用户最大利益化的态度,让特维尔能在本次满意度中摘得桂冠。顺应信息化、智能化发展趋势,万家乐率先进行服务系统智能化建设。

  • 高梁的种植方法(你要了解)

    选地整地高粱根系发达吸水吸肥力强,宜选择平坦疏松较肥沃的地块种植播种前必须做到精细整地,将地耙平、耙细高粱忌连作,合理的轮作方式是高粱增产的关键高粱的理想前茬是大豆茬,其次是玉米茬、马铃薯茬等适宜的后茬最好是大豆茬、或与玉米、谷子轮作,我来为大家讲解一下关于高梁的种植方法?高粱的理想前茬是大豆茬,其次是玉米茬、马铃薯茬等。

  • 计春华因拍少林寺得病(曾饰演少林寺秃鹰等系列反面角色)

    计春华的嫂子汤女士,在电话里向封面新闻记者证实了计春华去世的消息。汤女士证实说:“兄弟计春华,因病于2018年7月11上午10时30分在杭州去世。7月13日上午,我们亲属将在杭州殡仪馆举行计春华遗体告别仪式及追悼会。”附:计春华演艺经历计春华,男,1961年7月20日出生于浙江杭州,中国武术演员。2016年,1月30日主演的动作喜剧电影《谢天谢地你来了》在全网正式上映。

  • 细胞生物学题库选择题(细胞生物学模拟试卷及答案)

    细胞生物学题库选择题?本科细胞生物学试卷专业_______________班级______________学号_______________姓名______________,下面我们就来说一说关于细胞生物学题库选择题?A.核仁是细胞核内由膜包围的结构B.有丝分裂期核仁的消失与核糖体合成的停止有关C.核仁DNA编码tRNA基因D.1个核仁相当于1个核仁组织区E.以上叙述均不正确33.影响膜质流动性的因素是磷脂分子脂肪酸链的不饱和程度。

  • 蜂蜜减肥效果(蜂蜜减肥的方法)

    下面更多详细答案一起来看看吧!蜂蜜减肥效果吃蜜糖之所以能减肥,是因为它含的热量很低,1kg的蜂蜜含有2940千卡的热量,只有同等分量白砂糖的75%,而且可以提供人体日常消耗的优质糖分、维生素以及矿物质等。蜂蜜的营养价值较高,含有丰富的维生素、纤维素以及微量元素,具有排毒养颜、抗菌消炎、促进肠胃蠕动的功效。

  • 那年花开月正圆吴聘非礼周莹(那年花开月正圆)

    两个周莹生命中最重要的男人,吴聘和沈星移,都已经出现并且表现出了对周莹的喜欢。第二次见面,是周莹为了逃避沈星移,仓皇钻进了吴聘的轿子里。可以说,是沈星移的棍棒,将自己心爱的女孩推进了吴聘的怀抱。踹了他一脚,就想逃走,结果,被沈星移的手下抓住,沈二少爷将周莹五花大绑,并且,还鞭打了周莹几下。周莹逃走了,从此,成为了沈星移永远的心病和爱恋。

  • 威少换首轮签了吗(威少在选秀大会当天请求交易)

    只是存在一个问题:湖人实现这一童话故事的努力一再被奇才拒绝将威斯布鲁克放入交易讨论的行为所阻挠,因为消息人士透露,奇才仍然计划继续推行威斯布鲁克和布拉德利-比尔的后场组合。假如交易没有达成,威斯布鲁克原本会打完剩余的两年合同。一位了解相关谈话的消息人士表示:“没人认为威斯布鲁克会离开。”几个星期以来,威斯布鲁克一直在告诉他身边的人,他终于要回家了。一位参与其中的消息人士表示。

  • 上海第一八佰伴购物中心(超出想象的大型逛吃潮玩种草现场)

    锡山八佰伴中心可真的让无锡东部片区的小伙伴们等太久了神秘面纱终于在今天展示惊艳颜值!还有320高品质品牌入驻其中4成以上为无锡首店!新白鹿、姚姚酸菜鱼、新发现、祖母的厨房、菊上、钱小奴、雨后行菜、小黄鸭茶楼、TunaMaki等均为无锡首店。新款网红打卡点逐个来撩来彩虹玻璃桥打卡“五感娱乐”是当天首批进入综合体的年轻潮人们最期待的“挑战”。

  • 小孩在幼儿园不合群怎么办(家长请看过来)

    小孩在幼儿园不合群怎么办?以下内容希望对你有帮助!平时自己有什么喜欢的玩具也要带到学校跟同学分享,要培养孩子的爱心,孩子跟小朋友在一块相处会更容易一些。在孩子上幼儿园之前,家长们就要多跟孩子交流一些关于相处的事情,只有学会融入到大集体中,孩子才会更开心,也更有利于孩子健康成长。

  • 背部肌肉锻炼八大动作(八大背部肌肉锻炼的动作)

    训练时腰背不够平直会损害脊椎,放在平凳上的手臂要保持肘关节微屈,放在地面上的腿保持膝关节微屈,动作太快会降低训练效果,幅度过大会增加身体扭动,增加受伤的可能性。从头上方位置垂直下拉横杠至胸前,沿原路缓慢还原,双臂可伸直,但肘关节应微屈,下拉时呼气,回放时吸气。俯身杠铃划船可以作为训练背部肌肉的重点动作,可以考虑在组数和组次上提高训练强度,建议每组12个,训练6组。