百摩网
当前位置: 首页 生活百科

深入理解linux网络技术内幕详情(网络协议从入门到底层原理)

时间:2023-08-13 作者: 小编 阅读量: 1 栏目名: 生活百科

在TCP/IP协议框架体系内,下层协议对上层协议透明,即上层协议无需关注下层协议的实现逻辑和机制。这里我们仅对Linux内核中网络层接收,发送以及转发数据的流程进行简单介绍。

1. 前言

本文主要对 Linux 系统内核协议栈中网络层接收,发送以及转发数据包的流程进行简要介绍,同时对 Netfilter 数据包过滤框架的基本原理以及使用方式进行简单阐述。

内容如有理解错误而导致说明错误的地方,还请指正。如存在引用而没有添加说明的,也请及时告知,非常感谢!

2. 基础网络知识

2.1 网络分层模型

OSI 模型中将网络划分为七层,但在目前实际广泛使用的 TCP/IP 协议框架体系内,我们一般将网络划分为五层,从下到上依次为物理层,链路层,网络层,传输层以及应用层。两者的区别在于 OSI 模型在应用层对数据包做了更细致的划分。两者的关系如下图所示:

图片来源:http://www.cnblogs.com/qishui/p/5428938.html

在 TCP/IP 协议框架体系的五层网络模型中,每一层负责处理的数据包协议或类型均存在差异,物理层主要负责在物理载体上的数据包传输,如 WiFi,以太网,光纤,电话线等;数据链路层主要负责链路层协议解析(主要为以太网帧,其他类型此处暂不考虑),网络层主要负责 IP 协议(包括 IPv4 和 IPv6)解析,传输层负责传输层协议解析(主要为 TCP,UDP 等),而传输层以上我们均归类为应用层,主要包括各类应用层协议,如我们常用的 HTTP,FTP,SMTP,DNS,DHCP 等。

在 TCP/IP 协议框架体系内,下层协议对上层协议透明,即上层协议无需关注下层协议的实现逻辑和机制。

2.2 数据包协议分层

在 TCP/IP 协议框架体系内,上层协议报文被作为下层协议的数据载荷(Data Payload),存储在下层协议的数据段区域中进行传输。结合这一特性,我们常见的几类网络协议嵌套关系如下图所示:

从上图我们可以清晰地看到各类协议之间的嵌套关系,如使用 HTTP 协议的应用 App1 在传输层封装在 TCP 协议中,TCP 协议在网络层又封装到 IP 协议中,最后交到数据链路层中。其他应用层 App 也类似。

网际报文控制协议(ICMP,使用该协议的 Ping 工具),以及网际组管理协议(IGMP,组播多播中的控制报文)是直接嵌套到 IP 数据包中,而不依赖于 TCP 或 UDP。

地址解析协议(ARP)和反解析协议(RARP)则是直接嵌套在数据链路层数据包中进行传输。

注:在本文中,我们只大概了解整体的网络框架,各协议的具体内容这里不做赘述。

2.3 sk_buff 结构

在 Linux 内核中,系统使用 sk_buff 数据结构对数据包进行存储和管理。在数据包接收过程中,该数据结构从网卡驱动收包开始,一直贯穿到内核网络协议栈的顶层,直到用户态程序从内核获取数据。使用图形表示 sk_buff 的结构如下:

在 sk_buff 数据结构中包含了诸多关于数据包存储,定位和管理的指针,数据包在网络协议栈各层次之间进行传输的过程中,内核通过操作指针的方式对数据包进行逐层解析,避免频繁的大数据段拷贝操作,从而提高数据包处理效率(但在某些特殊情况下依然会采用数据包拷贝操作)。

2.4 收发包整体框架

这里我们从客户端和服务端整体框架层面来看数据收发流程:

  • 用户态(User Space)程序 Client 向另一台主机上的 Server 发送数据,需要通过调用内核态(Kernel Space)提供给用户态的 Socket 抽象层接口发送数据;
  • Socket 抽象层接口收到用户态数据后,向下交给传输层接口(TCP 或 UDP);
  • 传输层负责创建 sk_buff,并将用户数据(应用层数据)填充到缓冲区,做合法性检查后,添加传输层头部,并通过网络层注册的接口将数据包交给网络层处理;
  • 网络层收到传输层数据包后,会查询路由表,决定数据包去向,如果是需要发出的数据包,会填充网络层头部,并交到内核虚拟网络接口设备的发送队列中;
  • 虚拟网络接口从发送队列获取数据,调用对应网卡驱动发送数据;

Server 端接收数据时,按照相反的过程从网卡驱动中将数据包一层层上交,直到通过 Socket 抽象层接口将用户数据上交到用户态 Server 进程处理。

3. 网络层(IPv4)收发包流程

数据包在实际现网传输过程中,会经过各类交换机,路由器的转发处理,在这个过程中,路由器一般只处理到网络层。这里我们仅对 Linux 内核中网络层接收,发送以及转发数据的流程进行简单介绍。

下图为基于 Linux 2.6.38 版本内核的网络层相关接口在数据包收发过程的调用逻辑图:

注:

1)不同版本内核在函数名上可能存在一定差异,但整体调用逻辑基本不变;

2)该图仅展示 IPv4 的处理流程,IPv6 不在该图的函数中处理,但整体流程基本相似;

3)该图展示的流程仅为普通单播并且未进行 IP 分片的数据包处理流程,组播,多播,IP 分片的数据包在某些流程上存在差异;

  • 从图中可以看到,*ip_rcv*函数为网络层向下层开放的入口,数据包通过该函数进入网络层进行处理,该函数主要对上传到网络层的数据包进行前期合法性检查,通过后交由 Netfilter 的钩子节点;
  • 绿色方框内的IP_PRE_ROUTING为 Netfilter 框架的 Hook 点,该节点会根据预设的规则对数据包进行判决并根据判决结果做相关的处理,比如执行 NAT 转换;
  • IP_PRE_ROUTING节点处理完成后,数据包将交由*ip_rcv_finish*处理,该函数根据路由判决结果,决定数据包是交由本机上层应用处理,还是需要进行转发;如果是交由本机处理,则会交由*ip_local_deliver*走本地上交流程;如果需要转发,则交由*ip_forward*函数走转发流程;
  • 在数据包上交本地的流程中,IP_LOCAL_INPUT节点用于监控和检查上交到本地上层应用的数据包,该节点是 Linux 防火墙的重要生效节点之一;
  • 在数据包转发流程中,Netfilter 框架的IP_FORWARD节点会对转发数据包进行检查过滤;
  • 而对于本机上层发出的数据包,网络层通过注册到上层的*ip_local_out*函数接收数据处理,处理 OK 进一步交由IP_LOCAL_OUT节点检测;
  • 对于即将发往下层的数据包,需要经过IP_POST_ROUTING节点处理;网络层处理结束,通过*dev_queue_xmit*函数将数据包交由 Linux 内核中虚拟网络设备做进一步处理,从这里数据包即离开网络层进入到下一层;

4. Netfilter 框架

Netfilter 是 Linux 内核中进行数据包过滤,连接跟踪(Connect Track),网络地址转换(NAT)等功能的主要实现框架;该框架在网络协议栈处理数据包的关键流程中定义了一系列钩子点(Hook 点),并在这些钩子点中注册一系列函数对数据包进行处理。这些注册在钩子点的函数即为设置在网络协议栈内的数据包通行策略,也就意味着,这些函数可以决定内核是接受还是丢弃某个数据包,换句话说,这些函数的处理结果决定了这些网络数据包的“命运”。

下图为 Netfilter 框架的整体组件图:

图片来源:http://wiki.dreamrunner.org/public_html/Linux/Networks/netfilter.html

从图中我们可以看到,Netfilter 框架采用模块化设计理念,并且贯穿了 Linux 系统的内核态和用户态。在用户态层面,根据不同的协议类型,为上层用户提供了不同的系统调用工具,比如我们常用的针对 IPv4 协议 iptables,IPv6 协议的 ip6tables,针对 ARP 协议的 arptables,针对网桥控制的 ebtables,针对网络连接追踪的 conntrack 等等。不同的用户态工具在内核中有对应的模块进行实现,而底层都需要调用 Netfilter hook API 接口进行实现。

从图中我们可以看到,我们常用的 Linux 防火墙工具 iptables 其实也是 Netfilter 框架中的一个组件。接下来我们就以 IPv4 为例,描述 iptables 在 Netfilter 框架中生效的基本原理,同时,我们也看一下如果我们希望在内核中添加我们自己的处理函数,我们该怎么做。

4.1 IPv4 网络层的 Netfilter Hook 点

在第二章已经提及,Linux 内核中,Netfiler 在网络层设置了多个 Hook 点,这里我们不考虑实际的处理函数,仅看 Netfilter 的钩子节点,从而将网络层处理流程进行简化,如下图:

其中,矩形方框中的即为 Netfilter 的钩子节点。从图中可以看到,三个方向的数据包需要经过的钩子节点不完全相同:

  • 发往本地:NF_INET_PRE_ROUTING–>NF_INET_LOCAL_IN
  • 转发:NF_INET_PRE_ROUTING–>NF_INET_FORWARD–>NF_INET_POST_ROUTING
  • 本地发出:NF_INET_LOCAL_OUT–>NF_INET_POST_ROUTING

4.2 iptables 工具

iptables 在用户态提供了表格和链的概念。包含的表格有 filter,nat,mangle 以及 raw。而每个表格下包含不同的链,如下图所示:

iptables 中每个表格的作用不同,以我们比较常用的 filter 表为例,其主要起到数据包过滤和拦截作用,包含 INPUT,FORWARD 和 OUTPUT 三个链,根据链的名字我们可以知道,这三个链分别被放置到 Netfilter 三个不同的钩子节点中生效。INPUT 链是在NF_INET_LOCAL_IN节点,FORWARD 链是在NF_INET_FORWARD节点,OUTPUT 链则是在NF_INET_LOCAL_OUT节点。其他表格的链也类似。

以如下 iptables 指令为例:

iptables -t filter -A INPUT -s 172.16.0.0/16 -p udp --dport 53 -j DROP

该指令是在 filter 表的 INPUT 链中添加一条过滤规则,凡是收到源地址为 172.16.0.0/16,传输层协议为 UDP 并且目的端口为 53 的数据包(即 DNS 数据包),都将该数据包丢弃。在 Linux 内核中,这一个指令会在 Netfilter 网络层NF_INET_LOCAL_IN节点生成处理操作,凡是经过这个钩子节点的数据包,在前面规则都通过的情况下,都必须经过这一规则的检查,如果符合这条规则的匹配条件,则该数据包会被丢弃;如果不符合,则进行下一条规则的匹配。

在 Linux 内核内部,使用 iptables 工具下发的指令规则,会存储在内核中的 Xtables 模块中,这部分内容这里不再深入分析。

4.3 Netfilter 重要数据结构及相关函数

  • 钩子点枚举类型

上面提到的网络层中 Netfilter 的几个钩子节点,在内核中是以枚举数据类型进行标记的。如下:

// include/linux/netfilter.henum nf_inet_hooks {NF_INET_PRE_ROUTING,NF_INET_LOCAL_IN,NF_INET_FORWARD,NF_INET_LOCAL_OUT,NF_INET_POST_ROUTING,NF_INET_NUMHOOKS};
  • 注册和解注册钩子函数
// include/linux/netfilter.h/* Function to register/unregister hook points. */int nf_register_hook(struct nf_hook_ops *reg);void nf_unregister_hook(struct nf_hook_ops *reg);int nf_register_hooks(struct nf_hook_ops *reg, unsigned int n);void nf_unregister_hooks(struct nf_hook_ops *reg, unsigned int n);

这些函数用于将自定义的钩子操作(struct nf_hook_ops)注册到指定的钩子节点中。

  • 钩子操作数据结构
// include/linux/netfilter.hstruct nf_hook_ops {struct list_head list;/* User fills in from here down. */nf_hookfn *hook;struct module *owner;u_int8_t pf;unsigned int hooknum;/* Hooks are ordered in ascending priority. */int priority;};

这个结构体中存储了自定义的钩子函数(nf_hookfn),函数优先级(priority),处理协议类型(pf),钩子函数生效的钩子节点(hooknum)等信息。

  • 钩子函数声明
// include/linux/netfilter.htypedef unsigned int nf_hookfn(unsigned int hooknum,struct sk_buff *skb,const struct net_device *in,const struct net_device *out,int (*okfn)(struct sk_buff *));

如果我们自己实现一个内核模块,该模块需要在 Netfilter 框架的几个钩子节点中对经过的数据包进行处理,则该内核模块需要向 Netfilter 中的钩子节点注册钩子函数,我们需要按照 nf_hookfn 函数的声明类型,提供我们自己的实现,再按照之前提供的注册接口将相关数据类型注册到内核中使之生效。

4.4 一个 Demo

如下为在网络上找到的一个内核模块 Demo,该模块的基本功能是将经过 IPv4 网络层 NF_INET_LOCAL_IN 节点的数据包的源 Mac 地址,目的 Mac 地址以及源 IP,目的 IP 打印出来。代码如下所示:

#include <linux/module.h>#include <linux/kernel.h>#include <linux/types.h>#include <linux/skbuff.h>#include <linux/ip.h>#include <linux/udp.h>#include <linux/tcp.h>#include <linux/netfilter.h>#include <linux/netfilter_ipv4.h>MODULE_LICENSE("GPLv3");MODULE_AUTHOR("SHI");MODULE_DESCRIPTION("Netfliter test");static unsigned intnf_test_in_hook(unsigned int hook, struct sk_buff *skb, const struct net_device *in,const struct net_device *out, int (*okfn)(struct sk_buff*));static struct nf_hook_ops nf_test_ops[] __read_mostly = {{.hook = nf_test_in_hook,.owner = THIS_MODULE,.pf = NFPROTO_IPV4,.hooknum = NF_INET_LOCAL_IN,.priority = NF_IP_PRI_FIRST,},};void hdr_dump(struct ethhdr *ehdr) {printk("[MAC_DES:%x,%x,%x,%x,%x,%x" "MAC_SRC: %x,%x,%x,%x,%x,%x Prot:%x]n", ehdr->h_dest[0],ehdr->h_dest[1],ehdr->h_dest[2],ehdr->h_dest[3], ehdr->h_dest[4],ehdr->h_dest[5],ehdr->h_source[0],ehdr->h_source[1], ehdr->h_source[2],ehdr->h_source[3],ehdr->h_source[4], ehdr->h_source[5],ehdr->h_proto);}#define NIPQUAD(addr)((unsigned char *)&addr)[0],((unsigned char *)&addr)[1],((unsigned char *)&addr)[2],((unsigned char *)&addr)[3]#define NIPQUAD_FMT "%u.%u.%u.%u"static unsigned intnf_test_in_hook(unsigned int hook, struct sk_buff *skb, const struct net_device *in,const struct net_device *out, int (*okfn)(struct sk_buff*)) {struct ethhdr *eth_header;struct iphdr *ip_header;eth_header = (struct ethhdr *)(skb_mac_header(skb));ip_header = (struct iphdr *)(skb_network_header(skb));hdr_dump(eth_header);printk("src IP:'"NIPQUAD_FMT"', dst IP:'"NIPQUAD_FMT"' n",NIPQUAD(ip_header->saddr), NIPQUAD(ip_header->daddr));return NF_ACCEPT;}static int __init init_nf_test(void) {int ret;ret = nf_register_hooks(nf_test_ops, ARRAY_SIZE(nf_test_ops));if (ret < 0) {printk("register nf hook failn");return ret;}printk(KERN_NOTICE "register nf test hookn");return 0;}static void __exit exit_nf_test(void) {nf_unregister_hooks(nf_test_ops, ARRAY_SIZE(nf_test_ops));}module_init(init_nf_test);module_exit(exit_nf_test);

该 Demo 网络上找到的 Demo 程序,地址:http://wiki.dreamrunner.org/public_html/Linux/Networks/netfilter.html

这个 Demo 程序是个内核模块,模块入口为module_init传入的init_nf_test函数。

init_nf_test函数中,其通过 Netfilter 提供的 nf_register_hooks 接口将自定义的nf_test_opt注册到钩子节点中。nf_test_optstruct nf_hook_ops类型的结构体数组,其内部包含了所有关键元素,比如钩子函数的注册节点(此处为NF_INET_LOCAL_IN)以及钩子函数(**nf_test_in_hook**)。

nf_test_in_hook函数内部,其检查每一个传递过来的数据包,并将其源 Mac 地址,目的 Mac 地址,源 IP 地址以及目的 IP 地址打印出来。最后返回NF_ACCEPT,将数据包交给下一个钩子函数处理。

4.5 NAT 和 conntrack

NAT(Network Address Translation)技术现如今被广泛应用于路由器等网络设备中,其在解决 IPv4 地址紧缺的问题上起到了至关重要的作用,但与此同时也存在一定的安全隐患。

而 conntrack(连接追踪)也是广泛应用于路由器网络设备中的模块,其根据数据包的五元组以及 NAT 的转换结果,记录每一条连接的状态,在提升设备转发效率上起到了很大的作用,但另一方面,记录连接信息需要消耗一部分资源,也会导致设备出现性能瓶颈。

5. 总结

Linux 网络协议栈是 Linux 内核中非常重要的子系统之一,虽然上层应用的开发维护工作极少涉及修改内核网络部分的工作,但了解其设计思想,基本工作原理,也可以为我们日常工作带来比较不少的帮助,特别是涉及到前后台网络交互,服务器网络性能相关的工作时。

这篇文章所涉及的内容也仅仅是 Linux 网络协议栈中网络层的极小一部分,如下为 Linux 内核中数据包流向的整体脉络图以及 Netfilter 的整体生效节点:

图片来源:http://wiki.dreamrunner.org/public_html/Linux/Networks/netfilter.html

从上图可以看到,除了在网络层,链路层中 Netfilter 也被广泛地应用,ebtables 是 Netfilter 提供给用户态的链路层配置接口(工具),其生效机制与 iptables 基本类似。

6. 扩展

这篇文章仅仅对 Linux 内核中网络层数据处理流程以及 Netfilter 基本原理进行简单介绍,在此基础上,关于 Linux 内核网络协议栈的其他技术还包括:

  • Linux TC(Traffic Control)模块:Linux 提供的 QoS 功能支持模块;
  • 网桥和 VLAN 技术;
  • Wireshark(tcpdump)等网络抓包工具的基本实现原理;

7. 参考

博客

  • Linux Netfilter and Traffic Control
  • OSI 七层模型与 TCP/IP 五层模型

书籍

  • 《TCP/IP 详解 卷 I:协议》
  • 《深入理解 Linux 网络技术内幕》
    推荐阅读
  • 蜜汁熏鱼(蜜汁熏鱼怎么做)

    蜜汁熏鱼主料:青鱼250克。调料:大葱5克、姜3克、料酒8克、花生油20克、酱油3克、蜂蜜7克。将鱼段切成1厘米长厚片,用酱油、料酒腌渍半小时。坐锅点火倒油,九成热时逐个投入鱼块,炸至枣红色,鱼皮硬结时捞起,沥油。锅内留少许油,下入葱碎段、姜末、酱油、蜂蜜、料酒、少量水,烧至卤汁略稠,放入炸好的鱼块不断翻炒,至汤汁包住鱼块时,倒入碗内。食用时将鱼块改刀装盘,浇上卤汁即成。

  • 京东金融的白条怎么使用(京东呼吁大家正规使用白条等金融产品)

    相信大家都十分喜欢使用京东白条这个产品吧,“京东白条”作为京东推出的一款互联网消费金融产品,是“先消费,后付款”的全新支付方式。在京东商城使用京东白条进行付款,最长可以享有30天的延后付款期或最长24期的分期付款方式。

  • 6月份节日有哪些(6月有什么节日)

    6月份节日有哪些国际儿童节。国际儿童节定于每年的6月1日。为了悼念1942年6月10日的利迪策惨案和全世界所有在战争中死难的儿童,反对虐杀和毒害儿童,以及保障儿童权利。会议决定以每年的6月1日为国际儿童节。它是为了保障世界各国儿童的生存权、保健权和受教育权,抚养权,为了改善儿童的生活,为了反对虐杀儿童和毒害儿童而设立的节日。最广泛的日期在每年6月的第三个星期日,世界上有52个国家和地区是在这一天过父亲节。

  • nbcs网络用语(nbcs的解释)

    以下内容大家不妨参考一二希望能帮到您!nbcs网络用语nbcs最为网络语的该词是常见的饭圈用语,是nobodycares一词的字母缩写形式,意思为没有人关心、没人会在意。“nbcs”出处;该词最早出自于饭圈,走红的时间是在2018年,网络上有个吐槽如今饭圈多是字母缩写梗,隔圈如隔山,看个八卦都跟看火星文似的。

  • 原液的作用有哪些(关于原液的作用介绍)

    原液浓度比较高,护肤功效明显,添加剂极少,可以保证功效最大化,美中不足的是原液功能单一,一瓶原液只能补水或美白,不能二者兼得。所谓生化类护肤成分,是根据人体内随着时间流逝减少的成分,通过高科技模拟实验提取出来的成分,可以更好地补充人体流逝的护肤成分。

  • 4吨随车吊哪个厂家的好(8吨随车吊厂家哪家好)

    一般由载货汽车底盘、货厢、取力器、吊机组成。吊机可选徐工,中联,古河,三一,海沃,石煤,骏通,易发,程力,楚随,长兴等各个品牌吊机。三节伸缩,自动收购。可谓是吊机中的超长巨人臂。8吨随车吊8吨随车吊选择的厂家也比较多,购买随车吊尽量选择大品牌厂家,徐工,三一,石煤,古河,中联,骏通等随车吊出厂的吊机品牌,选择大型的随车吊生产基地。

  • 墙布上水彩笔如何清洗 墙布 水彩笔

    购买墙布时,商家一般都会提供专用的清洗剂或定期清洗服务,用这种清洗剂可以清洗墙布上水彩笔印记或其它污垢,并且不会对墙布的材质造成损伤,也不会影响墙布的颜色。颜色为白色或淡颜色的墙布还可以用牙膏来处理,只需要在有水彩笔印记的部位涂抹一点牙膏,再用牙刷蘸水不断刷洗,墙布上的水彩笔印就会慢慢变淡,甚至是完全清除。

  • 王牌对王牌第六季网(王牌对王牌第六季欢天喜地七仙女)

    像欢天喜地七仙女这种,给每一个仙女都编排一个恋爱故事,讲述七位仙女感情的剧却只有这一个。欢天喜地七仙女合体录制王牌剧中饰演七仙女紫儿的是霍思燕,这个角色真的让霍思燕成为了很多网友心目中的白月光。真的很期待欢天喜地七仙女参与的这一期王牌对王牌的播出,小伙伴们到时候搬好板凳一起看哟!

  • 黑暗之魂3新手武器推荐 黑魂三新手武器推荐

    实际上这个游戏的武器在PVE中的表现都差不多。之后是阔剑,初始面板不错,补正还行,一直是直剑面板最高的几个之一,但是实在短,不过呢,这货攻击时人物会有小位移,所以并没有想象中的那么短,但是不适合新人然后是骑士初始直剑,很均衡的直剑,可以一直用,但是并不很强势,洛骑直剑比较适合高周目,不推荐新人用,冰直和阔剑是一个动作模组,是单手直剑中最长的就是PVE有点废,太阳直剑,补正很高,可惜不能质变双王子的直剑。

  • 成都出发51小长假自驾旅游攻略(端午自驾精选10条路线)

    应急攻略这就跟到来!精选成都周边10条夏日自驾路线花海草原、雪山湖泊、森林峡谷…景区内有大天池、小天池、干池、高梁池和鱼池五大连池,呈带状分布,犹如五块碧玉散落人间,已统一建成免费的大瓦山国家湿地公园。穿越线路约180km,风景极其壮丽。整个大峡谷全长约26公里,谷底宽一般70至200米,但是谷深却达2600米,险峻壮丽,可与长江三峡及美国科罗拉多大峡谷媲美。俄么塘点缀于广阔川西草原上,6月花开,只等你来!