欢迎您访问 最编程 本站为您分享编程语言代码,编程技术文章!
您现在的位置是: 首页

我的计算机网络分布式结构系统 3

最编程 2024-04-25 22:48:40
...

特别声明:计算机网络内容主要取自于谢希仁老师的《计算机网络第七版》,这本书是自底向上的写作方式,正因自己是搞软件编程的,为了不受软件编程思维影响,故而选取此书。

 

网络层

网络层的内容不好写,比着人家的书逐字抄袭,我还没敢无耻到那种境界,刚想提笔又放下反复多次,主要因为网络层本身就很难搞,而且又处于传输层和数据链路层中间,承上启下之作用太有效果,稍不谨慎就划分不清层次,然后相互缠绕乱成一锅粥。

自从今年四月份确定最基础简陋的平台雏形稳定运行后,再加上领悟到分布式&微服务技术的精髓,持续N多年的我算是得到了释放,心态豁然开朗,精神也不再像以前一样紧张,说实话之前N年活的满压抑,担心智力和能力不足跟不上技术的发展,最终像大多数人被行业淘汰。虽然压力来自多个方面,不过还有一个方面的压力是可以共享给大家参考,就是我想做一个及格的人,讲故事了:我曾今想过如果我今天喜欢Winform开发,明天喜欢Web开发,后天喜欢数据库开发,大后天喜欢Android开发,那么依次下去可能穷尽我一生的时间都无法学完所有的计算机技术,而且我也永远不可能把其中的某一项技术修炼的运用自如(即及格)。所以后来我就想清楚了,坚守一门语言一门技术玩下去,然后以这条线为基准做深度和广度延展,从而实现既可以收获及格或接近满分的成绩,又可以与其他技术相结合(即入门其他技术,了解其他技术的设计思想)做到广度发散,最后由于已经练就深入法术,借而用于其他技术的深入又可事半功倍,事实证明这条路可以到达意大利的首都。

想要做所谓的大事,一定要首先从各个方面提升自己的内在,我虽然很讨厌孔夫子为首儒教的那套东西,但我认可“修身-齐家-治国-平天下”,因为它和“不谋万世者不足谋一时、不谋全局者不足某一域”是相同的道理。如果拆分开会发现这是一个加法运算,先是你自己,然后是家庭和家族,再然后是更大的组织机构,最后是天下,我一直坚信世上根本就不存在所谓的大事,那些所谓的大事都是由N多小事组织起来的,所以当我遇到加法运算时,我首先要做的事情是减法运算。就像网络层一样,算是OSI七层最复杂的一层,一定要从某个点进入,然后顺序展开串起来,最后出来的时候就有糖葫芦吃了。写在开头容易打脸,应该写到最后的小节处,算了,对于我这么不要脸的人来说,打就打呗,哈哈哈……。

由于写网络层的内容确实耗费了我不少心思,所以就多啰嗦啰嗦以为补偿,最近想了很多事情,主要原因是常年设计研发技术埋头于编程的空间里,不太懂得日常生活和人际交往中的人情世故,走过不少坎坷路、绕了许多个弯道。其实每隔一段时日都会反思往来,现在将近日总结的几条记录如下:1.做人还是糊涂点好,古人说过水至清则无鱼,倘若像做技术研发一定区分0和1,那么很多事情就无法做了。2.就像商业谈判能合作就合作,不能合作就等到能合作的时候再合作,江湖之事何曾有真正之绝对。3.没有大局观就没什么大事可言,没有对细节抽丝剥茧式把控意义必然于价值而无所获,基于现实不必困于现实。4.大中小,中庸之道最为迷人,何为中庸?我在局中局中无我,存在但不可见。5.在一个团队里,每个人都有其自己的行事风格和进退考量,而这些也决定了团队的价值以及可以创造出来的价值,只要团队的拥有者认可就好,没必要要求所有人都成为以一敌百的战神,创作出超预期的惊喜。

 

基础概念

  1. 直接交付:源主机与目的主机通信,分组传输和转发不经过任何路由器。
  2. 间接交付:源主机与目的主机通信,分组必须发送给路由器,经路由器转发才能到达目的主机。
  3. 网络号(net-id):它所指主机(或路由器)连接到的网络,一个网络号在整个互联网范围内必须是唯一的。
  4. 主机号(host-id):就是指一台计算机或路由器的编号,一台主机号在网络号所指明的网络范围内必须是唯一的。
  5. A类地址中的特殊地址
    1. 0.0.0.0:表示本网络,即本主机上所有的IP地址,比如在一台具有双网卡的服务器上部署服务,只需要将服务的IP:Port写出0.0.0.0:Port即可。
    2. 127.0.0.1:表示环回地址,主要用于本主机进程间的通信环回测试,不会将数据报发送到网络中去。
  6. 静态路由选择策略:也叫非自适应路由选择,特点是简单、开销小,但不能及时适应网络状态变化。对于很简单的小网络,完全可以采用静态路由选择,人工配置每一条路由。
  7. 动态路由选择策略:也叫自适应路由选择,特点能较好地适应网络状态的变化,但是实现起来较为复杂,开销也比较大,适用于较复杂的大网络。

 

网际协议IP

通过阅读各位神牛的著作以及文献资料,得知早期设计网络通信服务时有过争论,就是网络层应该向传输层提供面向连接的可靠服务,还是提供面向无连接的、简单灵活的、尽最大努力交付的不可靠服务。前者的典型就是有线电话机,后者就是今天的互联网,之所以选择后者来设计网络层,因为电话机非常简单,没有处理各种问题的能力,而计算机有很强的差错处理能力。基于电信网的电话通信的服务器造价很高,而网络层不提供服务质量承诺的设计造价就非常低了,而且能够适合各种应用场景,幻想如果互联网采用电信网的设计,今天你到ISP购买宽带服务,百兆/年的带宽至少要上万了,所以我们应当感谢当初前辈们的英明决策,下图是对上述两种网络服务的比较。

  

 虚拟互连网络

虚拟互连网络就是逻辑互联网络,这跟数据链路层中的链路和数据链路有点相似。现实世界中的物理网络由功能和性能各异的设备连接起来,所以计算机网络的通信过程非常复杂,既然如此可否让大家都使用相同的网络,很显然行不通,不论从消费者用户的需求分析,还是从设备制造厂商分析、通信技术发展分析、造价成本等各方面、各层面分析都不可行,即没有一种单一的网络能够适应所有用户的需求。以下按层次列出网络连接使用到的中间设备:

  1. 转发器(repeater):在物理层使用
  2. 桥接器(bridge):又称为网桥,在数据链路层使用
  3. 路由器(router):在网络层使用
  4. 网关(gateway):在网络层以上使用

网络互连是通过路由器实现的,所有参与互连的计算机网络都使用相同的网际协议IP,这样以来虽然物理网络中的设备功能和性能各异,但是从网络层上看起来好像是一个统一的网络。这样使用IP协议的虚拟互连网络可称为IP网,在IP网的上层使用TCP协议,就构成了现在的互联网(Internet),即互联网可以由多种异构网络互连组成。

 

分类的IP地址

首先说明这里说的IP地址是指IPv4,它由ICANN进行分配,在全世界范围内的联网主机都会被分配一个唯一的32位标识符。IP地址的编址方法经历了三个历史阶段:

1)   分类的IP地址:在1981年制定成为标准协议,是最基本的编址方法。

2)   子网的划分:在1985年制定成为标准,是对最基本编址方法的改进型。

3)   构成超网:在1993年提出后就得到快速推广应用,属于新的无分类编址方法。

本节为分类的IP地址就是将IP地址划分为若干个固定类别,每一类地址都由两个固定长度的字段组成,即 IP ::= {<网络号>,<主机号>},了解过网络号和主机号的定义后,可知一个IP地址在整个互联网范围内是唯一的。

 如上图所示,IP地址分为A\B\C\D\E五类,其中A\B\C三类IP都是单播地址(一对一通信),D类IP是多播地址(一对多通信)。五类地址的前面有长度不等的类别位,即标识所属类别。由于无分类IP地址的广泛应用,已经不再区分A类、B类和C类地址,不过为了更好的理解和了解技术发展的演进过程,所以还是要了解IP分类。

  

上图为分类IP地址可以指派的范围,下图为不使用的特殊IP地址或只能在特定情况下使用。对上述IP相关内容总结可以得出以下列表:

1)   每一个IP地址都由网络号和主机号两部分组成,即它是一种分等级的地址结构。这样做的好处有二,第一管理机构在分配IP地址时只分配网络号即可,剩下的主机号由购买网络号的单位自行分配和管理;第二路由器仅根据目的主机所连接的网络号来转发分组,减少路由表中路由项目所占的存储空间以及查找路由表消耗的时间。

2)   实际上IP地址是标识一台主机(或路由器)和一条链路的接口。如果一台主机同时连接到两个网络,该主机必须同时具有两个相应的IP地址,且网络号必须是不同的。比如路由器就连接两个网络。

3)   一个网络是指具有相同网络号net-id的主机集合,用转发器或网桥连接起来的若干个局域网仍为一个网络,因为这些局域网都具有同样的网络号。具有不同网络号的局域网必须使用路由器互连。

4)   在IP地址中,所有分配到网络号的网络都是平等的,即互联网同等对待每一个IP地址。

 

IP地址与MAC地址

由于网络层的IP数据报要向下交给数据链路层,然后由其转发出去,所以必须要搞清楚IP地址与MAC地址的区别。

1)   MAC地址是数据链路层和物理层使用的地址。而IP地址是网络层和以上各层使用的地址。

2)   MAC地址在网卡制造出厂时已固化在ROM中。而IP地址是逻辑地址,用软件实现的。

3)   在IP层抽象的互联网上只能看到IP数据报。虽然从源主机发送IP数据报到目的主机可能会经过多个路由器多次转发,但是IP数据报的首部中源地址和目的地址始终都是源IP和目的IP。

4)   虽然在IP数据报首部有源主机IP地址,但路由器只根据目的主机的IP地址的网络号进行路由选择。

5)   在局域网的链路层,只能看见MAC帧。IP数据报被封装在MAC帧中,MAC帧在不同网络上传送时,其首部中的源地址和目的地址是要发生变化的。比如主机H1经路由器R1,再经路由器R2,将IP数据报发给主机H2,简写为H1àR1àR2àH2,那么MAC帧首部的源地址和目的地址会经过以下变化过程:

       a)   从H1到R1,源地址:H1MAC1,目的地址:R1MAC1

       b)   从R1到R2,源地址:R1MAC2,目的地址:R2MAC1

       c)   从R2到H2,源地址:R2MAC2,目的地址:H2MAC1

             其中路由器内部实现从MAC1到MAC2的选择和转发。

6)   尽管互连在一起的网络的硬件地址体系各不相同,但IP层抽象的互联网却屏蔽了下层这些很复杂的细节。只要在网络层上讨论问题,就能够使用统一的、抽象的IP地址研究主机或路由器之间的通信。

 

地址解析协议ARP

如果按照“自顶向下”的方式分析OSI七层,那么ARP协议应该划分到数据链路层比较合适,但是按照“自底向上”的方式分析OSI七层,ARP协议自当归属网络层,因为ARP协议的主要目的是依据IP地址查找其对应的MAC地址,使用者是网络层。还有一个旧的协议叫做逆地址解析协议RARP,它的作用正好与ARP协议相反,即根据自己的硬件地址找出IP地址,位于应用层的DHCP协议就包含RAEP协议的功能。

 ARP协议是如何工作的呢?具体过程如下:

1)   首先要知道ARP协议主要工作在本局域网。

2)   每一台主机都有一个ARP高速缓存区域,里面有一张映射表,记录本局域网中各主机和路由器的IP地址到MAC地址的映射关系。

3)   ARP程序会定期在局域网上以广播形式发送ARP请求分组,更新维护映射表中的记录。

4)   虽然ARP程序是以广播形式发送请求分组,但是ARP响应分组是普通的单播形式,即一对一。

5)   ARP程序发送请求分组时会携带自己的MAC地址,主要便于响应程序直接使用,这样就不用反过来向ARP请求主机询问MAC地址。

6)   映射表中的记录都有生存时间,超时就会被删除,从而保证不会向使用者提供无效的MAC地址。

 

IP数据报的格式

 上图是IP数据报的格式,分为首部和数据部分,数据部分没什么好说的,主要分析首部各字段的意义,因为它们决定了IP协议的功能。

1)   版本,占4位,指IP协议的版本。通信双方必须使用相同的IP协议,这里主要指IPv4,即4。

2)   首部长度,占4位,可表示的最大十进制数值是15,单位是32位字长,即1=32,2=2*32。因为IP首部的固定长度是20字节,8位一个字节,所以首部长度字段的最小值是5。当首部长度为最大值1111时,就表明首部长度达到最大值15个32位字长,即60字节。
当IP数据报的首部长度不是4字节的整数倍时,必须利用最后的填充字段加以填充,这样IP数据报的数据部分永远在4字节的整数倍时开始。
首部长度限制为60字节的缺点是有时不够用,但常用的首部长度是20字节,此时不使用可变部分字段。

3)   区分服务,占8位,用来获得更好的服务。一般情况下不使用这个字段。

4)   总长度,它是指首部和数据部分之和的长度,单位为字节。总长度字段为16位,因此数据报的最大长度位216-1=65535字节。然而实际上不会传递这么长的数据报,因为网络层的下一层数据链路层规定了数据帧的数据字段的最大长度,即最大传送单元MTU,超过MTU最大值就需要对数据报进行分片处理。
IP数据报不是越长越好,越长传输效率得到了提高,但是路由器的转发速度就慢了。因此IP协议规定:在互联网中的所有主机和路由器,必须能够接收长度不超过576字节的数据报。576字节的由来:数据部分长度512,IP首部最大长度60,加上4字节的富余量。

5)   标识(identification),占16位。IP程序在存储器中维持一个计数器,每产生一个数据报,计数器就+1,并将此值赋给标识字段。因为网络层是无连接服务,所以这个标识并不是序号,而是分组。在数据链路层,当数据报的长度超过MTU而必须分片时,这个标识字段的值就被复制到所有的数据报片的标识字段中,然后接收端就可以按照相同的标识字段值重装为原来的数据报。

6)   标志(flag),占3位,但目前只有两位有意义。

a)   标志字段中的最低位记为MF(More Fragment)。MF=1即标识后面“还有分片”的数据报;MF=0表示这已是若干数据报片中的最后一个。

b)   标志字段中间的一位记为DF(Don’t Fragment),意思是“不能分片”。只有当DF=0时才允许分片。

7)   片偏移,占13位。较长的数据报在分片后,某片在原分组中的相对位置,也就是相对于用户数据字段的起点,该片从何处开始。片偏移以8个字节为偏移单位,也就是说每个分片的长度一定是8字节的整数倍。

a)   举例:一个数据报的总长度为3820字节,数据部分为3800字节,需要分片为长度不超过1420字节的数据报片。
分析:1.因为总长度3820,数据部分3800说明,首部长度为20字节。2.因为数据报片长度不超过1420字节,所以数据部分最大为1400。3.综合1和2可得,数据报分3片,数据部分长度分别是1400、1400、1000。
结果:数据报片1,总长度1420,片偏移0
      数据报片2,总长度1420,片偏移1400/8=175
      数据报片3,总长度1000,片偏移175+1400/8=175+175=350

8)   生存时间,占8位。Time To Live简称TTL,表明数据报在网络中的寿命,由发出数据报的源点设置,作用是防止无法交付的数据报无限制地在互联网中兜圈子,白白消耗网络资源。
最初设计TTL的单位是秒,每经过一个路由器,就把TTL减去数据报在路由器所消耗掉的一段时间。若数据报在路由器消耗的时间小于1秒,就把TTL值减1。当TTL值减为零时,就丢弃这个数据报。
后来TTL的单位是:跳数,因为技术的发展和进步,路由器处理数据报的时间不断缩短,一般都远远小于1秒,所以就把TTL字段的功能改为“跳数限制”,但名称不变。这就意味着数据报在互联网中至多可以经过多少个路由器。

9)   协议,占8位。它指出数据报携带的数据是那种协议,以便使目的主机的IP层知道应将数据部分上交给哪个协议进行处理。

  10)  首部检验和,占16位。这个字段的值是数据报首部的检验值,不包含数据部分,这样做是为了减少计算的工作量。数据报每经过一个路由器,路由器都要重新计算首部检验和(生存时间、标志、片偏移等都可能发生变化)。

 为了提升效率,IP首部的检验和不采用复杂的CRC算法,而是采用反码算术运算。其过程如下图:

11)  源地址,占32位。

12)  目的地址,占32位。

13)  可变部分,最多占40个字节。主要用来支持排错、测量以及安全等措施。可变部分基本上不被使用,像新版的IPv6首部不存在可变部分。

 

IP层转发分组的流程

一直都说源主机发出的网络IP数据报需经路由器转发,才能最终到达目的主机,那么路由器是怎么转发分组的呢?在了解转发过程之前,首先了解以下路由器中的路由表是如何管理网络信息的:

1)  路由表中记录的不是从当前路由器到达目的主机的信息,而是从当前路由器到达目的主机所属网络的下一跳地址。如下图,以R3路由器为例的路由表信息:

 

  通过对上图示例分析可以得出以下结论:

a)   IP数据报最终一定可以找到目的主机所在目的网络上的路由器。

b)   只有到达最后一个路由器时,才试图向目的主机进行直接交付。

2)   所有的分组转发都是基于目的主机所在的网络,但是也有特例,即在路由表中指定到达主机A应该将分组转发给下一跳地址,即不用计算主机A所在的网络,这种路由叫做特定主机路由。采用这种特定主机路由可使网络管理人员更方便地控制网络和测试网络。特定主机路由,目的网络地址=主机A的IP地址,地址掩码=255.255.255.255,下一跳地址就是你指定的下一跳路由器IP地址。

3)   除了特定主机路由之外,路由表中还有一条默认路由,它的好处是减少了路由表所占用的空间和搜索路由表所用的时间。如果1)中的图片里的R1连接ISP,而其他路由器属于内网,那么R1路由表里的记录势必如下:

这样的结构感觉好像存在优化的地方,就是采用默认路由将间接交付的5条记录合而为一,如下图:

分析了路由表以及路由表中特殊路由后,现在看一下分组的转发过程:当路由器收到一个待转发的数据报,根据目的网络地址从路由表中计算得出下一跳路由器的IP地址,之后将分组送交到数据链路层的网络接口软件。网络接口软件负责把下一跳路由器的IP地址转换成MAC地址,并将MAC地址放在链路层的MAC帧的首部,然后根据这个MAC地址找到下一跳路由器。下一跳路由器接收到分组,重复执行上述过程,直到找到并将分组交给目的主机。

 

按照上述转发过程路由表里存储MAC地址就可以实现分组转发,为什么还要搞出一个IP地址出来?因为使用IP地址的主要目的就是为了屏蔽底层网络的复杂性,以便分析和研究问题,如果直接在路由表中使用MAC地址会出现更多麻烦,如这样以来就很难区分网络层次结构了。现在将分组转发归纳如下:

1)   从数据报的首部提取目的主机的IP地址D,得出目的网络地址N。

2)   若N就是与此路由器直接相连的某个网络地址,则进行直接交付,不需要再经过其他的路由器,直接把数据报交付目的主机;否则继续。

3)   若路由表中有目的地址为D的特定主机路由,则把数据报传送给路由表中所指明的下一跳路由器;否则继续。

4)   若路由表中有到达网络N的路由,则把数据报传送给路由表中所指明的下一跳路由器;否则继续。

5)   若路由表中有一个默认路由,则把数据报传送给路由表中所指明的默认路由器;否则继续。

6)   报告转发分组出错。

 

子网与超网

划分子网

 1.   从两级IP地址到三级IP地址

 在ARPANET早期设计的IP地址不够合理具有以下缺陷:

a)   IP地址空间的利用率有时很低。比如有的单位申请到一个B类地址,但是所连接的主机数并不多,可是又不愿意申请一个足够使用的C类地址,这就造成IP地址的浪费,使互联网管理机构可分配的IP地址资源过早地用完。

b)   给每一个物理网络分配一个网络号会使路由表变得太大因而使网络性能变坏。路由表中的记录存储的是<目的网络地址,下一跳地址>,如果网络号过多就会使路由表中的记录增多,不仅需要增加成本购买更大的存储空间,还会使路由查找耗时过多。同时路由器间定期交换的路由信息急剧增加,使整个互联网的性能都下降。

c)   两级IP地址不够灵活。在紧急情况下,一个单位希望能够灵活的增加本单位的网络,而不必事先到互联网管理机构去申请新的网络号,这种场景下两级IP地址是做不到的。

 为了解决上述问题,从1985年起在IP地址中又增加了一个“子网号”字段,使两级IP地址变成三级IP地址,这种做法叫做划分子网,或子网寻址或子网路由选择。划分子网的基本思路如下:

1)   一个拥有许多物理网络的单位,可将所属的物理网络划分为若干个子网。划分子网纯属一个单位内部的事情,本单位以外的网络看不见这个网络是由多少个子网组成,因为这个单位对外仍然表现为一个网络。

2)   划分子网的方法是从网络的主机号借用若干位作为子网号,当然主机号也就相应减少了同样的位数。于是两级IP地址在本单位内部就变成为三级IP地址:网络号、子网号和主机号,记为:IP地址::={<网络号>,<子网号>,<主机号>}

3)   凡是从其他网络发送给本单位某台主机的IP数据报,仍然是根据IP数据报的目的网络号找到连接在本单位网络上的路由器。但此路由器在收到IP数据报后,再按目的网络号和子网号找到目的子网,把IP数据报交付目的主机。

  

2.   子网掩码

划分子网之后面临一个问题,假定有一个数据报(其目的地址是145.13.3.10)已经达到了路由器R1,那么这个路由器如何把它转发到子网145.13.3.0呢?因为IP地址本身以及数据报的首部都没有包含任何有关子网划分的信息,所以无法从IP数据报的首部看出源主机或目的主机所连接的网络是否进行了子网划分。这个时候就需要引入子网掩码(subnet mask)解决这个问题。

互联网标准规定:所有的网络都必须使用子网掩码,同时在路由器的路由表中也必须有子网掩码这一栏。如果一个网络不划分子网,那么该网络的子网掩码就使用默认子网掩码,默认子网掩码中的1的位置和IP地址中的网络号字段net-id正好相对应,因此若用默认子网掩码和某个不划分子网的IP地址逐位相“与”运算,就应当能够得出该IP地址的网络地址。下图是A\B\C三类IP地址的子网掩码信息:

 

  依据上图计算IP地址:145.13.3.10的网络地址

 

 子网掩码是一个网络或一个子网的重要属性。互联网标准要求:路由器和相邻路由器交换路由信息时,必须把自己所在网络(或子网)的子网掩码告诉相邻路由器。子网有多少种划分方法?以B类地址为例进行说明:

 

  以第一行记录为例分析:

a)   B类地址的主机号占16位,借用2位作为子网号的位数,2位二进制数可以排列出:00,01,10,11四种类型的子网,除去00和11后,得知借用2位主机号的子网数:

2n-2=22-2=4-2(00,11)=2

b)   既然子网号的位数是2,那么子网掩码就是:11111111.11111111.11000000.00000000=255.255.192.0。

c)   当子网号的位数是2时,主机号的位数就是14:那么每个子网的主机数就是:

2n=214=16384

去除最大和最小的两个数=16382

d)   从上图中没有看到子网号的位数为0、1、15、16四种情况,因为它们没有意义。

e)   从上图可以总结出子网号占用的主机号位数越多,可以划分的子网数就越多,但是每个子网的主机数就越少。

f)   互联网标准协议规定:子网号不能为全0和全1,但是在无分类编址CIDR下是可以使用的。

 

使用子网的分组转发

划分子网后,多出了一个子网掩码的概念,这样以来分组转发的算法就必须改动,具体改动如下:

1)   从收到的IP数据报的首部提取目的IP地址D。

2)   先判断是否为直接交付。对路由器直接相连的网络逐个进行检查:用各网络的子网掩码和D逐位相“与”运算,看结果是否和相应的网络地址匹配,若匹配,则把分组进行直接交付,转发任务结束。否则继续,执行间接交付。

3)   若路由表中有目的地址为D的特定主机路由,则把数据报传送给路由表中所指明的下一跳路由器。否则继续。

4)   对路由表中的每一行(目的网络地址,子网掩码,下一跳地址),用其中的子网掩码和D逐位相“与”运算,其结果为N,若N与该行的目的网络地址匹配,则把数据报传送给改行指明的下一跳路由器。否则继续。

5)   若路由表中有一个默认路由,则把数据报传送给路由表中所指明的默认路由器。否则继续。

6)   报告转发分组出错。

无分类编址CIDR(构造超网)

1.   网络前缀

划分子网在一定程度上缓解了互联网发展中遇到的问题,然而1992年互联网仍然面临三个必须尽早解决的问题,如下:

a)   B类地址在1992年已分配将近一半,眼看就要全部分配完毕。

b)   互联网主干网上的路由表中的记录数急剧增长。

c)   整个IPv4的地址空间最终将全部耗尽(2011年2月3日耗尽)。

IETF认为第三个问题相比较前两个问题属于更加长远的问题,因此专门成立IPv6工作组负责研究解决新版本IP协议的问题,而把精力用于研究解决前两个问题。

 在1987年,RFC1009就指明了在一个划分子网的网络中可同时使用几个不同的子网掩码,使用变长子网掩码VLSM可进一步提高IP地址资源的利用率。在VLSM的基础上又进一步研究出无分类编址方法,正式名字叫无分类域间路由选择CIDR。CIDR有两个主要的特点:

a)   CIDR消除了传统的A类、B类和C类地址以及划分子网的概念,因而能更加有效的分配IPv4地址空间,并且在新的IPv6使用之前容许互联网的规模继续增长。它把32位的IP地址划分为前后两个部分,前面部分是“网络前缀”指明网络,后面部分则指明主机。因此CIDR使IP地址从三级编址又回到了两级编址,但这已是无分类的两级编址。记为 IP地址::={<网络前缀>,<主机号>}

b)   CIDR把网络前缀都相同的连续的IP地址组成一个“CIDR地址块”。只要知道CIDR地址块中的任何一个地址,就可以知道这个地址块的最小地址和最大地址,以及地址块中的地址数。
例如:已知IP地址128.14.35.7/20是某CIDR地址块中的一个地址,写成二进制表示为10000000 00001110 00100011 00000111,这样很容易就知道最小地址和最大地址,以及地址数

              i.      最小地址:10000000 00001110 00100000 00000000

             ii.      最大地址:10000000 00001110 00101111 11111111

            iii.      地址数:2n = 212 = 4096

 

采用CIDR后,在其32位地址中就没有子网的概念。当一个单位分配得到一个CIDR地址块时,仍然可以在本单位内根据需要划分出一些子网,这些子网也都只有一个网络前缀和一台主机号字段,只是子网的网络前缀比整个单位的网络前缀要长些。

为了更方便的进行路由选择,CIDR使用32位的地址掩码,地址掩码由一串1和一串0组成,1的个数就是网络前缀的长度。由于CIDR没有子网的概念,但是目前仍有一些网络使用子网划分和子网掩码,所以CIDR的地址掩码可以称为子网掩码。采用斜线记法(CIDR记法)表示CIDR地址,斜线后面的数字就是地址掩码中1的个数。

由于一个CIDR地址块中有很多地址,所以在路由表中就利用CIDR地址块来查找目的网络,在路由表中一个CIDR地址块可以表示原来传统分类地址的很多个路由,这种方式叫做地址聚合,也叫路由聚合,也称之为构建超网。路由聚合有利于减少路由器之间的路由选择信息的交换,从而提高整个互联网的性能。

从路由聚合的角度看,构建超网是将网络前缀缩短,从划分子网的角度看,划分子网是将网络前缀变长,不过它们的目的是一样的。CIDR的作用就是可以更加有效地分配IPv4地址空间,减少路由表中的记录数提升路由效率。

 2.   最长前缀匹配

 在使用CIDR时,由于采用了网络前缀这种记法,IP地址由网络前缀和主机号这两个部分组成,因此在路由表中的项目也要有相应的改变,这时路由表的每一条记录为:{<网络前缀>,<地址掩码>,<下一跳地址>}组成。这时就会面临一个问题,就是在查找路由表时可能会得到不止一个匹配结果,解决这个问题的方法就是采用最长前缀匹配法,这是因为网络前缀越长,其地址块就越小,路由就越具体。

 3.   使用二叉线索查找路由表

使用CIDR后,由于要寻找最长前缀匹配,使路由表的查找过程变得更加复杂,当路由表的记录数很大时,设法减小路由表的查找时间是一个非常重要的问题。对于CIDR的路由表来说,最简单的查找算法就是对所有可能的前缀进行循环查找,但是很显然缺点就是查找的次数太多,而且最后可能发现路由表中没有这个路由。

为了进行更加有效的查找,通常把CIDR的路由表存放在一种层次化的数据结构中,然后自上而下地按层次进行查找。二叉线索就是最常用的数据结构,它是一种特殊结构的树,IP地址中从左到右的比特值决定了从根节点逐层向下层延伸的路径,而二叉线索中的各个路径就代表路由表中存放的各个地址。

确定使用二叉线索树就要构造它,在给定的IP地址集合中,先找出每个IP地址的唯一前缀,然后使用这些唯一前缀来构造二叉线索树,在查找时,只要能够和唯一前缀匹配就行了。找到“与唯一前缀匹配”,并没有找到“匹配的网络前缀”,所以二叉线索树的叶节点必须包含网络前缀和地址掩码。当搜索到一个叶节点时,就必须将寻找匹配的目的地址和该叶节点的子网掩码进行逐位相“与”运算,看结果是否与对应的网络前缀相匹配,若匹配,就按下一跳的接口转发该分组;否则就丢弃该分组。

为了提高二叉线索的查找速度,还可以对其数据结构进行优化,比如使用各种压缩技术。

 

网际控制报文协议ICMP

为了更有效地转发IP数据报和提高交付成功的机会,在网络层使用了网际控制报文协议ICMP,它允许主机和路由器报告差错情况,以及提供有关异常情况的报告。ICMP是互联网的标准协议,但它属于IP层,ICMP报文作为IP层数据报的数据,加上数据报的首部,组成IP数据报发送出去,其报文格式和常用的几种报文类型如下图:

  

随着技术的发展,ICMP标准在不断更新,许多报文已不再使用。ICMP报文的代码字段是为了进一步区分某种类型中的几种不同情况;检验和字段用来检验整个ICMP报文,因为IP数据报首部的检验和并不检验IP数据报的数据部分,因此不能保证经过传输的ICMP报文不产生差错。以下将按照ICMP报文种类,解读ICMP报文的类型,以及应用案例。

1.   差错报告报文

a)   终点不可达:当路由器或主机不能交付数据报时就向源点发送终点不可达报文。

b)   时间超过:当路由器收到生存时间为零的数据报时,除丢弃该数据包外,还要向源点发送时间超过报文。当终点在预先规定的时间内不能收到一个数据报的全部数据报片时,就把已收到的数据报片都丢弃,并向源点发送时间超过报文。

c)   参数问题:当路由器或目的主机收到的数据报的首部中有的字段的值不正确时,就丢弃该数据报,并向源点发送参数问题报文。

d)   改变路由(重定向):路由器把改变路由报文发送给主机,让主机知道下次应将数据报发送给另外的路由器(可通过更好的路由)。

这里对改变路由报文进行简短的解释。在互联网的主机中也要有一个路由表。当主机要发送数据报时,首先是查找主机自己的路由表,看应当从哪一个接口把数据报发送出去。在互联网中主机的数量远大于路由器的数量,出于效率的考虑,这些主机不和连接在网络上的路由器定期交换路由信息。在主机刚开始工作时,一般都在路由表中设置一个默认路由器的IP地址。不管数据报要发送到哪个目的地址,都一律先把数据报传送给这个默认路由器,而这个默认路由器知道到每一个目的网络的最佳路由。如果默认路由器发现主机发往某个目的地址的数据报的最佳路由应当经过网络上的另一个路由器R时,就用改变路由报文把这个情况告诉主机。于是,该主机就在其路由表中增加一个记录:到某某目的地址应经过路由器R,而不是默认路由器。

2.   询问报文

a)   回送请求或回答:ICMP回送请求报文是由主机或路由器向一个特定的目的主机发出的询问,收到此报文的主机必须给源主机或路由器发送ICMP回送回答报文。这种询问报文用来测试目的主机是否可达以及了解其有关状态。

b)   时间戳请求或回答:ICMP时间戳请求报文是请某台主机或路由器回答当前的日期和时间。在ICMP时间戳回答报文中有一个32位的字段,其中写入的整数代表从1900年1月1日起到当前时刻一共有多少秒。时间戳请求与回答可用于时钟同步和时间测量。

3.   ICMP的应用例子

a)   Ping:英文全称Packet InterNet Groper,中文叫“分组网间探测”,用来测试两台主机之间的连通性。它使用ICMP回送请求与回送回答报文,它也是应用层直接使用网络层的一个例子,没有通过传输层的TCP和UDP。

b)   Tracert:在类Unix操作系统叫traceroute,用来跟踪一个分组从源点到终点的路径。

 

路由选择协议

基本概念

1.   理想的路由算法

a)   算法必须是正确的和完整的,即沿着各路由表所指引的路由,分组一定能够最终达到目的网络和目的主机。

b)   算法在计算上应简单,路由选择的计算不应使网络通信量增加太多的额外开销。

c)   算法应能适应通信量和网络拓扑的变化,即要有自适应性,当网络中的通信量发生变化时,算法能自适应地改变路由以均衡各链路的负载。当某个或某些节点、链路发生故障不能工作,或者修理好了再投入运行时,算法也能及时地改变路由。这种自适应性也叫“稳健性”或“鲁棒性”。

d)   算法应具有稳定性,在网络通信量和网络拓扑相对稳定的情况下,路由算法应收敛于一个可以接收的解,而不应使得出的路由不停地变化。

e)   算法应是公平的,路由选择算法应对所有用户(除对少数优先级高的用户)都是平等的。

f)   算法应是最佳的,路由选择算法应当能够找出最好的路由,使得分组平均时延最小而网络的吞吐量最大。虽然我们希望得到“最佳”的算法,但这并不总是最重要的,对于某些网络,网络的可靠性有时要比最小的分组平均时延或最大吞吐量更加重要,因此所谓“最佳”只能是相对于某一种特定要求下得出的较为合理的选择而已。

 2.   分层次的路由选择协议

a)   互联网采用的路由选择协议是自适应的、分布式路由选择协议,即动态路由选择策略。

b)   互联网采用了分层次的路由选择协议。原因如下:

         i.     互联网的规模非常大,如果让所有的路由器知道所有的网络应怎样到达,则这种路由表将非常大,处理起来耗时巨大,且路由器间交换路由信息所需的带宽就会使互联网的通信链路饱和。

        ii.     许多单位不愿意外界了解自己单位网络的布局细节和本部门所采用的路由选择协议,但同时还希望连接到互联网上。

基于上述内容,整个互联网被划分成了许多较小的自治系统(autonomous system),简称AS。AS是在单一技术管理下的一组路由器,这些路由器使用一种自治系统内部的路由选择协议和共同的度量,一个AS对其他AS表现出的是一个单一的、一致的路由选择策略,如一个大的ISP就是一个自治系统。自治系统分为两大类:

a)   内部网关协议IGP,在一个自治系统内部使用的路由选择协议,即与在互联网中的其他自治系统选用的路由协议无关,使用最多的有RIP和OSPF协议。

b)   外部网关协议EGP,若源主机和目的主机处在不同的自治系统中,当数据报传到一个自治系统的边界时,就需要使用一种协议将路由选择信息传递到另一个自治系统中,这种协议就是EGP,使用最多的是BGP4。

自治系统间的路由选择叫域间路由选择,自治系统内部的路由选择叫域内路由选择。自治系统的路由器除运行内部路由选择协议,还要运行自治系统间的路由选择协议。特别说明:路由器又被称为网关,网关即网络的关口,因此IGP和EGP又被称为IRP与ERP。

 

内部网关协议RIP

1.   工作原理

RIP是一种分布式的基于距离向量的路由选择协议,它要求网络中的每一个路由器都要维护从它自己到其他每一个目的网络的距离记录。RIP协议的距离也叫跳数,每经过一个路由器,跳数就加1,RIP认为好的路由就是它通过的路由器的数目少,即距离短,RIP允许一条路径最多只能包含15个路由器,因此距离等于16时相当于不可达,可见RIP只适合于小型互联网。

RIP协议要求每一个路由器都要不断地和其他一些路由器交换路由信息,交换过程和内容规定如下:

a)   仅和相邻路由器交换信息。如果两个路由器之间的通信不需要经过另一个路由器,那么这两个路由器就是相邻的。不相邻的路由器不交换信息。

b)   路由器交换的信息是当前路由器所知道的全部信息,即自己现在的路由表

c)   按固定的时间间隔交换路由信息,例如每隔30秒,然后路由器根据收到的路由信息更新路由表。

 2.   距离向量算法

 对每一个相邻路由器发送来的RIP报文,进行以下步骤处理:

a)   对地址为X的相邻路由器发来的RIP报文,先修改此报文中的所有记录:

         i.      “下一跳地址”字段都改为X

        ii.      “距离”字段都加1

       iii.      每条记录都有三个关键数据:目的网络N,距离d,下一跳路由器X

b)   对修改后的RIP报文中的每一条记录,进行以下步骤

         i.      若原来的路由表中没有目的网络N,则把该项目添加到路由表中。否则继续。

        ii.      若路由表中有目的网络N,查看下一跳路由器地址。若下一跳路由器地址是X,则用收到的记录信息去更新路由表中的记录信息。否则继续。

       iii.      若下一跳路由器不是X,且收到的项目中的距离d小于路由表中的距离,则进行更新。

       iv.      否则什么也不做。

c)   若3分钟还没有收到相邻路由器的更新路由表,则把此相邻路由器记为不可达的路由器,即把距离置为16。

d)   返回。

距离向量算法是以Bellman-Ford算法(或Ford-Fulkerson算法)为基础的,特点是:设X是结点A到B的最短路径上的一个结点,若把路径A到B拆成两段路径A到X和X到B,则每一段路径A到X和X到B也都分别是结点A到X和结点X到B的最短路径。

 3.   RIP协议的报文格式

  

a)   RIP现在有两个版本即V1和V2,其中V2支持变长子网掩码和无分类域间路由选择CIDR,此外还提供了简单的鉴别过程支持多播。

b)   RIP和RIP2的首部报文格式相同,数据部分不同。

c)   RIP协议使用传输层的用户数据报UDP协议传送,端口默认520。

d)   RIP的首部占4个字节,命令字段指出报文的意义,如1表示请求路由信息,2表示对请求路由信息的响应或未被请求而发出的路由更新报文;版本要么是1要么是2;必为0是为了4字节对齐。

e)   RIP2报文中的数据部分由若干个路由信息组成,每个路由信息需要20个字节,一个RIP报文最多包含25个路由。

f)   地址族标识符,又称为地址类别,用来标识所使用的地址协议,如IP地址就写2.

g)   路由标记填入自治系统号ASN,可虑到RIP有可能收到本自治系统以外的路由选择信息。

h)   其他包含网络地址、子网掩码、下一跳路由器地址和网络距离。

如果使用RIP协议的鉴别功能,则需要鉴别信息放在第一条路由信息的位置,地址族标识符全为1,路由标记写入鉴别类型,剩下的16字节为鉴别数据。在鉴别数据之后才写入路由信息,这时最多只能再放入24条路由信息。

4.   总结

a)   RIP协议让一个自治系统内的所有路由器最终都拥有整个自治系统的全局路由信息,但由于每一个路由器的位置不同,它们的路由表也不相同。

b)   RIP协议最大优点是实现简单,开销较小。

c)   RIP协议限制了网络的规模,它能使用的最大距离是15。

d)   由于路由器间交换路由信息是完整的路由表,因而随着网络规模扩大,开销也会增加。

e)   由于其“好消息传播的快,坏消息传播的慢”特点,使更新过程的收敛时间过长。

 

内部网关协议OSPF

1.   OSPF协议

OSPF协议叫开放最短路径优先(Open Shortest Path First),它的存在就是针对RIP协议存在的缺点,此协议主要使用了Dijkstra提出的最短路径算法SPF,第二个版本已成为互联网标准协议。

OSPF协议使用了分布式的链路状态协议,这和RIP协议的距离向量协议不一样。它通过与各个路由器频繁地交换链路状态信息,首先构建了一个包含自治系统内所有路由器的链路状态数据库,这个数据库就是全网的拓扑结构图,这个拓扑图在全网范围内一致,即每个路由器内部都维护着这么一个数据库。然后每个路由器根据这个数据库使用SPF算法构造出自己的路由表,这与RIP协议相比多出了一个链路状态数据库。具体事项如下:

a)   向本自治系统中所有路由器发送信息。这里使用洪泛法,就是路由器通过所有输出端口向所有相邻的路由器发送信息。而每一个相邻路由器又将此信息发往其所有相邻路由器,但不再发送给刚发来信息的那个路由器。这样下去最终整个区域中所有的路由器都得到了这个信息的副本。RIP协议仅向自己相邻的路由器发送信息。

b)   发送的信息就是与本路由器相邻的所有路由器的链路状态,这只是路由器所知道的部分信息。链路状态是指本路由器和哪些路由器相邻,以及该链路的度量(也叫代价),这个度量表示费用、距离、时延、带宽等等。由于度量可以由网络管理人员调控,所以比较灵活。RIP协议发送的信息是:到所有网络的距离和下一跳路由器。

c)   只有当链路状态发生变化时,路由器才向所有路由器用洪泛法发送此信息。RIP协议不论网络拓扑是否变化,路由器间都要定期交换路由表信息。

d)   由于OSPF的链路状态数据库能较快地进行更新,使各个路由器能及时更新路由表,所以OSPF不存在RIP“坏消息传播慢”的缺陷。

e)   OSPF协议采用层次结构的区域划分,把一个自治系统划分为若干个更小的区域,划分区域后就可以把洪泛法交换链路状态信息的范围局限于每一个区域,不和整个自治系统交换,这就减小了整个网络上的通信量。
而区域又分为主干区域其他区域,主干区域负责与其他区域连接,从其他区域来的信息都来自区域边界路由器,因此每一个区域至少会有一个区域边界路由器,在主干区域内的路由器叫主干路由器
在主干区域内还要有一个路由器专门负责和本自治系统外的其他自治系统交换路由信息,它又叫自治系统边界路由器

f)   OSPF协议采用分层次划分区域使交换信息的通信量大大减小,也能够用于规模很大的自治系统,但也增加了复杂性。

g)   OSPF不用UDP协议,而是直接用IP数据报传送。

h)   OSPF允许管理员给每条路由指派不同的代价,链路的代价取值范围:1到65535。

i)   如果到同一个目的网络有多条相同代价的路径,那么可以将通信量分配给这几条路径,这叫多路径间的负载平衡。

j)   所有在OSPF路由器间交换的分组都具有鉴别功能,因而保证了仅在可信赖的路由器间交换链路状态信息。

k)   OSPF协议支持可变长度的子网划分和无分类的编址CIDR。

l)   由于网络中的链路状态可能经常发生变化,因此OSPF让每一个链路状态都带上一个32位的序号,序号越大状态就越新。OSPF规定:链路状态序号增长的速率不得超过5秒/次,这样全部序号空间在600年内不会产生重复号。

 2.   OSPF协议的报文格式

 

a)   OSPF分组使用固定长度的24字节。

b)   版本,当前的版本号2。

c)   类型,可以是五种类型分组中的一种。

d)   分组长度,包括OSPF首部在内的分组长度,以字节为单位。

e)   路由器标识符,标识发送该分组的路由器的接口的IP地址。

f)   区域标识符,分组属于的区域的标识符。

g)   检验和,用来检测分组中的差错。

h)   鉴别类型,目前只有两种,0:不用鉴别,1:鉴别口令。

i)   鉴别,鉴别类型为0时就填入0,鉴别类型为1时就填入8个字符的口令。

3.   OSPF协议的五种分组类型

a)   类型1,问候分组,用来发现和维持邻站的可达性。

b)   类型2,数据库描述分组,向邻站给出自己的链路状态数据库中的所有链路状态项目的摘要信息。

c)   类型3,链路状态请求分组,向对方请求发送某些链路状态项目的详细信息。

d)   类型4,链路状态更新分组,用洪泛法对全网更新链路状态,这个分组最复杂,也是OSPF协议的核心。路由器使用这种分组将其链路状态通知给邻站,这种分组有五种不同的链路状态。

e)   类型5,链路状态确认分组,对链路更新分组的确认。

 OSPF协议规定,每两个相邻路由器每隔10秒钟要交换一次问候分组;若40秒钟没有收到某个相邻路由器发来的问候分组,则认为该相邻路由器是不可达的,应立即修改链路状态数据库,并重新计算路由表。

 

外部网关协议BGP

1.   BGP协议

为什么需要外部网关协议BGP?因为内部网关协议主要负责让数据报在一个AS中尽可能有效的从源站传送到目的站,在一个AS内部不需要考虑其他方面的需求和执行策略。而两个或多个AS通信就截然不同了,需要考虑各方面的事项:

a)   互联网的规模太大,使得自治系统AS间路由选择非常困难。

b)   自治系统AS间的路由选择必须考虑控制策略。如:

 

推荐阅读