TCP/IP(三)

传输层:TCP协议

一、概述

TCP和UDP处在同一层——运输层,但是它们有很多的不同。TCP是TCP/IP系列协议中最复杂的部分,它具有以下特点:

  • (1) TCP提供 可靠的 数据传输服务,TCP是 面向连接的 。应用程序在使用TCP通信之前,先要建立连接,这是一个类似“打电话”的过程,通信结束后还要“挂电话”。
  • (2) TCP连接是 点对点 的,一条TCP连接只能连接两个端点。
  • (3) TCP提供可靠传输,无差错、不丢失、不重复、按顺序。
  • (4) TCP提供 全双工 通信,允许通信双方任何时候都能发送数据,因为TCP连接的两端都设有发送缓存和接收缓存。
  • (5) TCP面向 字节流 。TCP并不知道所传输的数据的含义,仅把数据看作一连串的字节序列,它也不保证接收方收到的数据块和发送方发出的数据块具有大小对应关系。

01

二、TCP报文段结构

TCP是面向字节流的,而TCP传输数据的单元是 报文段 。一个TCP报文段可分为两部分:报头和数据部分。数据部分是上层应用交付的数据,而报头则是TCP功能的关键。

TCP报文段的报头有前20字节的固定部分,后面4n字节是根据需要而添加的字段。如图则是TCP报文段结构:

02

20字节的固定部分,各字段功能说明:

  • 1.源端口和目的端口:各占2个字节,分别写入源端口号和目的端口号。这和UDP报头有类似之处,因为都是运输层协议。
  • 2.序号:占4字节序,序号范围[0,2^32-1],序号增加到2^32-1后,下个序号又回到0。 TCP是面向字节流的,通过TCP传送的字节流中的每个字节都按顺序编号,而报头中的序号字段值则指的是本报文段数据的第一个字节的序号
  • 3.确认序号:占4字节,期望收到对方下个报文段的第一个数据字节的序号。
  • 4.数据偏移:占4位,指TCP报文段的报头长度,包括固定的20字节和选项字段。
  • 5.保留:占6位,保留为今后使用,目前为0。
  • 6.控制位:共有6个控制位,说明本报文的性质,意义如下:
    **URG 紧急**:当URG=1时,它告诉系统此报文中有紧急数据,应优先传送(比如紧急关闭),这要与**紧急指针**字段配合使用。
    **ACK 确认**:仅当ACK=1时**确认号**字段才有效。建立TCP连接后,所有报文段都必须把ACK字段置为1。
    **PSH 推送**:若TCP连接的一端希望另一端立即响应,PSH字段便可以“催促”对方,不再等到缓存区填满才发送。
    **RET 复位**:若TCP连接出现严重差错,RST置为1,断开TCP连接,再重新建立连接。
    **SYN 同步**:用于建立和释放连接,稍后会详细介绍。
    **FIN 终止**:用于释放连接,当FIN=1,表明发送方已经发送完毕,要求释放TCP连接。
    
  • 7.窗口:占2个字节。窗口值是指发送者自己的接收窗口大小,因为接收缓存的空间有限。
  • 8.检验和:2个字节。和UDP报文一样,有一个检验和,用于检查报文是否在传输过程中出差错。
  • 9.紧急指针:2字节。当URG=1时才有效,指出本报文段紧急数据的字节数。
  • 10.选项:长度可变,最长可达40字节。具体的选项字段,需要时再做介绍。

三、连接的建立与释放

刚才说过,TCP是面向连接的,在传输TCP报文段之前先要创建连接,发起连接的一方被称为客户端,而响应连接请求的一方被称为服务端,而这个创建连接的过程被称为 三次握手

03

  • (1) 客户端发出请求连接报文段,其中报头控制位SYN=1,初始序号seq=x。客户端进入SYN-SENT(同步已发送)状态。
  • (2) 服务端收到请求报文段后,向客户端发送确认报文段。确认报文段的首部中SYN=1,ACK=1,确认号是ack=x+1,同时为自己选择一个初始序号seq=y。服务端进入SYN-RCVD(同步收到)状态。
  • (3) 客户端收到服务端的确认报文段后,还要给服务端发送一个确认报文段。这个报文段中ACK=1,确认号ack=y+1,而自己的序号seq=x+1。这个报文段已经可以携带数据,如果不携带数据则不消耗序号,则下一个报文段序号仍为seq=x+1

至此TCP连接已经建立,客户端进入ESTABLISHED(已建立连接)状态,当服务端收到确认后,也进入ESTABLISHED状态,它们之间便可以正式传输数据了。

当传输数据结束后,通信双方都可以释放连接,这个释放连接过程被称为 释放连接 :

04

  • (1) 此时TCP连接两端都还处于ESTABLISHED状态,客户端停止发送数据,并发出一个FIN报文段。首部FIN=1,序号seq=u(u等于客户端传输数据最后一字节的序号加1)。客户端进入FIN-WAIT-1(终止等待1)状态。
  • (2) 服务端回复确认报文段,确认号ack=u+1,序号seq=v(v等于服务端传输数据最后一字节的序号加1),服务端进入CLOSE-WAIT(关闭等待)状态。现在TCP连接处于半开半闭状态,服务端如果继续发送数据,客户端依然接收。
  • (3) 客户端收到确认报文,进入FIN-WAIT-2状态,服务端发送完数据后,发出FIN报文段,FIN=1,确认号ack=u+1,然后进入LAST-ACK(最后确认)状态。
  • (4) 客户端回复确认确认报文段,ACK=1,确认号ack=w+1(w为半开半闭状态时,收到的最后一个字节数据的编号) ,序号seq=u+1,然后进入TIME-WAIT(时间等待)状态。

注意此时连接还没有释放,需要时间等待状态结束后(4分钟) 连接两端才会CLOSED。设置时间等待是因为,有可能最后一个确认报文丢失而需要重传。

四、TCP可靠传输的实现

  • (1) TCP报文段的长度可变,根据收发双方的缓存状态、网络状态而调整。
  • (2) 当TCP收到发自TCP连接另一端的数据,它将发送一个确认。
  • (3) 当TCP发出一个段后,它启动一个定时器,等待目的端确认收到这个报文段,如果不能及时收到一个确认,将重发这个报文段。这就是稍后介绍的超时重传
  • (4) TCP将保持它首部和数据的检验和。如果通过检验和发现报文段有差错,这个报文段将被丢弃,等待超时重传。
  • (5) TCP将数据按字节排序,报文段中有序号,以确保顺序的正确性。
  • (6) TCP还能提供流量控制。TCP连接的每一方都有收发缓存。TCP的接收端只允许另一端发送接收端缓冲区所能接纳的数据。这将防止较快主机致使较慢主机的缓冲区溢出。

可见超时重发机制是TCP可靠性的关键,只要没有得到确认报文段,就重新发送数据报,直到收到对方的确认为止。

五、超时重传

TCP规定,接收者收到数据报文段后,需回复一个确认报文段,以告知发送者数据已经收到。而发送者如果一段时间内(超时计时器)没有收到确认报文段,便重复发送:

05

为了实现超时间重传,需要注意:

  • 1.发送者发送一个报文段后,暂时保存该报文段的副本,为发生超时重传时使用,收到确认报文后删除该报文段。
  • 2.确认报文段也需要序号,才能明确是发出去的那个数据报得到了确认。
  • 3.超时计时器比传输往返时间略长,但具体值是不确定的,根据网络情况而变。

六、连续ARQ协议

也许你也发现了,按上面的介绍,超时重传机制很费时间,每发送一个数据报都要等待确认。

在实际应用中的确不是这样的,真实情况是,采用了流水线传输:发送方可以连续发送多个报文段(连续发送的数据长度叫做窗口),而不必每发完一段就停下来等待确认。

实际应用中,接收方也不必对收到的每个报文都做回复,而是采用累积确认方式:接收者收到多个连续的报文段后,只回复确认最后一个报文段,表示在这之前的数据都已收到。

这样,传输效率得到了很大的提升。

06

七、流量控制和拥塞控制

由于接收方缓存的限制,发送窗口不能大于接收方接收窗口。在报文段首部有一个字段就叫做窗口(rwnd),这便是用于告诉对方自己的接收窗口,可见窗口的大小是可以变化的。

那么窗口的大小是如何变化的呢?TCP对于拥塞的控制总结为“慢启动、加性增、乘性减”,如图所示:

07

  • (1) 慢启动 :初始的窗口值很小,但是按指数规律渐渐增长,直到达到慢开始门限(ssthresh)
  • (2) 加性增 :窗口值达到慢开始门限后,每发送一个报文段,窗口值增加一个单位量。
  • (3) 乘性减 :无论什么阶段,只要出现超时,则把窗口值减小一半。

 

 

 

 

应用层协议

在传输层之上,便是应用层。传输层的UDP报文和TCP报文段的数据部分就是应用层交付的数据。

不同类型的网络应用有不同的通信规则,因此应用层协议是多种多样的,比如DNS、FTP、Telnet、SMTP、HTTP、RIP、NFS等协议都是用于解决其各自的一类问题。

本节实验,介绍DNS、FTP、HTTP三个常用的应用层协议。

一、DNS

DNS (Domain Name Service 域名服务) 协议基于UDP,使用端口号53。

由数字组成的IP地址很难记忆,所以我们上网使用网站IP地址的别名——域名。实际使用中,域名与IP地址是对应的,这种对应关系保存在DNS服务器之中。

在浏览器中输入一个域名后,会有DNS服务器将域名解析为对应的IP地址。注意这和网络层的ARP协议的不同之处:DNS提供的是域名与IP地址的对应关系,而ARP提供的是IP地址和MAC地址的对应关系。

DNS服务器

DNS服务器是个分层次的系统:

  • (1)根DNS服务器 :全世界共有13台根域名服务器,编号A到M,其中大部分位于美国。
  • (2)顶级(TLD)DNS服务器 :负责如 com 、org 、edu 等顶级域名和所有国家的顶级域名(如 cn 、uk 、jp )。
  • (3)权威DNS服务器 :大型组织、大学、企业的域名解析服务。
  • (4)本地DNS服务器 :通常与我们主机最近的DNS服务器。

而域名解析的过程,有迭代查询和递归查询两种方式:

01

host命令

在linux系统中,可以用 host命令 进行DNS查询,查看一个指定域名的IP,比如要查询实验楼的IP地址:

host www.shiyanlou.com

04

DNS报文

主机向DNS服务器发出的查询叫做DNS报文,大致结构:

03

DNS问答报文的内容,都是IP和域名的对应信息,关于DNS首部和内容 各字段这里不做详细介绍。深入了解,可以先host一个域名,再使用tcpdump抓取报文并解读。

DNS缓存和hosts文件

刚才DNS解析查询过程的图中,共发出了8份DNS报文,这是非常消耗时间的,所以实际应用上使用 DNS缓存 :当一个DNS服务器接收到一个DNS回答后,会将其信息缓存一段时间,当再有一个对相同域名的查询时,便可直接回复。

通过DNS缓存,其实很多查询都只需要本地DNS服务器便可完成。

有“翻墙”爱好的同学应该知道hosts文件,其实hosts文件可以看作是一个小型的DNS服务器。

使用命令打开hosts文件:

sudo gedit /etc/hosts

查看文件内容,可以发现里面全是IP和域名的对应记录:

02

在实际上网过程中,域名解析的的优先顺序是:先在DNS缓存查询,若没有找到记录,再查询hosts文件,若还是没找到记录,再向DNS服务器发出DNS查询报文。

二、FTP

FTP (File Transfer Protocol 文件传输协议) 基于TCP,使用端口号20(数据)和21(控制)。

它的主要功能是减少或消除在不同操作系统下处理文件的不兼容性,以达到便捷高效的文件传输效果。

  • FTP只提供文件传输的基本服务,它采用 客户端—服务器 的方式,一个FTP服务器可同时为多个客户端提供服务。
  • 在进行文件传输时,FTP的客户端和服务器之间会建立两个TCP连接:21号端口建立控制连接,20号端口建立数据连接
  • FTP的传输有两种方式:ASCII传输模式和二进制数据传输模式。

三、HTTP

HTTP (HyperText Transfer Protocol 超文本传输协议) 基于TCP,使用端口号80或8080。

每当你在浏览器里输入一个网址或点击一个链接时,浏览器就通过HTTP协议将网页信息从服务器提取再显示出来,这是现在使用频率最大的应用层协议。

这个原理很简单:

  • 点击一个链接后,浏览器向服务器发起TCP连接;
  • 连接建立后浏览器发送HTTP请求报文,然后服务器回复响应报文;
  • 浏览器将收到的响应报文内容显示在网页上;
  • 报文收发结束,关闭TCP连接。

HTTP报文会被传输层封装为TCP报文段,然后再被IP层封装为IP数据报。HTTP报文的结构:

05

可见报文分为3部分:

  • (1)开始行:用于区分是请求报文还是响应报文,请求报文中开始行叫做请求行,而响应报文中,开始行叫做状态行。在开始行的三个字段之间都用空格分开,结尾处CRLF表示回车和换行。
  • (2)首部行:用于说明浏览器、服务器或报文主体的一些信息。
  • (3)实体主体:请求报文中通常不用实体主体。

请求报文的方法字段是对所请求对象进行的操作,而响应报文的状态码是一个3位数字,分为5类33种:

  • 1xx 表示通知信息,如收到或正在处理。
  • 2xx 表示成功接收。
  • 3xx 表示重定向。
  • 4xx 表示客户的差错,如404表示网页未找到。
  • 5xx表示服务器的差错,如常见的502 Bad Gateway。