HyperText Transfer Protocol

本文为HTTP图解的读书笔记 https://zh.wikipedia.org/wiki/%E8%B6%85%E6%96%87%E6%9C%AC%E4%BC%A0%E8%BE%93%E5%8D%8F%E8%AE%AE WIKI

第一章 基础了解

http历史我是没啥兴趣的。

对于TCP/IP四层协议,就整体而言还算熟悉,但是要详细的吧里面的每个协议都说清楚就难了。当然基础的DNS、HTTP、FTP;TCP 、UDP; IP 也就是应用层,传输层,网络层里重要的协议,每个都要清楚,对应于哪些技术,应用在哪些地方。 TCP IP 留在后面再详细讲。

还有URL URI 的区别于定义。用来制定HTTP协议技术标准的文档,它们被称为RFC(Request for Comments)

第二章 简单的HTTP协议

请求头与响应头

Request:

GET / HTTP/1.1  
Host: blog.lwxyfer.com  
Connection: keep-alive  
Pragma: no-cache  
Cache-Control: no-cache  
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8  
Upgrade-Insecure-Requests: 1  
User-Agent: Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.112 Safari/537.36  
DNT: 1  
Accept-Encoding: gzip, deflate, sdch  
Accept-Language: zh-CN,zh;q=0.8,en;q=0.6  
Cookie: saeut=101.204.246.61.1453616176969631; wp-settings-1=hidetb%3D1%26editor%3Dtinymce%26libraryContent%3Dbrowse%26wplink%3D0%26posts_list_mode%3Dlist%26align%3Dcenter%26advImgDetails%3Dshow; wp-settings-time-1=1458829958; _ga=GA1.2.969949449.1454137716  

Response:

HTTP/1.1 200 OK  
Server: nginx/1.4.6 (Ubuntu)  
Date: Wed, 13 Apr 2016 09:22:08 GMT  
Content-Type: text/html; charset=utf-8  
Transfer-Encoding: chunked  
Connection: keep-alive  
X-Powered-By: Express  
Cache-Control: public, max-age=0  
ETag: W/"35d0-k3fdm3b7KWqTn/dcFovElA"  
Vary: Accept-Encoding  
Content-Encoding: gzip

<html>  
...

无状态 stateless

HTTP 协议自身不对请求和响应之间的通信状态进行保存。

支持的方法

HTTP/1.1协议中共定义了八种方法(也叫“动作”)来以不同方式操作指定的资源:

  • OPTIONS:这个方法可使服务器传回该资源所支持的所有HTTP请求方法。用'*'来代替资源名称,向Web服务器发送OPTIONS请求,可以测试服务器功能是否正常运作。
  • HEAD:与GET方法一样,都是向服务器发出指定资源的请求。只不过服务器将不传回资源的本文部分。它的好处在于,使用这个方法可以在不必传输全部内容的情况下,就可以获取其中“关于该资源的信息”(元信息或称元数据)。
  • GET:向指定的资源发出“显示”请求。使用GET方法应该只用在读取数据,而不应当被用于产生“副作用”的操作中,例如在Web Application中。其中一个原因是GET可能会被网络蜘蛛等随意访问。参见安全方法
  • POST:向指定资源提交数据,请求服务器进行处理(例如提交表单或者上传文件)。数据被包含在请求本文中。这个请求可能会创建新的资源或修改现有资源,或二者皆有。
  • PUT:向指定资源位置上传其最新内容。
  • DELETE:请求服务器删除Request-URI所标识的资源。
  • TRACE:回显服务器收到的请求,主要用于测试或诊断。
  • CONNECT:HTTP/1.1协议中预留给能够将连接改为管道方式的代理服务器。通常用于SSL加密服务器的链接(经由非加密的HTTP代理服务器)。

方法名称是区分大小写的。当某个请求所针对的资源不支持对应的请求方法的时候,服务器应当返回状态码405(Method Not Allowed),当服务器不认识或者不支持对应的请求方法的时候,应当返回状态码501(Not Implemented)。

持久连接

keep-alive

持久连接的好处在于减少了 TCP 连接的重复建立和断开所造成的额外开销,减轻了服务器端的负载。比如网站请求,有很多图片,如果没有持久连接,那么每次连接需要重建TCP连接, 费时,耗资源。

HTTP Persistent Connections

Connection: keep-alive  

pipelining

持久连接使得多数请求以管线化(pipelining)方式发送成为可能。能够做到同时并行发送多个请求

HTTP报文内的HTTP信息

用于协议交互的信息称为HTTP报文。分为报文首部和报文主体部分。主体部分不一定需要有。

根据请求和响应分:

报文首部:请求行 / 状态行 + 各种首部字段

编码

1.对于实体和报文的区别

2.压缩方式:

  • gzip GUN zip
  • compress unix系统=标准压缩方式
  • deflate zlib
  • identity 不编码

3.分块传输编码

Chunked Transfer Coding

4.多种数据类型

MIME

待续,不过HTTP图解的内容不是很复杂,算是对大部分的概念做了介绍吧,需要深入再对每一块进行理解。