HTTP/2笔记之消息交换

标签: http 笔记 消息 | 发表时间:2015-03-23 08:45 | 作者:nieyong
出处:http://www.blogjava.net/

前言

无论是HTTP/1.*还是HTTP/2,HTTP的基本语义是不变的,比如方法语义(GET/PUST/PUT/DELETE),状态码(200/404/500等),Range Request,Cacheing,Authentication、URL路径。以前纯文本形式作为传输的载体,HTTP/2带来了与之不同的二进制传输语法语义。

下面为HTTP/2消息交换方便笔记。

请求/响应流程

一个典型的HTTP消息包含请求/响应,组成如下:

  • 以响应为例,零或多个HEADERS帧(每一个HEADERS帧可能跟着>=0个CONTINUATION帧,以补充单个HEADERS容量不够的情况)包含状态码为1xx的报文头响应
  • 或者一个HEADERS帧包含了完整的报文头(一般情况下)
  • 零个或多个DATA数据帧包含了具体的消息负载内容
  • 一个HEADERS帧,后面跟随零个或多个包含有报尾(trailer-part)的CONTINUATION帧,作为可选项

注意事项:

  • 一个HEADERS帧携带有END_STREAM标志,后面可跟随有CONTINUATION帧用以补充剩余的包头块
  • 来自于其它流的类型帧是不能够出现在HEADERS帧和CONTINUATION帧中间
  • DATA数据帧不支持分块传输编码(chunked transfer encoding)
  • 报尾字段(Trailing header field)当出现在报头块中时,可以终止当前流
  • HEADERS帧以及关联的CONTINUATION帧只能够出现在一个流的开始或结束时
  • HTTP请求-相应交换消耗一个流:请求准备HEADERS帧打开流,请求的帧包含有END_STREAM标志导致两端流处于半关闭状态,half closed(local/server);响应一个HEADERS帧,若某响应帧包含有END_STREAM标志,流将被关闭
  • 一个HTTP响应完成指的响应帧是包含有END_STREAM标志,在服务器发送并且客户端接收成功。若响应不依赖于客户端的请求,服务器端可以在先于客户端发送请求之前发送完成,之后服务器通过再次发送一个RST_STREAM流(错误代码为NO_ERROR)请求客户端放弃发送请求。这要求客户端在接收到RST_STREAM帧后必须不能够丢弃响应,无论是处于什么谨慎原因。

1. 不支持升级机

HTTP/2多路复用,以及自身也可以通过HTTP/1.1 101切换古来,因此不支持101切换协议(Switching Protocols)机制也是情理之中。

2. HTTP Header Fields

HTTP/2报头字段注意点:

  1. 和HTTP/1.x报头字段一样,都是ASCII字符表示
  2. 字段要求全部小写,"Accept" -> "accept"
  3. 若大写,会被作为不完整数据对待,有被丢弃的风险
  4. 新增伪报头字段,但不属于常规HTTP头部字段,不允许终端自己产生,只允许规范中所定义的5个
    • :method
    • :scheme
    • :authority
    • :path
    • :status
  5. 伪报头字段必须出现在常规HTTP报头字段之前
  6. 连接属性专用字段(Connection-Specific Header Fields)不再被使用(但Transfer-Encoding可以允许出现在请求头中),比如Keep-Alive, Proxy-Connection, Transfer-Encoding和Upgrade等

3. 简单示范

简单图片请求:

模拟一次提交,设置报头大于16KB(一般情况下,报头没有那么大,除非Cookie撑大):

以上示例,可以帮助理解HTTP/1.x和HTTP/2在HTTP语义表述上的不同。

4. 可靠性机制

HTTP/1.1,HTTP客户端无法重试非幂等请求,尤其在错误发生的时候,由于无法检测错误性质这会对重试带来不利的影响。

而HTTP/2在这方面有所增强,提供了两种方式可判断请求是否被完成:

  • GOAWAY帧会携带上流标识符的最大值,低于此值的请求已经被执行过,高于此值的请求帧,则可以再次放心重试
  • 包含有REFUSED_STREAM错误代码的RST_STREAM帧说明当前流早于任何处理发生之前就已经被关闭,因此发生在当前流上的请求可以安全重试。

另外PING帧有利于客户端检测当前连接是否可用,可以理解为心跳保活机制,因为一些网关、负载设备会关闭空闲状态下的连接以节省资源。

服务器推送机制

HTTP/2新增特性,服务器根据客户端一次请求内容主动推送与之相关的请求过去,避免客户端在解析出初次请求页面内容时,再逐一发送资源请求,节省网络资源利用效率。 一些注意事项:

  • 客户端可以通过设置SETTINGS_ENABLE_PUSH为0值通知服务器端禁用推送
  • 承诺请求应该是可缓存、安全,并且不能够携带请求的负载内容,这需要客户端做检测
  • 推送的响应若不可缓存,客户端不能作为HTTP cache存储,这对单独的非浏览器环境特别适合
  • 服务器必须包含一个 :authority伪头部字段,标明自身被授权。客户端若检测不到需要作为PROTOCOL_ERROR类型流错误对待
  • 中介设备接收到服务器的推送后,可以决定是否要转发给客户端,中介可以单独选择推送内容发送给客户端。这是一个特别需要注意的点
  • 客户端必须拒绝来自服务器端的对SETTINGS_ENABLE_PUSH属性非0值的修改,也就是说服务器不能要求客户端打开PUSH开关,客户端一旦遇到需要响应PROTOCOL_ERROR类型连接错误
  • 客户端不能够发送推送,PUSH_PROMISE帧只能够来自于服务器端(作为推送请求者发送),否则将会作为PROTOCOL_ERROR类型的连接错误对待
  • PUSH_PROMISE需要包含伪头部:method,若客户端认为不安全,必须响应一个PROTOCOL_ERROR类型流错误
  • 服务器端应该尽可能早的发送PUSH_PROMISE帧,以避免与来自客户端对相同资源的请求两者产生冲突
  • 发送PUSH_PROMISE帧会创建一个新的流,然后处于两端的保留状态,reserved (local/remote)
  • 发送完PUSH_PROMISE帧,服务器需要马上发送具体DATA数据帧
  • 客户端接收完PUSH_PROMISE帧后,选择接收PUSH响应内容,这期间不能触发请求承诺的响应内容,直到承诺流关闭
  • 客户端不需要接收推送内容时,可以选择发送RST_STREAM帧,包含CANCEL/REFUSED_STREAM代码,以及PUSH流标识符发送给服务器端,重置推送流
  • 客户端可以通过设置SETTINGS_MAX_CONCURRENT_STREAMS限制响应数,值为0禁用。但不能阻止服务器发送PUSH_PROMISE帧

比如,服务器接收到来自客户端的请求某个HTML文档资源,该文档包含了若干图片连接,服务器应该优先发送图片数据到客户端,这需要优先发送推送承诺早于包含完整HTML文档内容的DATA帧,这样客户端优先接收到承诺资源,后面接收到DATA数据帧进行解析出图片连接的时候,就避免再次发送图片资源请求嘛。

CONNECT方法

在HTTP原始语义中是没有CONNECT方法的,这个伪方法(pseudo-method)在HTTP/1.x,HTTP代理用作转换HTTP连接通过隧洞方式到远程主机,HTTPS方式交互。 HTTP/2与之类似,伪方法CONNECT被HTTP代理用作在一个单独的HTTP/2流之上建立一个到远程主机的隧道,要求如下:

  • :method=CONNECT
  • ":scheme"和":path"被省略
  • ":authority"字段为代理要连接的远程主机和端口信息

一旦不满足要求,会被视为不完整的需求。

  • 连接成功建立,代理发送给客户端一个2xx的状态码
  • 代理两端在HEADERS帧都发送完毕后,后续的DATA帧开始发送
  • 代理转发客户端发送的DATA数据帧到远程服务器
  • 代理接收到服务器数据组装成DATA数据帧
  • 非DATA类型数据帧,包括流管理类型的RST_STREAM、WINDOW_UPDATE、PRIORITY帧都是不能够在已经连接的流上发送的,否则会被当做流错误对待
  • 客户端接收到包含有END_STREAM标志位的DATA帧时,尽量也要发送一个包含有END_STREAM标志位的DATA帧
  • DATA帧END_STREAM标志位被当做TCP FIN比特标志对待:
    • 代理接收到DATA帧带有END_STREAM标志位,在转发时会设置TCP FIN比特位
    • 代理接收到TCP段包含有FIN比特位设置时,会转发一个DATA帧并携带END_STREAM标志位
    • 最后的TCP段或DATA帧可以为空
  • TCP连接错误以RST_STREAM帧关联
  • 代理对待在TCP连接中出现的错误,包括接收到一个包含有RST比特位的TCP段,作为CONNECT_ERROR类型的流错误抛出
  • 一旦检测到流或HTTP/2连接的错误,代理必须发送一个TCP段并且其RST标志被设置
  • 代理不能仅仅依靠SETTINGS_MAX_CONCURRENT_STREAMS属性值进行限制资源消耗

持久连接和重用

HTTP/2消息交换通过持久连接、重用实现,目的尽可能做到资源利用率最大化。

  1. HTTP/2为持久性连接,基于性能原因,规范建议客户端不要关闭已有连接除非不再需要和服务器保持通信。服务器端要是主动关闭连接的话,在请求量大的情况下,会导致系统出现大量的TIME_WAIT状态TCP,每一个TIME_WAIT状态默认情况下至少持续60秒,特别占用系统资源。因此最佳实践是客户端主动关闭连接,避免Linux服务器端出现TIME_WAIT。
  2. 基于具体主机和端口,客户端应该只打开一个HTTP/2连接
  3. 客户端可以额外创建连接作为替代补充:替换已耗尽可用流标识符,或刷新TLS连接,或替换遇到错误的连接
  4. 当任一端想关闭连接的时候,都应该第一时间发送一个GOAWAY帧到对端,告知对方先前发送的帧已经被处理过,终止之后的一些剩余任务,终止可放心关闭
  5. 有一些情况服务器若不希望客户端重用连接,可返回421 (Misdirected Request) 状态码作为响应,默认可缓存(POST方法或cache-control可控制),但代理不能够为客户端请求生成421状态码。
  6. HTTP代理与每一个服务器之间可以尽可能保持一个持久的连接方便专递客户端的请求;客户端到代理之间可以所有请求共享、重用一个连接

小结

以上为HTTP/2消息交换机制的一些简单梳理,需要注意点:

  1. HTTP/2不允许使用连接特定头部字段
  2. 新增的5个头部
  3. 推送机制的一些特性需求
  4. RST_STREAM等帧标志位的使用


nieyong 2015-03-23 16:45 发表评论

相关 [http 笔记 消息] 推荐:

Nginx+ffmpeg搭建Apple Http Live Streaming笔记

- - 移动开发 - ITeye博客
起始Nginx来搭建HLS步骤非常少. 安装好Nginx,然后跑起来. 把切片好的视频和m3u8文件放到部署目录,直接访问就可以了. 网上国内国外的找了好多博客. 这里一定注意一点,不要用VLC播放器来测试,最好用iPad或者iPhone,再么用Safari 开发模式下模拟iPad、iPhone的浏览器模式播放.

HTTP/2笔记之消息交换

- - BlogJava-首页技术区
无论是HTTP/1.*还是HTTP/2,HTTP的基本语义是不变的,比如方法语义(GET/PUST/PUT/DELETE),状态码(200/404/500等),Range Request,Cacheing,Authentication、URL路径. 以前纯文本形式作为传输的载体,HTTP/2带来了与之不同的二进制传输语法语义.

HTTP Headers 入门

- johnny - Time Machine
非常感谢 @ytzong 同学在twitter上推荐这篇文章,原文在此. 本文系统的对HTTP Headers进行了简明易懂的阐述,我仅稍作笔记. 什么是HTTP Headers. HTTP是“Hypertext Transfer Protocol”的所写,整个万维网都在使用这种协议,几乎你在浏览器里看到的大部分内容都是通过http协议来传输的,比如这篇文章.

HTTP基础

- - ITeye博客
HTTP的结构主要包括下面几个要点:. HTTP的版本主要有1.0,1.1 和更高版本.    1.1 及以上版本允许在一个TCP连接上传送多个HTTP协议,1.0能 .    1.1 及以上版本多个请求和响应可以重叠,1.0不能.    1.1 增加了很多的请求头和响应头.     一个请求行,若干小心头,以及实体内容,其中的一些消息头和实体内容是可选的,消息头和实体内容需要空行隔开.

HTTP Header 详解

- - 博客园_Ruby's Louvre
HTTP(HyperTextTransferProtocol)即超文本传输协议,目前网页传输的的通用协议. HTTP协议采用了请求/响应模型,浏览器或其他客户端发出请求,服务器给与响应. 就整个网络资源传输而言,包括message-header和message-body两部分. 首先传递message- header,即 http header消息.

http-kit 1.2 发布

- - 开源中国社区最新新闻
Http-kit 是主要由Java 和Clojure开发,为Clojure定制的零依赖的Http lib,包括异步的高性能HTTP Server 和 HTTP Client. 在普通的PC上进行性能测试时,http-kit server 每秒能处理数万个请求. 修复处理文件上传时,content-type没能正确处理.

HTTP缓存算法

- - PHP源码阅读,PHP设计模式,PHP学习笔记,项目管理-胖胖的空间
HTTP协议缓存的目标是去除许多情况下对于发送请求的需求和去除许多情况下发送完整请求的需求. 以不发送请求或减少请求传输的数据量来优化整个HTTP架构,此目标的实现可以产生如下好处:. 降低对原始服务器的请求量. 减少了传送距离,降低了因为距离而产生的时延. 缓存基本处理过程包括七个步骤. 接收 – 缓存从网络中读取抵达的请求报文.

HTTP头部详解

- - CSDN博客推荐文章
HTTP(HyperTextTransferProtocol)是超文本传输协议的缩写,它用于传送WWW方式的数据,关于HTTP 协议的详细内容请参考RFC2616. HTTP协议采用了请求/响应模型. 客户端向服务器发送一个请求,请求头包含请求的方法、URI、协议版本、以及包含请求修饰符、客户信息和内容的类似于MIME的消息结构.

HTTP断点续传

- - CSDN博客互联网推荐文章
要实现断点续传的功能,通常都需要客户端记录下当前的下载进度,并在需要续传的时候通知服务端本次需要下载的内容片段. HTTP1.1协议(RFC2616)中定义了断点续传相关的HTTP头 Range和Content-Range字段,一个最简单的断点续传实现大概如下:.   1.客户端下载一个1024K的文件,已经下载了其中512K.

HTTP负载测试

- - 博客 - 伯乐在线
英文原文: ON HTTP LOAD TESTING 来源: oschina. 有很多人在谈论HTTP服务器软件的性能测试,也许是因为现在有太多的服务器选择. 这很好,但是我看到有人很多基本相同的问题,使得测试结果的推论值得怀疑. 在日常工作中花费了很多时间在高性能代理缓存和源站性能测试方面之后,这里有我认为比较重要的一些方面来分享.