HTTP 协议的请求和响应报文中必定包含 HTTP 首部,只是我们平时 在使用 Web 的过程中感受不到它。

HTTP 报文首部

image.png
HTTP 协议的请求和响应报文中必定包含HTTP首部。

首部内容为客户端和服务器分别处理请求和响应提供所需要的信息。对于客户端用户来说,这些信息中的大部分内容都无须亲自查看。

HTTP 请求报文

在请求中,HTTP 报文由方法、URI、HTTP 版本、HTTP 首部字段等 部分构成。
image.png

示例信息
image.png

HTTP 响应报文

在响应中,HTTP 报文由 HTTP 版本、状态码(数字和原因短语)、 HTTP 首部字段 3 部分构成。
image.png

示例信息
image.png

在报文众多的字段当中,HTTP首部字段包含的信息最为丰富。首部字段同时存在于请求和响应报文内,并涵盖 HTTP报文相关的内容信息。

HTTP 首部字段

HTTP 首部字段传递重要信息

HTTP 首部字段是构成 HTTP报文的要素之一。在客户端与服务器之间以HTTP协议进行通信的过程中,无论是请求还是响应都会使用首部字段,它能起到传递额外重要信息的作用。

使用首部字段是为了给浏览器和服务器提供报文主体大小、所使用的语言、认证信息等内容。
image.png

HTTP 首部字段结构

HTTP 首部字段是由首部字段名和字段值构成的,中间用冒号“:” 分隔

1
2
3
首部字段名: 字段值

Content-Type: text/html // 表示报文主体对象类型。

字段值对应单个 HTTP 首部字段可以有多个值

1
Keep-Alive: timeout=15, max=100

若 HTTP 首部字段重复了会如何

这种情况在规范内尚未明确,根据浏览器内部处理逻辑的不同,结果可能并不一致。

  • 有些浏览器会优先处理第一次出现的首部字段,
  • 有些则会优先处理最后出现的首部字段。

4 种 HTTP 首部字段类型

根据实际用途被分为以下 4 种类型

  • 通用首部字段(General Header Fields)
    • 请求报文和响应报文两方都会使用的首部
  • 请求首部字段(Request Header Fields)
    • 从客户端向服务器端发送请求报文时使用的首部。补充了请求的附加内容、客户端信息、响应内容相关优先级等信息。
  • 响应首部字段(Response Header Fields)
    • 从服务器端向客户端返回响应报文时使用的首部。补充了响应的附加内容,也会要求客户端附加额外的内容信息。
  • 实体首部字段(Entity Header Fields)
    • 针对请求报文和响应报文的实体部分使用的首部。补充了资源内容更新时间等与实体有关的信息

HTTP/1.1 首部字段一览

通用首部字段
image.png

请求首部字段
image.pngimage.png

响应首部字段
image.png

实体首部字段
image.png

非 HTTP/1.1 首部字段

不限于 RFC2616 中定 义的 47 种首部字段。还有 Cookie、Set-Cookie 和 Content-Disposition 等在其他 RFC 中定义的首部字段,它们的使用频率也很高。

这些非正式的首部字段统一归纳在 RFC4229 HTTP Header Field Registrations 中。

End-to-end 首部和 Hop-by-hop 首部

HTTP 首部字段将定义成缓存代理和非缓存代理的行为,分成 2 种类型

  • 端到端首部(End-to-end Header)
    • 分在此类别中的首部会转发给请求/响应对应的最终接收目标
    • 且必须保存在由缓存生成的响应中
    • 另外规定它必须被转发
  • 逐跳首部(Hop-by-hop Header)
    • 分在此类别中的首部只对单次转发有效
    • 会因通过缓存或代理而不再转发
    • HTTP/1.1 和之后版本中,如果要使用hop-by-hop首部,需提供Connection首部字段。

逐跳首部字段

  • Connection
  • Keep-Alive
  • Proxy-Authenticate
  • Proxy-Authorization
  • Trailer
  • TE
  • Transfer-Encoding
  • Upgrade

其他所有字段都属于端到端首部

HTTP/1.1 通用首部字段

请求报文和响应报文双方都会使用的首部

Cache-Control

指定首部字段 Cache-Control 的指令,就能操作缓存的工作机制。
image.png

指令的参数是可选的,多个指令之间通过“,”分隔。首部字段 Cache-Control 的指令可用于请求及响应时。

1
Cache-Control: private, max-age=0, no-cache

缓存请求指令
image.png

缓存响应指令
image.png

是否能缓存的指令

public 指令
1
Cache-Control: public

当指定使用 public 指令时,则明确表明其他用户也可利用缓存。

private 指令

image.png

1
Cache-Control: private

当指定 private 指令后,响应只以特定的用户作为对象,这与 public指令的行为相反

缓存服务器会对该特定用户提供资源缓存的服务,对于其他用户发送过来的请求,代理服务器则不会返回缓存

no-cache 指令

image.png

1
Cache-Control: no-cache

使用 no-cache 指令的目的是为了防止从缓存中返回过期的资源。

客户端发送的请求中如果包含no-cache指令,则表示客户端将不会接收缓存过的响应。于是,“中间”的缓存服务器必须把客户端请求转发给源服务器。

如果服务器返回的响应中包含no-cache指令,那么缓存服务器不能对资源进行缓存。源服务器以后也将不再对缓存服务器请求中提出的资源有效性进行确认,且禁止其对响应资源进行缓存操作。

1
Cache-Control: no-cache=Location

若报文首部字段 Cache-Control中对no-cache字段名具体指定参数值,那么客户端在接收到这个被指定参数值的首部字段对应的响应报文后,就不能使用缓存。

换言之,无参数值的首部字段可以使用缓存。只能在响应指令中指定该参数。

控制可执行缓存的对象的指令

no-store 指令
1
Cache-Control: no-store

当使用 no-store 指令时,暗示请求(和对应的响应)或响应中包含机密信息。

从字面意思上很容易把 no-cache 误解成为不缓存,但事实上 no-cache 代表不缓 存过期的资源,缓存会向源服务器进行有效期确认后处理资源,也许称为 do-not- serve-from-cache-without-revalidation更合适。no-store才是真正地不进行缓存

指定缓存期限和认证的指令

s-maxage 指令
1
Cache-Control: s-maxage=604800(单位 :秒)

s-maxage 指令的功能和max-age指令的相同,它们的不同点是s-maxage指令只适用于供多位用户使用的公共缓存服务器

对于向同一用户重复返回响应的服务器来说,这个指令没有任何作用。

当使用s-maxage指令后,则直接忽略对Expires首部字段及max-age指令的处理。

max-age 指令

image.png

1
Cache-Control: max-age=604800(单位:秒)

当客户端发送的请求中包含max-age指令时,如果判定缓存资源的缓存时间数值比指定时间的数值更小,那么客户端就接收缓存的资源。另外,当指定max-age值为0,那么缓存服务器通常需要将请求转发给源服务器

当服务器返回的响应中包含max-age指令时,缓存服务器将不对资源的有效性再作确认,而 max-age 数值代表资源保存为缓存的最长���间。

  • 应用 HTTP/1.1 版本的缓存服务器遇到同时存在 Expires 首部字段的情 况时,会优先处理 max-age 指令,而忽略掉 Expires 首部字段。
  • HTTP/1.0 版本的缓存服务器的情况却相反,max-age 指令会被忽略掉。

min-fresh 指令

image.png

1
Cache-Control: min-fresh=60(单位:秒)

min-fresh 指令要求缓存服务器返回至少还未过指定时间的缓存资源

max-stale 指令
1
Cache-Control: max-stale=3600(单位:秒)

使用 max-stale 可指示缓存资源,即使过期也照常接收。

  • 如果指令未指定参数值,那么无论经过多久,客户端都会接收响应;
  • 如果指令中指定了具体数值,那么即使过期,只要仍处于max-stale指定的时间内,仍旧会被客户端接收

only-if-cached 指令
1
Cache-Control: only-if-cached

使用 only-if-cached 指令表示客户端仅在缓存服务器本地缓存目标资源的情况下才会要求其返回。

该指令要求缓存服务器不重新加载响应,也不会再次确认资源有效性。若发生请求缓存服务器的本地缓存无响应,则返回状态码 504 Gateway Timeout。

must-revalidate 指令
1
Cache-Control: must-revalidate

使用must-revalidate指令,代理会向源服务器再次验证即将返回的响应缓存目前是否仍然有效。

若代理无法连通源服务器再次获取有效资源的话,缓存必须给客户端一条504(Gateway Timeout)状态码。

另外,使用 must-revalidate 指令会忽略请求的 max-stale 指令(即使已 经在首部使用了 max-stale,也不会再有效果)。

image.png

proxy-revalidate 指令
1
Cache-Control: proxy-revalidate

proxy-revalidate指令要求所有的缓存服务器在接收到客户端带有该指令的请求返回响应之前,必须再次验证缓存的有效性。

no-transform 指令
1
Cache-Control: no-transform

使用 no-transform 指令规定无论是在请求还是响应中,缓存都不能改变实体主体的媒体类型。

这样做可防止缓存或代理压缩图片等类似操作

Cache-Control 扩展

cache-extension token

1
Cache-Control: private, community="UCI"

通过 cache-extension 标记(token),可以扩展 Cache-Control 首部字 段内的指令。

Connection

Connection 首部字段具备如下两个作用

  • 控制不再转发给代理的首部字段
  • 管理持久连接

控制不再转发给代理的首部字段

image.png

在客户端发送请求和服务器返回响应内,使用 Connection 首部字 段,可控制不再转发给代理的首部字段

管理持久连接

image.png

1
Connection: close

HTTP/1.1 版本的默认连接都是持久连接。为此,客户端会在持久连接上连续发送请求。当服务器端想明确断开连接时,则指定 Connection 首部字段的值为 Close。

image.png

1
Connection: Keep-Alive

HTTP/1.1 之前的HTTP版本的默认连接都是非持久连接。为此,如果想在旧版本的 HTTP 协议上维持持续连接,则需要指定 Connection 首部字段的值为 Keep-Alive。

Date

首部字段 Date 表明创建 HTTP 报文的日期和时间。
image.png

  • HTTP/1.1 协议使用在 RFC1123 中规定的日期时间的格式
  • 之前的 HTTP 协议版本中使用在 RFC850 中定义的格式

Pragma

HTTP/1.1 之前版本的历史遗留字段,仅作为与 HTTP/1.0 的向后兼容而定义。

规范定义的形式唯一

1
Pragma: no-cache

该首部字段属于通用首部字段,但只用在客户端发送的请求中。客户端会要求所有的中间服务器不返回缓存的资源

image.png
所有的中间服务器如果都能以 HTTP/1.1 为基准,那直接采用 Cache- Control: no-cache 指定缓存的处理方式是最为理想的。但要整体掌握全部中间服务器使用的HTTP协议版本却是不现实的。因此,发送的请求会同时含有下面两个首部字段。

1
2
Cache-Control: no-cache 
Pragma: no-cache

Trailer

image.png
事先说明在报文主体后记录了哪些首部字段,该首部字段可应用在HTTP/1.1版本分块传输编码时。

1
2
3
4
5
6
7
8
HTTP/1.1 200 OK 
Date: Tue, 03 Jul 2012 04:40:56 GMT
Content-Type: text/html
...
Transfer-Encoding: chunked Trailer: Expires
...(报文主体)...
0
Expires: Tue, 28 Sep 2004 23:59:59 GMT

Transfer-Encoding

image.png
规定了传输报文主体时采用的编码方式

HTTP/1.1 的传输编码方式仅对分块传输编码有效。

Upgrade

用于检测 HTTP 协议及其他协议是否可使用更高的版本进行通信,其参数值可以用来指定一个完全不同的通信协议。
image.png
首部字段 Upgrade 指定的值为 TLS/1.0。Upgrade 首部字段产生作用的 Upgrade 对象仅限于客户端和邻接服务器之间。因此,使用首部字段Upgrade时,还需要额外指定 Connection:Upgrade。

Via

追踪客户端与服务器之间的请求和响应报文的传输路径。报文经过代理或网关时,会先在首部字段 Via 中附加该服务器的信息,然后再进行转发。

首部字段Via不仅用于追踪报文的转发,还可避免请求回环的发生。所以必须在经过代理时附加该首部字段内容
image.png
Via 首部是为了追踪传输路径,所以经常会和 TRACE 方法一起使 用。

Warning

HTTP/1.1 的 Warning 首部是从 HTTP/1.0 的响应首部(Retry-After)演 变过来的。该首部通常会告知用户一些与缓存相关的问题的警告。

1
Warning: [警告码][警告的主机:端口号]“[警告内容]”([日期时间])

HTTP/1.1 中定义了 7 种警告
image.png

请求首部字段

请求首部字段是从客户端往服务器端发送请求报文中所使用的字段,用于补充请求的附加信息、客户端信息、对响应内容相关的优先级等内容
image.png

Accept

image.png
Accept 首部字段可通知服务器,用户代理能够处理的媒体类型及媒体类型的相对优先级。可使用 type/subtype 这种形式,一次指定多种媒体类型。

1
2
3
4
5
6
7
8
9
10
11
// 文本文件 
text/html, text/plain, text/css ... application/xhtml+xml, application/xml ...

// 图片文件
image/jpeg, image/gif, image/png ...

// 视频文件
video/mpeg, video/quicktime ...

// 应用程序使用的二进制文件
application/octet-stream, application/zip ...

若想要给显示的媒体类型增加优先级,则使用q=来额外表示权重值 1,用分号(;)进行分隔。权重值 q 的范围是0~1(可精确到小数点后3 位),且 1 为最大值。不指定权重q值时,默认权重为q=1.0。

Accept-Charset

image.png
Accept-Charset 首部字段可用来通知服务器用户代理支持的字符集及字符集的相对优先顺序。另外,可一次性指定多种字符集。与首部字段Accept相同的是可用权重 q 值来表示相对优先级。

Accept-Encoding

image.png

1
Accept-Encoding: gzip, deflate

Accept-Encoding 首部字段用来告知服务器用户代理支持的内容编码及内容编码的优先级顺序。可一次性指定多种内容编码。

内容编码

  • gzip
    • 由文件压缩程序 gzip(GNU zip)生成的编码格式
    • 采用 Lempel-Ziv 算法(LZ77)及 32 位循环冗余 校验(Cyclic Redundancy Check,通称 CRC)。
  • compress
    • 由 UNIX 文件压缩程序 compress 生成的编码格式
    • 采用 Lempel- Ziv-Welch 算法(LZW)。
  • deflate
    • 组合使用 zlib 格式(RFC1950)
    • 由 deflate 压缩算法 (RFC1951)生成的编码格式
  • identity
    • 不执行压缩或不会变化的默认编码格式

Accept-Language

image.png

1
Accept-Language: zh-cn,zh;q=0.7,en-us,en;q=0.3

首部字段Accept-Language用来告知服务器用户代理能够处理的自然语言集(指中文或英文等),以及自然语言集的相对优先级。可一次指定多种自然语言集

Authorization

image.png

1
Authorization: Basic dWVub3NlbjpwYXNzd29yZA==

首部字段Authorization是用来告知服务器,用户代理的认证信息(证书值)。通常,想要通过服务器认证的用户代理会在接收到返回的401状态码响应后,把首部字段 Authorization 加入请求中。共用缓存在接收到含有Authorization首部字段的请求时的操作处理会略有差异。

Expect

image.png

1
Expect: 100-continue

客户端使用首部字段Expect来告知服务器,期望出现的某种特定行为。因服务器无法理解客户端的期望作出回应而发生错误时,会返回状态码 417 Expectation Failed。

客户端可以利用该首部字段,写明所期望的扩展。

From

image.png
首部字段From用来告知服务器使用用户代理的用户的电子邮件地址。

通常,其使用目的就是为了显示搜索引擎等用户代理的负责人的电子邮件联系方式。使用代理时,应尽可能包含From首部字段(但可能会因代理不同,将电子邮件地址记录在 User-Agent 首部字段内)。

Host

image.png
虚拟主机运行在同一个 IP 上,因此使用首部字段Host加以区分。首部字段 Host 会告知服务器,请求的资源所处的互联网主机名和端口号。Host 首部字段在 HTTP/1.1 规范内是唯一一个必须被包含在请求内的首部字段。

If-Match

image.png
形如 If-xxx 这种样式的请求首部字段,都可称为条件请求。服务器接收到附带条件的请求后,只有判断指定条件为真时,才会执行请求。

image.png
只有当 If-Match 的字段值跟 ETag 值匹配一致时,服务器才会接受请求

1
If-Match: "123456"

首部字段 If-Match,属附带条件之一,它会告知服务器匹配资源所用的实体标记(ETag)值。

还可以使用星号(*)指定 If-Match 的字段值。针对这种情况,服务 器将会忽略 ETag 的值,只要资源存在就处理请求。

If-Modified-Since

image.png

1
If-Modified-Since: Thu, 15 Apr 2004 00:00:00 GMT

首部字段 If-Modified-Since,属附带条件之一,它会告知服务器若If-Modified-Since字段值早于资源的更新时间,则希望能处理该请求。 而在指定If-Modified-Since 字段值的日期时间之后,如果请求的资源 都没有过更新,则返回状态码 304 Not Modified 的响应

If-None-Match

image.png
首部字段 If-None-Match属于附带条件之一。它和首部字段If-Match作用相反。用于指定 If-None-Match 字段值的实体标记(ETag)值与请求资源的ETag不一致时,它就告知服务器处理该请求。

If-Range

image.png
首部字段 If-Range 属于附带条件之一。它告知服务器若指定的If-Range字段值(ETag 值或者时间)和请求资源的ETag值或时间相一致时,则作为范围请求处理。反之,则返回全体资源

image.png

If-Unmodified-Since

首部字段 If-Unmodified-Since 和首部字段 If-Modified-Since 的作用相 反。它的作用的是告知服务器,指定的请求资源只有在字段值内指定 的日期时间之后,未发生更新的情况下,才能处理请求。

Max-Forwards

image.png
每次转发数值减 1。当数值变 0 时返回响应

通过 TRACE 方法或 OPTIONS方法,发送包含首部字段Max-Forwards的请求时,该字段以十进制整数形式指定可经过的服务器最大数目。服务器在往下一个服务器转发请求之前,Max-Forwards的值减1后重新赋值。当服务器接收到 Max-Forwards 值为 0 的请求 时,则不再进行转发,而是直接返回响应

使用 HTTP 协议通信时,请求可能会经过代理等多台服务器。途中,如果代理服务器由于某些原因导致请求转发失败,客户端也就等不到服务器返回的响应了。对此,我们无从可知。

可以灵活使用首部字段 Max-Forwards,针对以上问题产生的原因展 开调查。由于当 Max-Forwards 字段值为0时,服务器就会立即返回响应,由此我们至少可以对以那台服务器为终点的传输路径的通信状 况有所把握。

image.png

Proxy-Authorization

1
Proxy-Authorization: Basic dGlwOjkpNLAGfFY5

接收到从代理服务器发来的认证质询时,客户端会发送包含首部字段Proxy-Authorization 的请求,以告知服务器认证所需要的信息。

这个行为是与客户端和服务器之间的HTTP访问认证相类似的,不同之处在于,认证行为发生在客户端与代理之间。客户端与服务器之间 的认证,使用首部字段Authorization 可起到相同作用。

Range

对于只需获取部分资源的范围请求,包含首部字段Range即可告知服务器资源的指定范围。

Referer

image.png

1
Referer: http://www.hackr.jp/index.htm

首部字段 Referer 会告知服务器请求的原始资源的 URI。

客户端一般都会发送 Referer 首部字段给服务器。但当直接在浏览器的地址栏输入 URI,或出于安全性的考虑时,也可以不发送该首部字段

另外,Referer 的正确的拼写应该是 Referrer,但不知为何,大家一直 沿用这个错误的拼写

TE

1
TE: gzip, deflate;q=0.5

首部字段 TE 会告知服务器客户端能够处理响应的传输编码方式及相对优先级。它和首部字段 Accept-Encoding 的功能很相像,但是用于传输编码。

首部字段 TE 除指定传输编码之外,还可以指定伴随 trailer 字段的分 块传输编码的方式。应用后者时,只需把 trailers 赋值给该字段值。

User-Agent

image.png
首部字段 User-Agent 会将创建请求的浏览器和用户代理名称等信息传 达给服务器。

响应首部字段

响应首部字段是由服务器端向客户端返回响应报文中所使用的字段,用于补充响应的附加信息、服务器信息,以及对客户端的附加要求等信息。

image.png

Accept-Ranges

image.png
首部字段 Accept-Ranges 是用来告知客户端服务器是否能处理范围请求,以指定获取服务器端某个部分的资源。

可指定的字段值有两种:

  • 可处理范围请求时指定其为 bytes
  • 反之则 指定其为 none

Age

image.png
首部字段 Age 能告知客户端,源服务器在多久前创建了响应。字段值的单位为秒

若创建该响应的服务器是缓存服务器,Age值是指缓存后的响应再次发起认证到认证完成的时间值。代理创建响应时必须加上首部字段 Age。

ETag

image.png

首部字段 ETag 能告知客户端实体标识。它是一种可将资源以字符串形式做唯一性标识的方式。服务器会为每份资源分配对应的 ETag 值。

当资源更新时,ETag 值也需要更新。生成ETag值时,并没有统一的算法规则,而仅仅是由服务器来分配。

image.png
资源被缓存时,就会被分配唯一性标识

强 ETag 值和弱 Tag 值

  • 强 ETag 值
    • 强 ETag 值,不论实体发生多么细微的变化都会改变其值
    • ETag: “usagi-1234”
  • 弱 ETag 值
    • 弱 ETag 值只用于提示资源是否相同。
    • 只有资源发生了根本改变,产生差异时才会改变ETag值。在字段值最开始处附加 W/。
    • ETag: W/“usagi-1234”

Location

image.png

1
Location: http://www.usagidesign.jp/sample.html

使用首部字段 Location 可以将响应接收方引导至某个与请求 URI 位置 不同的资源。

基本上,该字段会配合 3xx :Redirection 的响应,提供重定向的 URI。

几乎所有的浏览器在接收到包含首部字段 Location 的响应后,都会强 制性地尝试对已提示的重定向资源的访问。

Proxy-Authenticate

1
Proxy-Authenticate

首部字段 Proxy-Authenticate 会把由代理服务器所要求的认证信息发送给客户端。

它与客户端和服务器之间的HTTP访问认证的行为相似,不同之处在于其认证行为是在客户端与代理之间进行的。

Retry-After

image.png

1
Retry-After: 120

首部字段 Retry-After 告知客户端应该在多久之后再次发送请求。

Server

image.png
首部字段 Server 告知客户端当前服务器上安装的HTTP服务器应用程序的信息。不单单会标出服务器上的软件应用名称,还有可能包括版本号和安装时启用的可选项。

Vary

image.png
当代理服务器接收到带有Vary首部字段指定获取资源的请求时,如果使用的Accept-Language字段的值相同,那么就直接从缓存返回响应。反之,则需要先从源服务器端获取资源后才能作为响应返回

1
Vary: Accept-Language

首部字段 Vary 可对缓存进行控制。源服务器会向代理服务器传达关于本地缓存使用方法的命令。

从代理服务器接收到源服务器返回包含Vary指定项的响应之后,若再要进行缓存,仅对请求中含有相同 Vary 指定首部字段的请求返回缓存。

即使对相同资源发起请求,但由于Vary指定的首部字段不相同,因此必须要从源服务器重新获取资源

WWW-Authenticate

首部字段 WWW-Authenticate 用于 HTTP 访问认证。它会告知客户端 适用于访问请求 URI 所指定资源的认证方案(Basic 或是 Digest)和带参数提示的质询(challenge)

实体首部字段

实体首部字段是包含在请求报文和响应报文中的实体部分所使用的首部,用于补充内容的更新时间等与实体相关的信息image.png

Allow

image.png

1
Allow: GET, HEAD

首部字段 Allow 用于通知客户端能够支持 Request-URI 指定资源的所有HTTP方法

当服务器接收到不支持的 HTTP 方法时,会以状态码 405 Method Not   Allowed作为响应返回。

Content-Encoding

1
Content-Encoding: gzip

首部字段 Content-Encoding会告知客户端服务器对实体的主体部分选用的内容编码方式。内容编码是指在不丢失实体信息的前提下所进行的压缩

image.png

Content-Language

image.png

1
Content-Language: zh-CN

首部字段 Content-Language 会告知客户端,实体主体使用的自然语言 (指中文或英文等语言)。

Content-Length

image.png

1
Content-Length: 15000

首部字段 Content-Length表明了实体主体部分的大小(单位是字节)。对实体主体进行内容编码传输时,不能再使用 Content-Length 首部字段。

Content-Location

1
Content-Location: http://www.hackr.jp/index-ja.html

首部字段 Content-Location 给出与报文主体部分相对应的 URI。和首 部字段 Location 不同,Content-Location 表示的是报文主体返回资源对应的 URI。

Content-MD5

image.png
客户端会对接收的报文主体执行相同的 MD5 算法,然后与首部字段 Content-MD5 的字段值比较

目的在于检 查报文主体在传输过程中是否保持完整,以及确认传输到达。为确保报文的有效性,作为接 收方的客户端会对报文主体再执行一次相同的 MD5 算法。计算出的值与字段值作比较后,即可判断出报文主体的准确性。

采用这种方法,对内容上的偶发性改变是无从查证的,也无法检测出恶意篡改。

Content-Range

image.png

1
Content-Range: bytes 5001-10000/10000

能告知客户端作为响应返回的实体的哪个部分符合范围请求。字段值以字节为单位,表示当前发送部分及整个实体大小

Content-Type

1
Content-Type: text/html; charset=UTF-8

首部字段 Content-Type 说明了实体主体内对象的媒体类型。和首部字段 Accept 一样,字段值用 type/subtype 形式赋值。

Expires

image.png
首部字段 Expires 会将资源失效的日期告知客户端。缓存服务器在接收到含有首部字段Expires的响应后,会以缓存来应答请求,在Expires字段值指定的时间之前,响应的副本会一直被保存。当超过指定的时间后,缓存服务器在请求发送过来时,会转向源服务器请求资源

源服务器不希望缓存服务器对资源缓存时,最好在Expires字段内写入与首部字段 Date 相同的时间值。

Last-Modified

image.png
首部字段 Last-Modified 指明资源最终修改的时间。一般来说,这个值就是 Request-URI指定资源被修改的时间。但类似使用CGI脚本进行动态数据处理时,该值有可能会变成数据最终修改时的时间。

Cookie 的工作机制是用户识别及状态管理。

调用Cookie时,由于可校验Cookie的有效期,以及发送方的域、路径、协议等信息,所以正规发布的 Cookie 内的数据不会因来自其他Web站点和攻击者的攻击而泄露。

为 Cookie 服务的首部字段

image.png

1
Set-Cookie: status=enable; expires=Tue, 05 Jul 2011 07:26:31

当服务器准备开始管理客户端的状态时,会事先告知各种信息。

Set-Cookie 字段的属性
image.png

expires 属性

Cookie 的 expires 属性指定浏览器可发送 Cookie 的有效期。

当省略 expires 属性时,其有效期仅限于维持浏览器会话(Session) 时间段内。这通常限于浏览器应用程序被关闭之前。

另外,一旦 Cookie 从服务器端发送至客户端,服务器端就不存在可以显式删除 Cookie的方法。但可通过覆盖已过期的Cookie,实现对 客户端Cookie 的实质性删除操作。

path 属性

Cookie 的 path 属性可用于限制指定 Cookie 的发送范围的文件目录。 不过另有办法可避开这项限制,看来对其作为安全机制的效果不能抱有期待。

domain 属性

通过 Cookie 的 domain 属性指定的域名可做到与结尾匹配一致。

当指定 example.com 后,除 example.com 以外,www.example.com 或 www2.example.com 等都可以发送 Cookie。

因此,除了针对具体指定的多个域名发送 Cookie 之 外,不指定 domain 属性显得更安全

secure 属性

Cookie 的 secure 属性用于限制 Web 页面仅在 HTTPS 安全连接时,才 可以发送 Cookie。

当省略 secure 属性时,不论 HTTP 还是 HTTPS,都会对 Cookie 进行 回收。

HttpOnly 属性

Cookie 的 HttpOnly 属性是 Cookie 的扩展功能,它使 JavaScript 脚本 无法获得 Cookie。主要目的为防止跨站脚本攻击(Cross-site scripting,XSS)对 Cookie 的信息窃取。

1
Set-Cookie: name=value; HttpOnly

主流浏览器都已经支持该扩展了。另外顺带一提,该扩展并非是为了防止XSS 而开发的

1
Cookie: status=enable

首部字段 Cookie 会告知服务器,当客户端想获得HTTP状态管理支持时,就会在请求中包含从服务器接收到的Cookie。接收到多个Cookie时,同样可以以多个Cookie形式发送

其他首部字段

HTTP 首部字段是可以自行扩展的。所以在Web服务器和浏览器的应用上,会出现各种非标准的首部字段。

X-Frame-Options

1
X-Frame-Options: DENY

首部字段 X-Frame-Options 属于 HTTP 响应首部,用于控制网站内容 在其他 Web 网站的 Frame 标签内的显示问题。其主要目的是为了防止点击劫持(clickjacking)攻击

  • DENY
    • 拒绝
  • SAMEORIGIN
    • 仅同源域名下的页面(Top-level-browsing- context)匹配时许可。

X-XSS-Protection

1
X-XSS-Protection: 1

首部字段 X-XSS-Protection属于HTTP响应首部,它是针对跨站脚本攻击(XSS)的一种对策,用于控制浏览器 XSS 防护机制的开关。

  • 0 :将 XSS 过滤设置成无效状态
  • 1 :将 XSS 过滤设置成有效状态

DNT

image.png

1
DNT: 1

首部字段 DNT 属于 HTTP 请求首部,其中 DNT 是 Do Not Track 的简 称,意为拒绝个人信息被收集,是表示拒绝被精准广告追踪的一种方法

  • 0 :同意被追踪
  • 1 :拒绝被追踪

由于首部字段 DNT 的功能具备有效性,所以 Web 服务器需要对 DNT 做对应的支持

P3P

1
P3P: CP="CAO DSP LAW CURa ADMa DEVa TAIa PSAa PSDa IVAa IVDa OUR BUS IND UNI COM NAV INT"

首部字段 P3P 属于 HTTP 相应首部,通过利用 P3P(The Platform for Privacy Preferences,在线隐私偏好平台)技术,可以让Web网站上的个人隐私变成一种仅供程序可理解的形式,以达到保护用户隐私的目的

步骤

  • 创建 P3P 隐私
  • 创建 P3P 隐私对照文件后,保存命名在 /w3c/p3p.xml
  • 从 P3P 隐私中新建 Compact policies 后,输出到 HTTP 响应 中