跳转至

12 响应状态码该怎么用?

前两讲中,我们学习了HTTP报文里请求行的组成部分,包括请求方法和URI。有了请求行,加上后面的头字段就形成了请求头,可以通过TCP/IP协议发送给服务器。

服务器收到请求报文,解析后需要进行处理,具体的业务逻辑多种多样,但最后必定是拼出一个响应报文发回客户端。

响应报文由响应头加响应体数据组成,响应头又由状态行和头字段构成。

我们先来复习一下状态行的结构,有三部分:

开头的Version部分是HTTP协议的版本号,通常是HTTP/1.1,用处不是很大。

后面的Reason部分是原因短语,是状态码的简短文字描述,例如“OK”“Not Found”等等,也可以自定义。但它只是为了兼容早期的文本客户端而存在,提供的信息很有限,目前的大多数客户端都会忽略它。

所以,状态行里有用的就只剩下中间的状态码(Status Code)了。它是一个十进制数字,以代码的形式表示服务器对请求的处理结果,就像我们通常编写程序时函数返回的错误码一样。

不过你要注意,它的名字是“状态码”而不是“错误码”。也就是说,它的含义不仅是错误,更重要的意义在于表达HTTP数据处理的“状态”,客户端可以依据代码适时转换处理状态,例如继续发送请求、切换协议,重定向跳转等,有那么点TCP状态转换的意思。

状态码

目前RFC标准里规定的状态码是三位数,所以取值范围就是从000到999。但如果把代码简单地从000开始顺序编下去就显得有点太“low”,不灵活、不利于扩展,所以状态码也被设计成有一定的格式。

RFC标准把状态码分成了五类,用数字的第一位表示分类,而099不用,这样状态码的实际可用范围就大大缩小了,由000999变成了100~599。

这五类的具体含义是:

  • 1××:提示信息,表示目前是协议处理的中间状态,还需要后续的操作;
  • 2××:成功,报文已经收到并被正确处理;
  • 3××:重定向,资源位置发生变动,需要客户端重新发送请求;
  • 4××:客户端错误,请求报文有误,服务器无法处理;
  • 5××:服务器错误,服务器在处理请求时内部发生了错误。

在HTTP协议中,正确地理解并应用这些状态码不是客户端或服务器单方的责任,而是双方共同的责任。

客户端作为请求的发起方,获取响应报文后,需要通过状态码知道请求是否被正确处理,是否要再次发送请求,如果出错了原因又是什么。这样才能进行下一步的动作,要么发送新请求,要么改正错误重发请求。

服务器端作为请求的接收方,也应该很好地运用状态码。在处理请求时,选择最恰当的状态码回复客户端,告知客户端处理的结果,指示客户端下一步应该如何行动。特别是在出错的时候,尽量不要简单地返400、500这样意思含糊不清的状态码。

目前RFC标准里总共有41个状态码,但状态码的定义是开放的,允许自行扩展。所以Apache、Nginx等Web服务器都定义了一些专有的状态码。如果你自己开发Web应用,也完全可以在不冲突的前提下定义新的代码。

在我们的实验环境里也可以对这些状态码做测试验证,访问URI“/12-1”,用查询参数“code=xxx”来检查这些状态码的效果,服务器不仅会在状态行里显示状态码,还会在响应头里用自定义的“Expect-Code”字段输出这个代码。

例如,在Chrome里访问“http://www.chrono.com/12-1?code=405”的结果如下图。

接下来我就挑一些实际开发中比较有价值的状态码逐个详细介绍。

1××

1××类状态码属于提示信息,是协议处理的中间状态,实际能够用到的时候很少。

我们偶尔能够见到的是“101 Switching Protocols”。它的意思是客户端使用Upgrade头字段,要求在HTTP协议的基础上改成其他的协议继续通信,比如WebSocket。而如果服务器也同意变更协议,就会发送状态码101,但这之后的数据传输就不会再使用HTTP了。

2××

2××类状态码表示服务器收到并成功处理了客户端的请求,这也是客户端最愿意看到的状态码。

200 OK”是最常见的成功状态码,表示一切正常,服务器如客户端所期望的那样返回了处理结果,如果是非HEAD请求,通常在响应头后都会有body数据。

204 No Content”是另一个很常见的成功状态码,它的含义与“200 OK”基本相同,但响应头后没有body数据。所以对于Web服务器来说,正确地区分200和204是很必要的。

206 Partial Content”是HTTP分块下载或断点续传的基础,在客户端发送“范围请求”、要求获取资源的部分数据时出现,它与200一样,也是服务器成功处理了请求,但body里的数据不是资源的全部,而是其中的一部分。

状态码206通常还会伴随着头字段“Content-Range”,表示响应报文里body数据的具体范围,供客户端确认,例如“Content-Range: bytes 0-99/2000”,意思是此次获取的是总计2000个字节的前100个字节。

3××

3××类状态码表示客户端请求的资源发生了变动,客户端必须用新的URI重新发送请求获取资源,也就是通常所说的“重定向”,包括著名的301、302跳转。

301 Moved Permanently”俗称“永久重定向”,含义是此次请求的资源已经不存在了,需要改用新的URI再次访问。

与它类似的是“302 Found”,曾经的描述短语是“Moved Temporarily”,俗称“临时重定向”,意思是请求的资源还在,但需要暂时用另一个URI来访问。

301和302都会在响应头里使用字段Location指明后续要跳转的URI,最终的效果很相似,浏览器都会重定向到新的URI。两者的根本区别在于语义,一个是“永久”,一个是“临时”,所以在场景、用法上差距很大。

比如,你的网站升级到了HTTPS,原来的HTTP不打算用了,这就是“永久”的,所以要配置301跳转,把所有的HTTP流量都切换到HTTPS。

再比如,今天夜里网站后台要系统维护,服务暂时不可用,这就属于“临时”的,可以配置成302跳转,把流量临时切换到一个静态通知页面,浏览器看到这个302就知道这只是暂时的情况,不会做缓存优化,第二天还会访问原来的地址。

304 Not Modified” 是一个比较有意思的状态码,它用于If-Modified-Since等条件请求,表示资源未修改,用于缓存控制。它不具有通常的跳转含义,但可以理解成“重定向已到缓存的文件”(即“缓存重定向”)。

301、302和304分别涉及了HTTP协议里重要的“重定向跳转”和“缓存控制”,在之后的课程中我还会细讲。

4××

4××类状态码表示客户端发送的请求报文有误,服务器无法处理,它就是真正的“错误码”含义了。

400 Bad Request”是一个通用的错误码,表示请求报文有错误,但具体是数据格式错误、缺少请求头还是URI超长它没有明确说,只是一个笼统的错误,客户端看到400只会是“一头雾水”“不知所措”。所以,在开发Web应用时应当尽量避免给客户端返回400,而是要用其他更有明确含义的状态码。

403 Forbidden”实际上不是客户端的请求出错,而是表示服务器禁止访问资源。原因可能多种多样,例如信息敏感、法律禁止等,如果服务器友好一点,可以在body里详细说明拒绝请求的原因,不过现实中通常都是直接给一个“闭门羹”。

404 Not Found”可能是我们最常看见也是最不愿意看到的一个状态码,它的原意是资源在本服务器上未找到,所以无法提供给客户端。但现在已经被“用滥了”,只要服务器“不高兴”就可以给出个404,而我们也无从得知后面到底是真的未找到,还是有什么别的原因,某种程度上它比403还要令人讨厌。

4××里剩下的一些代码较明确地说明了错误的原因,都很好理解,开发中常用的有:

  • 405 Method Not Allowed:不允许使用某些方法操作资源,例如不允许POST只能GET;
  • 406 Not Acceptable:资源无法满足客户端请求的条件,例如请求中文但只有英文;
  • 408 Request Timeout:请求超时,服务器等待了过长的时间;
  • 409 Conflict:多个请求发生了冲突,可以理解为多线程并发时的竞态;
  • 413 Request Entity Too Large:请求报文里的body太大;
  • 414 Request-URI Too Long:请求行里的URI太大;
  • 429 Too Many Requests:客户端发送了太多的请求,通常是由于服务器的限连策略;
  • 431 Request Header Fields Too Large:请求头某个字段或总体太大;

5××

5××类状态码表示客户端请求报文正确,但服务器在处理时内部发生了错误,无法返回应有的响应数据,是服务器端的“错误码”。

500 Internal Server Error”与400类似,也是一个通用的错误码,服务器究竟发生了什么错误我们是不知道的。不过对于服务器来说这应该算是好事,通常不应该把服务器内部的详细信息,例如出错的函数调用栈告诉外界。虽然不利于调试,但能够防止黑客的窥探或者分析。

501 Not Implemented”表示客户端请求的功能还不支持,这个错误码比500要“温和”一些,和“即将开业,敬请期待”的意思差不多,不过具体什么时候“开业”就不好说了。

502 Bad Gateway”通常是服务器作为网关或者代理时返回的错误码,表示服务器自身工作正常,访问后端服务器时发生了错误,但具体的错误原因也是不知道的。

503 Service Unavailable”表示服务器当前很忙,暂时无法响应服务,我们上网时有时候遇到的“网络服务正忙,请稍后重试”的提示信息就是状态码503。

503是一个“临时”的状态,很可能过几秒钟后服务器就不那么忙了,可以继续提供服务,所以503响应报文里通常还会有一个“Retry-After”字段,指示客户端可以在多久以后再次尝试发送请求。

小结

  1. 状态码在响应报文里表示了服务器对请求的处理结果;
  2. 状态码后的原因短语是简单的文字描述,可以自定义;
  3. 状态码是十进制的三位数,分为五类,从100到599;
  4. 2××类状态码表示成功,常用的有200、204、206;
  5. 3××类状态码表示重定向,常用的有301、302、304;
  6. 4××类状态码表示客户端错误,常用的有400、403、404;
  7. 5××类状态码表示服务器错误,常用的有500、501、502、503。

课下作业

  1. 你在开发HTTP客户端,收到了一个非标准的状态码,比如4××、5××,应当如何应对呢?
  2. 你在开发HTTP服务器,处理请求时发现报文里缺了一个必需的query参数,应该如何告知客户端错误原因呢?

欢迎你把自己的答案写在留言区,与我和其他同学一起讨论。如果你觉得有所收获,欢迎你把文章分享给你的朋友。

unpreview

精选留言(15)
  • 肥low 👍(43) 💬(8)

    1、4xx一般是服务端业务状态码,看业务上怎么解决的,5xx就比较多了,500、502比如是在lnmp架构下,500是php代码写的很烂,导致nginx的upstream接受错误,抛异常了。502就是php-fpm挂了。504说明有慢查询php-fpm可能还在运行着,可是ngx由于本身的超时设置已经主动断开了,entity too large就是上传发文件超过ngx本身设置,其它的好像还没遇到过,404大多是浏览器请求facon.ico导致的,现在前后端分离根本没这个东西 2、参数错误一般是通过接口返回具体的业务代码来表明,http响应报文一般都是200,也有400的,但是我的经验中一般是返回的body为json格式,然后里面通过一个errno来标识一下,具体怎么规定我觉得在接口文档中写清楚就好

    2019-06-25

  • ly 👍(24) 💬(4)

    个人对状态码使用的理解: 就目前项目开发的过程中,状态码的使用对业务程序来说,基本上很少去利用,大致都是nginx、tomcat、spring等这些框架、中间件会返回一些状态码,例如接口不存在,框架会返回404,nginx配置有问题或者拒绝访问返回403或者502等状态码,一旦正确进入业务接口的时候,不管请求的用户id是否在用户库中存在、以及请求参数中是否缺少必要参数,都是返回200状态码,只是在body的json里面会返回自己特有的业务错误码,例如: {"code":-1,"message:"userid参数必须填写"}。 整体来讲,开发业务的程序员很少会去思考该返回什么http状态码,不知道这样的开发过程是否标准?

    2019-08-11

  • 壹笙☞漂泊 👍(7) 💬(4)

    课后题: 1、给个错误页面、或者弹窗报个错误,然后做跳转 2、在返回body里面写明错误原因,状态码一般给500 总结: 1、状态行结构: version【SP】status code【SP】reason【CRLF】 version:是HTTP协议的版本号,用处不大 reason:是原因短语,简短的文字描述,如果“OK”“Not Found”等等,也可以自定义,用处也不大,很多客户端会忽略,为了兼容早期的文本客户端 status code:状态码,不是错误码,表达状态。以代码的形式表示服务器对请求的处理结果。 2、状态码 RFC标准规定状态码是三位数,把状态码分成了五类,用数字的第一位表示分类。 * 1xx:提示信息,表示目前是协议处理的中间状态,还需要后续的操作; * 2xx: 成功,报文已经收到并被正确处理; * 3xx:重定向,资源位置发生变动,需要客户端重新发送请求; * 4xx:客户端错误,请求报文有误,服务器无法处理; * 5xx:服务器错误,服务器在处理请求时内部发生了错误。

    2019-06-25

  • 👍(6) 💬(2)

    第一个问题: 目前客户端基本都是解析成失败的情况,大部分给个失败错误友好界面 第二个问题: 目前服务器很多也是返回4xx的错误妈,感觉被烂用了,应该要返回5xx,然后我们还会定义一个msg字段,用来说明具体失败的原因

    2019-06-24

  • 马哲富 👍(3) 💬(1)

    希望老师在后续的过程中讲一下206这个断点续传,是不是类似于百度网盘那种下载软件暂停后再继续下载也是类似的原理?

    2019-06-24

  • 彧豪 👍(3) 💬(1)

    1.一般接口报错的话返回的body中都会封装有错误消息,显示消息即可,401一般都不作处理,比如获取登录用户的信息的接口,未登录的时候调是401,是因为没有带相应token过去,登录之后就能正常返回登录用户的信息了,自己处理的情况比如SPA,用户访问了一个不存在的路由,此时前端自己返回一个404的页面,里面是一张图片:“么么哒,网页找不到了耶”之类的🤣🤣,5xx这个时候需要找服务端沟通了,正式上线一般不会出现5xx的错误,一般在开发时出现 2.返回的body中告知前端错误信息 另外就是老师貌似忘了讲401了,401也挺常见/用的,默认原因短语是"Unauthorized",比如调登录接口没带授权的时候

    2019-06-24

  • ifelse 👍(1) 💬(1)

    作业 1.跳自定义错误页面 2.返回json,用code字段表示具体业务错误代码比如:100001,msg字段表示错误原因比如:缺少id,状态响应码还是200

    2023-01-23

  • Ivan@_@ 👍(1) 💬(1)

    看了评论后,有点困惑……对于第二个问题,我觉得是很明显的客户端错误,应该很自然的用400 bad request 然后用body 拓展详细的错误。 为什么好像200 ok很流行呢?是历史遗留问题么? 很多框架包装了一个方法,类似于,issucesscode, ensuresucesscode ……,如果有这样不符合约定的状态码用法,你自己用,当然怎么都可以,要是开放给别的用户,应该会有很多问题吧。 比如,别人有一套框架,5xx直接显示一个通用错误消息,400才从body读具体消息,结果,你把validation error 放到5xx,那你的客户还得专门为你写一套处理方法。

    2022-04-07

  • Leolee 👍(1) 💬(2)

    作业: 1、统一跳转到一个报错页面 2、自定义一个4XX代码,告知客户端缺少了一个query。 状态码 目前的RFC标准里规定状态码是三位数,取值范围从100~599,用数字第一位表示分类,共五类,这五类具体含义是: · 1XX :提示信息,表示目前是协议处理的中间状态,還需要后续的操作; · 2XX :成功,报文已经收到并被正确处理; · 3XX :重定向,资源位置发生变动,需要客户端重新发送请求; · 4XX :客户端错误,请求报文有误,服务器无法处理; · 5XX :服务器错误,服务器在处理请求时内部发生了错误。 1xx 此类属于提示信息,是协议处理的中间状态,实际能够用到的时候很少。 101 Swiching Protocols 意思是客户端使用Upgrade头字段,要求在HTTP协议基础上改成其他协议继续通信,比如WebSocket,如果服务器统一变更协议,就会返回101,后续数据传输就不会再使用HTTP了。 2xx 此类表示服务器收到并成功处理了客户端的请求,客户端最喜欢的状态码。 200 ok 浏览器最喜欢的成功了; 202 Accepted 浏览器收到请求,但暂缓处理,暂时无法给出处理结果; 204 No Content 含义与200 OK基本相同,但响应头后没有body数据; 206 Particl Content 意思是服务器成功处理了请求,但body里的数据不是资源的全部,而是一部分,这个是HTTP分块下载或断点续传的基础,在客户端放松了“范围请求”、要求获取资源的部分数据时出现。一般206后会跟着头字段“Content-Range”,表示body里数据的具体范围,例如“Content-Range:bytes 0-99/2000”。 3xx 此类表示客户端请求的资源发生了改动,客户端必须用新的URI创新发送请求获取资源,也就是通常所说的”重定向“,包括注明的301、302跳转。 301 Moved Permanently 俗称“永久重定向”,含义是此次请求的资源已经不存在了,需要该用新的URI再次访问。 302 Found 俗称“临时重定向”,意思是请求的资源还在,但需要暂时用了一个URI来访问。 304 Not Modified 即“缓存重定向”,用于If-Modified-Since等条件请求,表示资源未修改,用于缓存控制。它不具有通常的跳转含义。 4xx 此类表示客户端发送的请求报文有无,服务器无法处理,含义就是“错误码”。 400 Bad Request 含义就是数据格式有误,具体哪里错误没有明说,会让客户端一头雾水,开发WEB应用时应该尽量避免; 403 Forbidden 这个不是客户的的请求出错,而是服务器禁止访问资源。愿意多种多样,可能是信息敏感、法律禁止等; 404 Not Found 被滥用的状态码,愿意是请求的资源在服务器上找不到,但很多服务器动不动就给你来个404; 405 Method Not Allowed 不允许使用某些方法操作资源,例如不允许POST只允许GET; 406 Not Acceptable 资源无法满足客户端请求的条件,例如请求中文但只有英文; 408 Request Timeout 请求超时,服务器等待了过长的时间; 409 Conflict 多个请求发生了冲突,可以理解为多线程并发时的竞争状态; 413 Request Enitity Too Large 请求报文里的body太大; 414 Request-URI Too Long 请求行里的URI太长; 429 Too Many Requests 客户端发送了太多请求,通常是由于服务器的限制连接策略; 431 Request Header Fields Too Large 请求头某个字段或总体太大。 5xx 此类表示客户端请求报文正确,但服务器在处理时内部发生了错误,无法返回应有的响应数据,是服务器端的“错误码”。 500 Internal Server Error 相当于服务器端的400,属于通用错误码,不利于调试,但能够防止黑客窥探或分析; 501 Not Implemented 表示客户端请求的功能还不支持; 502 Bad Gateway 通常是服务器作为王冠或者代理是返回的错误码,表示服务器自身工作正常,访问后端服务器时发生错误,具体错误原因未知; 503 Service Unavailable 服务器繁忙,当前不可用,这是一个临时的状态,通常503的响应报文里会有一个“Retry-After”字段,意思是多久后再重试。

    2021-04-20

  • Geek_Maggie 👍(1) 💬(1)

    【课后思考题】 1. 你在开发 HTTP 客户端,收到了一个非标准的状态码,比如 4××、5××,应当如何应对呢? 我个人感觉4XX和5XX还是要区分开提示。4XX主要是客户端错误,5XX主要是服务端处理错误。如果是我开发客户端遇到这个问题,我会和业务人员沟通要如何进行客户提示,如:4XX一律提示为“请求有误,请稍后再试” 5XX一律提示为“服务器繁忙,请稍后重试”; 2. 你在开发 HTTP 服务器,处理请求时发现报文里缺了一个必需的 query 参数,应该如何告知客户端错误原因呢? 返回4xx错误,并在返回json报文中定义详细错误代号,如:{code: "-1"; msg:QUERY_ERROR; ......}

    2021-03-15

  • 哈德韦 👍(1) 💬(1)

    419 和 503 的区别是什么?都是服务器繁忙而且只是暂时的

    2020-10-07

  • 👍(1) 💬(1)

    这节很有借鉴意义,尤其对于开发RPC接口而言。之前的项目组针对web的服务会回传错误原因,这个越清楚越好,这样操作者就知道怎么调整了,也都是内部系统,内部使用。 如果是RPC接口基本模式是结果码、结果描述、调用链码、响应信息、是否建议重试等,我个人感觉这种方式比较好,只是因业务和系统不同,状态码的归类和业务含义不好提前定义全,还有会用0表示OK,<0表示各种异常,>0特殊情况下的正常,比如:降级处理。

    2020-03-28

  • Wr 👍(1) 💬(1)

    1. 目前遇到的情况都是跳转一个空白页面,页面上方标注错误码和错误信息 2. 返回一个4**类型的错误码吧,返回错误信息为请求错误之类的(这几天处理开发写的自动化脚本,由于协议变更,请求出现很多问题,比如请求里的json字段不符合新的的协议规范,返回的错误一般都是403,应该和这个问题类型,但是我看很多同学评论的都是5**错误码,这是问什么呢?)

    2020-01-04

  • 风翱 👍(1) 💬(2)

    对于问题二,如果缺少的参数,服务端采用友好的方式提示。 调试方面确实方便了,但是对于安全性呢?

    2019-06-24

  • 我行我素 👍(1) 💬(1)

    1.4**一般都是弹窗提示,将错误显示出来,5**有单独的页面显示错误信息; 2.在自己的项目中都是返回json直接明确告诉缺少什么参数

    2019-06-24