HTTP状态码是什么?HTTP状态码有什么用处?如何处理 HTTP状态码能够和搜索引擎更友好?技巧在哪里?更有利于网站优化?HTTP状态码如何监测?
HTTP状态码是什么?
HTTP协议是典型请求/响应模式,客户端请求服务器,客户端和服务器建立连接。
客户端发送一段数据给服务器例如下面的一段请求:
Host: download.microtool.de
Accept: */*
Pragma: no-cache
Cache-Control: no-cache
User-Agent: Mozilla/4.04[en](Win95;I;Nav)
Range: bytes=554554-
服务器在接 受到这个请求后向客户端发出响应数据如下:
HTTP/1.0200OK
Date:Mon,31Dec200104:25:57GMT
Server:Apache/1.3.14(Unix)
Content-type:text/html
Last-modified:Tue,17Apr200106:46:28GMT
Etag:"a030f020ac7c01:1e9f"
Content-length:39725426
Content-range:bytes554554-40279979/40279980
服务器返回的响应中有这样的一段数据:“HTTP/1.0200OK”说明客户端请求成 功,返回服务器成功状态码,注意现在HTTP状态码出现了,如果服务器发现,客户端所请求的页面不存在,那么应该返回的是这段数据 “HTTP/1.0404OK”下面我们列出常用的HTTP状态码对照表:
2xx 成功
200 正常;请求已完成。
201 正常;紧接 POST 命令。
202 正常;已接受用于处理,但处理尚未完成。
203 正常;部分信息 — 返回的信息只是一部分。
204 正常;无响应 — 已接收请求,但不存在要回送的信息。
3xx 重定向
301 已移动 — 请求的数据具有新的位置且更改是永久的。
302 已找到 — 请求的数据临时具有不同 URI。
303 请参阅其它 — 可在另一 URI 下找到对请求的响应,且应使用 GET 方法检索此响应。
304 未修改 — 未按预期修改文档。
305 使用代理 — 必须通过位置字段中提供的代理来访问请求的资源。
306 未使用 — 不再使用;保留此代码以便将来使用。
4xx 客户机中出现的错误
400 错误请求 — 请求中有语法问题,或不能满足请求。
401 未授权 — 未授权客户机访问数据。
402 需要付款 — 表示计费系统已有效。
403 禁止 — 即使有授权也不需要访问。
404 找不到 — 服务器找不到给定的资源;文档不存在。
407 代理认证请求 — 客户机首先必须使用代理认证自身。
410 请求的网页不存在(永久);
415 介质类型不受支持 — 服务器拒绝服务请求,因为不支持请求实体的格式。
5xx 服务器中出现的错误
500 内部错误 — 因为意外情况,服务器不能完成请求。
501 未执行 — 服务器不支持请求的工具。
502 错误网关 — 服务器接收到来自上游服务器的无效响应。
503 无法获得服务 — 由于临时过载或维护,服务器无法处理请求。
如何处理 HTTP状态码能够和搜索引擎更友好?
在网站设计 中,出现错误页面是经常会发生的,当搜索引擎爬虫来访问一个网站本不存在的一个页面时或者网站URL生成规则更改时,都会返回404错误页面,这样搜索引 擎都会自动删除搜索引擎关于这个URL的信息,问题出现了:如果是某个访问者来到了这个404页面,我们怎么办?我们要白白放走自己的访客 (有可能成为自己的客户),不行,不能放走这个潜在的客户,我们也想到了解决的办法,自己制作404页面,不仅提示没有找到改网页,我们还在自己制 作的404页面上做一个栏目导航,供访客再一次的点击,但是404页面的制作,不是几句话能说明白的,我们将在下一节专门介绍404页面的制作,并且保证 服务器返回的状态码也是404,而不是别的状态码。
301状态码 对搜索引擎算是比较友好的,如果出现要转移权重,建议用301永久定位。
比如:你有两个域名www.**x.com 和**x.com(搜索引擎看来这是2个域名) ,为了能够不丢失在浏览器中输入的访客,也为了能够把权重转移到www.**x.com 我们就应该设置服务器,把**x.com永久定位到www.**x.com 。
总之一句话,http状态码技巧如果处理好,对网站优化有益无害,如果处理不好,可能会降低您的网站的权重,更有可能让搜索殷勤爬 虫感到您的网站不太友好。
HTTP状态 码如何监测?
http状态码的监测,有2种方法:
1. 查看网站日志
比如说:
2008-05-10 00:28:03 W3SVC818374 222.214.218.36 GET /flash/1622.html - 80 - 221.10.254.26 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0 21089
如果你的网址是www.**.com这 就意味着百度蜘蛛在2008-05-10 00:28:03 爬过flash/1622.html 这一页,200 0 0 21089中的200协议代码代表了请求已完成也就是它发现这页并以入库了。根据这个我们可以多查看iis日志,研究蜘蛛爬行的路径,找出自己网站存在的 问题,进而改正。
2. 通过一些网站HTTP分析软件 httpwatch 可以看见在访问网站时整个页面的请求和响应,也能看见状态码。如果发现那个页面出现状态码问题可以及时解决调影响优化对搜索引擎不友好的因素。
(编辑:小酷)
扫码添加客服微信
扫码关注公众号
酷网(大连)科技有限公司
致力于为客户品牌提供完善解决方案
统一服务电话:0411-62888851