今天遇到一个棘手的问题,就是用站长工具测试404页面的时候返回的是302错误,正常情况下应该是404,怎么会是302错误呢,经过小涛一些列的搜索和努力,终于弄明白了原理,小涛和大家分享一下自定义404错误页面返回状态码的相关问题,从以下四点对自定义404返回状态码的相关问题进行分析,希望能对大家有帮助! 第一,http状态码的分类与简单介绍. 第二,务必确保自定义404错误页面返回“404”状态码. 第三,404错误页面返回“200”状态码的问题. 第四,404错误页面返回“302”状态码的问题. 以上是四个要点,下面逐个详细分析 第一, http状态码的分类与简单介绍 http状态码有很多种,对于做seo的来说,我们也不必要去全部掌握,从seo的角度来看,我们主要是了解以下五种即可了。 404 :请求的网页不存在(不排除日后该链接有效的可能性) 410 :请求的网页不存在(永久) 200 :服务器成功返回网页 302 :网址临时重定向(跳转) 301 :网址永久重定向 如果您想更加详细地了解http状态码,可以参考W3C标准。 第二, 务必确保自定义404错误页面返回“404”状态码 很多朋友在做自定义404错误页面时,一直都认为能正常显示404错误页面就行了,而却没有考虑过404错误页面返回状态码是否是“404”。其实这是一种错误的做法,我们在设置好自定义404错误页面后,需要做的一步很重要的工作是检查一下是不是能正确地返回“404”状态码。如果不是,那么就要检查一下设置是否正确了。 检查404错误页面返回状态码的方法也很简单的。使用server header 检查工具,在这里建议使用这个http://www.***.org/getheader.htm来进行检查。只要输入一个网站内不存在的url,然后查看一下http header的返回情况,确保返回的是“404”,如果不是就要回去进行检查设置了。如图, 第三,404错误页面返回“200”状态码的问题 肯定会有些朋友在查询404错误页面返回状态码的时候,返回的不是“404”,取而代之的是“200”,那么如果返回的是“200”会导致什么样的情况呢?毫无疑问的,如果返回的是200,那么搜索引擎肯定会认为这个“根本不存在的网页“是存在的,可想而知,这肯定会影响优化效果。 也许这样说的不是很清楚,举个简单的例子来说明,如我的网站有两个这样的根本不存在的url,http://www.***.com/111.html和http://www.***.com/222.html,那么如果网站的自定义404错误页面返回的状态码是“200“,那么搜索引擎会认为这两个网页是存在的,并且将其收录到索引数据库,重点是这样导致的结果是这两个不同的url具有了一样的网页内容,而这个网页内容就是自定义404错误页面的内容。我们知道,像这些重复的文本对于搜索引擎来说都是极大不友好的。这样会大大降低网站的权重,或者说是网站对搜索引擎的友好度。再说,如果您网站的不存在url太多,那么重复性岂不是更加严重,所以一定要设置好404错误页面,保证是“404”的返回状态码。 第四,404错误页面返回“302”状态码的问题 不排除仍然有些朋友会采用meta refresh来将处理404错误页面,就是当访问了您网站的一个错误页面时会跳转到网站首页。其实这是seo的大忌,也是一个很愚蠢的做法。像这种做法,404返回的有可能是200,也有可能是302状态码,所以不管怎样还是对搜索引擎不友好的,从seo的角度来看,这是错误的做法。还有一个更加严重的后果就是如果直接跳转到首页(切记:千万不要直接跳转到网站首页),很有可能导致的是网站的首页在搜索引擎上找不到。 搜索引擎对“302”错误,还是认为该网页是存在的,知识临时改变了地址而已,因此还是会收录的,但是也同样会导致重复文本的现象。所以,如果您的404错误页面的返回状态码是302的,请务必修正,否则这个风险是很大的。 以上就是从http状态码的分类与简单介绍、务必确保自定义404错误页面返回“404”状态码、404错误页面返回“200”状态码的问题、404错误页面返回“302”状态码的问题四个方面分析了自定义404错误页面返回状态码。如果您对404错误页面的设置方法还不是很了解,请看404错误页面的设置方法。 那么什么是导致404错误返回302和200代码原因呢?小涛来告诉你: 自定义404错误页面是提供用户体验的很好的做法,但在应用过程中往往并未注意到对搜索引擎的影响,譬如:错误的服务器端配置导致返回“200”状态码或自定义404错误页面使用Meta Refresh导致返回“302”状态码。正确设置的自定义404错误页面,不仅应当能够正确地显示,同时,应该返回“404”错误代码,而不是“200”或“302”。虽然对访问的用户而言,HTTP状态码究竟是“404”还是“200”来说并没有什么区别,但对搜索引擎而言,这则是相当重要的。 当搜索引擎蜘蛛在请求某个URL地址得到“404”状态回应时,即知道该URL地址已经失效,便不再索引该网页,并向数据中心反馈将该URL地址表示的网页从索引数据库中删除,当然,删除过程有可能需要很长时间;而当搜索引擎得到“200”状态回应时,则会认为该url地址是有效的,便会去索引,并会将其收录到索引数据库,这样的结果便是这两个不同的url地址具有完全相同的内容:自定义404错误页面的内容,这会导致出现复制网页问题。对搜索引擎而言,特别是Google,不但很难获得信任指数TrustRank,也会大大降低Google对网站质量的评定。 常常看到许多网站的自定义404错误页面采取类似这样的形式:首先显示一段错误信息,然后,通过Meta Refresh将页面跳转到网站首页、网页地图或其他类似页。根据具体实现方式不同,这类404页面可能返回“200”状态码,也可能返回“302”,但不论哪种,从SEO技术角度看,均不是一种合适的选择。 对“200”状态的情况我们上面已经谈过,那么,当404页面返回“302”时,搜索引擎会怎么对待呢?从理论上说,对“302”错误,搜索引擎认为该网页是存在的,只不过临时改变了地址,仍然会索引收录该页,这样,同样会出现类似于“200”状态码时的重复文本问题;其次,以谷歌为代表的主流搜索引擎对302重定向的适用范围要求越来越严格,这类不当使用302重定向的情况存在很大的风险。 404页面返回“200”状态码的后果 如果网站的自定义404错误页面在url无效时不返回“404”状态码而代之以“200”,会发生什么情况呢?很明显,搜索引擎会认为这个“根本不存在的”网页在网站内是存在的,这会导致很多问题,影响网站的最终SEO效果。 举例来说,比如说对“http://www.highdiy.com/a.html”、“http://www.highdiy.com/b.html”这两个在IT技术点评网站内并不存在的url而言,如果搜索引擎得到的回应状态码是“200”,那么,便会将其收录到索引数据库,这样的结果便是这两个不同的url具有完全相同的内容:自定义404错误页面的内容,这类重复文本(Duplicate Content)的现象对许多搜索引擎而言都是大忌。尤其是考虑到网站中不可能只有这两个无效链接,毕竟在网站建设中,无论网站的内部链接还是外部链接,总会不可避免地出现许多比如说拼写错误的情况,类似的重复内容会更多。这样,对搜索引擎而言,特别是Google,不但很难获得理想的网站信任指数,也会大大降低Google对网站质量的评定。
404错误页使用Meta Refresh带来的302问题 常常看到许多网站的自定义404错误页面采取类似这样的形式:首先显示一段错误信息,然后,通过Meta Refresh将页面跳转到网站首页、网页地图或其他类似页。根据具体实现方式不同,这类404页面可能返回“200”状态码,也可能返回“302”,但不论哪种,从SEO的角度看,均不是一种合适的选择。 对“200”状态的情况我们上面已经谈过,那么,当404页面返回“302”时,搜索引擎会怎么对待呢?从理论上说,对“302”错误,搜索引擎认为该网页是存在的,只不过临时改变了地址,仍然会索引收录该页,这样,同样会出现类似于“200”状态码时的重复文本问题;其次,以google为代表的主流搜索引擎对302重定向的适用范围要求越来越严格,这类不当使用302重定向的情况存在很大的风险。 因此,尽量不要在404错误页中使用这类Meta Refresh方法。如果实现希望实现类似的功能,即让显示错误信息几(十)秒后跳转到首页或其他页面,可以考虑在404错误页中使用Java Script跳转。——Java Script对搜索引擎而言是无益同时也无害的。 […]
飞自由,点点滴滴,从基础开始—PHP技术博客
转载请注明:爱开源 » 如何避免.htaccess配置404错误返回302