苏州企业网站建设中的IIS日志蜘蛛返回码详细说明

  301返回码的含义是“Moved Permanently”,百度会认为网页当前跳转至新url。当遇到站点迁移,域名更换、站点改版的情况时,推荐使用301返回码,尽量减少改版带来的 流量损失。虽然百度spider现在对301跳转的响应周期较长,但我们还是推荐大家这么做。

  ,如果出现了这个带64的返回码,其实也属于正常,但是这个64被人说的很神秘,由于很多网站在出现64的返回码后被K或者降权,所以,有人称之为百度K占的前兆,但是我并不这么认为,64的出现不代表百度要K你,但是64的大量出现确实会带来很大的问题,下面看看我的理解。网络上流传着这么几种解释第一:64为K站的前兆。第二64的出现只是64位操作系统。第三:网络不可达对于我来说比较任何第三种说法,网络不可达,由于某种原因无法完全打开页面,或者网络不稳定这些原因,导致蜘蛛无法带回页面或者说不抓取该页面,200 0 64的解释也应该为:访问了该页面,但并没有任何抓取也没有带回数据库。这种原因多为空间不稳定、服务器不稳定,或者服务器配置错误引起的,还有一点必须说明,在好的空间也会有64的返回码,所以这个不要担心,但是为什么又有人说,我的网站出现了很多64后又被K了或者降权了呢?其实很简单,如果你的日志中大量的出现了64,就说明某种原因导致蜘蛛一直无法抓取页面,这样,你检查下空间的稳定性和服务器的配置是否有问题,空间长期不稳定和配置出现问题在大多数情况下是会被降权的。这就是为什么第一种说法没有依据的地方,也是我不赞同的地方。那么第二种说法,64位操作系统。

  有人这么解释:sc-win32- status,在你日志的头部,有这么句话,说明是32位系统,如果蜘蛛访问是使用64位系统则显示为:200 0 64,这个观点我不认可,我做过这样的一个测试,朋友的一个网站,首页打开总的很慢,一般十几秒才可以打开,在检测友情链接的时候经常是显示该网站无法打开,于是为了证实这个网络不可达的猜测,我问他要了两个月的日志进行分析,分析结果为:首页访问记录,在白天的时候返回码70%都为64,晚上的时候返回大部分都是200 0 0,而且蜘蛛的爬行时间也有了明显的改变,访问这个网站的时候,大多都是在晚上,白天的次数逐渐的减少。

  ,但是有个很严重的问题,这个返回码告诉我们,蜘蛛来到了404页面并把他带走了,崩溃~~~~,如果是这样的话基本上你要倒霉了,如果你有太多的404,那么蜘蛛就会不断是抓取,不断的带走,这样会造成无数的重复页面,最终导致K站或者降权,正确的返回骂是404 0 64这就代表蜘蛛没有抓取你这个页面。

  ,如果你是长期的将这个页面重定向到另一个页面,麻烦你使用301永久重定向,如果是302的话百度蜘蛛下次来还会访问这个页面,这样又会造成复制大量页面的问题,结果肯定是K,所以,抽空检查以下。

  7:200 0 121 最大的可能是IIS设置错误造成的,由于网络管理员没有设置好IIS,导致出现这类返回码。

  需要设置iis权限,方法:控制面板/管理工具/Internet信息服务/网站/默认网站/右键单击默认网站,选择属性/目录安全性/编辑/勾选“匿名访问”。

  8:200 0 1236最大的可能是因为服务器网络不稳定,导致链接中断,其次就是网站响应速度慢;针对目前网站上另一种就是防火墙的原因,个人检查了一下服务器的防火墙一切正常,所以可以排除。

  方法:1、加强与服务器商沟通,保障服务器的稳定 2、加强站内代码优化,提升站内响应速度 3、CDN加速那么出现这些代码会造成什么影响呢,目前就我负责的项目来看,1、影响正常的收录 2、影响网站快照 3、影响关键词的排名

  503返回码的含义是“Service Unavailable”,百度会认为该网页临时不可访问,通常网站临时关闭,带宽有限等会产生这种情况。对于网页返回503,百度spider不会把这 条url直接删除,短期内会再访问。届时如果网页已恢复,则正常抓取;如果继续返回503,短期内还会反复访问几次。但是如果网页长期返回503,那么这 个url仍会被百度认为是失效链接,从搜索结果中删除。

  403返回码的含义是“Forbidden”,百度会认为网页当前禁止访问。对于这种情况,如果是新发现的url,百度spider暂不会抓取,短期内会 再次检查;如果是百度已收录url,当前也不会直接删除,短期内同样会再访问。届时如果网页允许访问,则正常抓取;如果仍不允许访问,短期内还会反复访问 几次。但是如果网页长期返回403,百度也会认为是失效链接,从搜索结果中删除。

  200 0 0 200成功访问该页面,0代表抓取成功并带回数据库。这个时候你就放心了,这个页面已经被百度收录,但是还没有释放出来,在这个期间,百度会对这个页面进行一系列的计算,比如:词频、镜像、链接、等等,如果你的这个页面属于采集页面,那么你很难看到他释放你这个页面,通常是:直接删除不释放、或者释放后没有排名。

上一篇:营销型网站建设,如何做好互动性设计
下一篇:【原创】百度搜索结果页开启原创标识

欢迎扫描关注我们的微信公众平台!

欢迎扫描关注我们的微信公众平台!