很多站长经常会查看日志,一便分析自己的网站存在什么样的忧患。今天青岛SEO网站有特殊情况,自己也查看了下日志,一下是今天日志代码。

2011-08-10 01:11:53 GET /post/32.html - 220.181.108.184 HTTP/1.1 Mozilla/5.0+(compatible;+Baiduspider/2.0;++http://www.baidu.com/search/spider.html) - 200 14152 239 140
最近几天百度蜘蛛来的代码格式都是类似于以上代码。

2011-08-10 01:11:53  :这个很简单可以看出蜘蛛来访的时间。
GET /post/32.html    :这个是蜘蛛获取我的目录文章(http://www.qingdao-seo.com/post/32.html).
- 220.181.108.184    : 这里是蜘蛛的ip,百度蜘蛛的ip大约有好几十个吧!
HTTP/1.1             :协议。
+Baiduspider/2.0;    : 蜘蛛系统。
++http://www.baidu.com/search/spider.html :百度蜘蛛浏览。
- 200 14152 239 140  :这里一直是很多站长困惑的,200就是蜘蛛访问成功。14152即使蜘蛛抓取的字节。239跟140我也没弄明白怎么回事,所以希望有谁懂的告知声谢谢!

常见代码20*(*代表一个数字):表示成功  例如200,请求数据正常。
常见代码30*(*代表一个数字):重定向    例如301,文件有了新位置。
常见代码40*(*代表一个数字):请求出现错误 例如400,请求中语法错误。
常见代码50*(*代表一个数字):服务器内部错误 例500,服务器请求错误。
这方面的代码网上有,可以查阅下。

另外通过查看近期日志,青岛SEO还发现了一个奇怪代码。
2011-08-08 01:42:25 GET /post/10.html - 180.149.133.38 HTTP/1.1 Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.0;+baidu+Transcoder;) - 200 14610 256 156
+baidu+Transcoder    :这个以前没有见过,不过我猜测应该是手机用户通过百度搜索,然后转换的访问记录吧。

    通常情况下一个页面蜘蛛忽然爬行次数增多或者减少,说明百度认为这个页面有问题,那么你应该观察下次页面是否优化过度。如出现错误代码指令,那么我们就要修改网站了。如果发现200 0 64,那么就要注意了,你的站很可能要进百度沙盒了。
    总结:做SEO就要学会多观察、多实践,认真做站、及时发现问题,解决问题。


您好,原创文章如转载,请注明:转载自青岛SEO[http://www.qingdao-seo.com/ ]
点击复制本文地址:http://www.qingdao-seo.com/post/33.html