网站快照老是不更新,查看网站日志的蜘蛛访问,发现内页蜘蛛抓取都正常,唯独首页会出现蜘蛛返回200064,要么就是301064(因为www和没有www的做了跳转)于是我搜索相关资料并分析了该状态码,网上都众说纷纭,先总结一下大致的问题吧。
先说一下200064状态码的意思。
200表示正在访问该页面了,但出现64说明抓取的大小不正常,这种不光是蜘蛛会出现,用户访问也会出现的,意思抓取到一般中途放弃了。比如你自己打开该页面,但没等加载完就关闭了,就会出现64的状态!
关于百度蜘蛛会出现200064的问题总结:
1、比较常见的情况是网站未更新。
(这种说法是说不通的,蜘蛛衡量页面是否更新是根据页面大小来的,只要你页面有变化,大小肯定会不一样的!所以这条可以排除!)
2、内容质量差,大多为采集信息,原创内容少!
(这个也有可能,但是我的是小说站,地球人都知道小说站几乎不存在什么‘原创’了,而且我的站内页也都是正常20000,要说不是原创,内页内容才是真正的不原创内容了!所以说这一条也不成立,就算有影响,也影响不大!)
3、一部分人说这是K站前兆,出现次数多了会扔入百度沙盒等。
(我可以斩钉截铁的说这个完全是扯蛋,百度官方也明确给出了答复,200064不是K前兆,对网站没有影响!当然有没有影响要看自己判断了,我个人觉得该状态码出现次数多了,虽说不会K站,但多多少少会有些影响的!)
4、网站启用了GZIP压缩,导致蜘蛛抓取内容不正常!
(这个问题比较常见,一般是出现在GIZP压缩设置上,关于这点大家可以搜GZIP压缩能让蜘蛛正常抓取的设置!)
5、页面优化过度!(经过一个多星期的观察,我的站问题应该是与这个有关)
这个情况有很多种,比如更换了标题关键词,修改了底部信息,改动了框架等,都有可能会影响这个问题!我的站就是因为改动了页面底部信息,即使我在没有改动原来框架的情况下,额外加了一个div层,都会出现这种情况。
所以遇到类似问题的站长们,可以参考一下以上几点问题,早日解决你的困扰!