【爱否SEO】SEO视频教程-SEO优化教程-SEO教程自学网:306090669(QQ)
4008883171

【爱否SEO】 > SEO教程 > SEO入门教程 >

百度快照更新,让百度快照最新只需研究200状态

编辑:【爱否SEO】发布时间: 2017-12-10
查看日志是seoer日常工作中的重要一环,有些站长显然还没习惯去分析繁琐的日志,但无论如何,养成经常查看日志的好习惯是必不可少的。在查看日志的时候,除了查看蜘蛛抓取次数、时间之外,还有一项很重要的内容,就是状态码的查看。今天我们着重讲述304和200状态码的应用。相关阅读:HTTP状态代...

查看日志是seoer日常工作中的重要一环,有些站长显然还没习惯去分析繁琐的日志,但无论如何,养成经常查看日志的好习惯是必不可少的。在查看日志的时候,除了查看蜘蛛抓取次数、时间之外,还有一项很重要的内容,就是状态码的查看。今天我们着重讲述304和200状态码的应用。相关阅读:HTTP状态代码(错误代码)各代表什么意思

首先我们先来了解一下这两种状态码分别意味着什么。当搜索引擎蜘蛛程序对网页进行抓取的时候,通常它首先需要对页面进行监控和解析,监控页面是否发生了变化,也就是是否更新。那么蜘蛛是如何快速判断页面是否变化的呢?当蜘蛛抓取监控区域内容的时候,它会与保存在搜索引擎服务期上最近一次抓取的内容进行比较,如果有差异就表明网页发生了变化,就会进行解析。

一般而言,同一个网站相对比较稳定的模板,监控区域也是固定的,比如内容区域和列表区域。当蜘蛛发现页面没有变化时,通常会返回304状态码,如果发现有变化,则返回200状态码。了解了这一点之后,我们就很容易在日志里发现蜘蛛认为我们的哪些页面发生了变化。通过对比分析,这些页面是否是新页面,变更的部位,我们可以大致明白如何让蜘蛛返回更多的200状态码,这意味着我们的网站首页能够获取最新的网页快照。

1、如何让首页保持更新

之前有看到牛人采用程序,使首页每次刷新都会出现新的内容,这一招非常迎合蜘蛛的口味,蜘蛛每次来的时候发现页面都是新的,于是不停不停的抓取,快照想不新都难。不过一般来说,大多数网站显然做不到这一点。有些网站首页采用调用论坛或者博客的形式,来不断使首页保持最新。但不幸的是,由于一些人不是很了解这么做的目的,采用了JS或者iframe调用的形式,这么做的结果,不仅无法使蜘蛛认为你的网页发生更新,而且JS和iframe调用的内容也非常不利于抓取。基本上在做无用功。请记住,无论你使用什么程序,一定要确保浏览器执行的时候是具体的内容和链接。

明白了监控区域这个概念之后,我们可以想象:在首页上如果有很多栏目列表,那么倘若我们长时间只更新一个栏目,这样做的结果会让蜘蛛认为其他列表部分是不会变化的,也就是非监控区域。这样某天当你不更新这个栏目,而更新其他栏目时,就可能出现滞后的情况,以至于蜘蛛短期内并不认为你的网页发生变化,直到完整的核对之后。这样就可能造成快照停滞的情况。请仔细理解这段话。

基于这一点,我们在更新内容的时候,尽可能保持整个网页各个区域都在均衡的变化,也就是在首页上出现的每个栏目都适当的更新内容,这样的好处是只要有一点点更新,蜘蛛都能及时发现,也就是说,我们要让网页上尽可能多的区域都成为蜘蛛的监控区域。那么只要我们网页有一点点的变化,都会让蜘蛛最快的时间内发现并进行更新。这样一般能解决快照最新的问题。

站内导航
 
QQ在线咨询
售前咨询热线
4008883171
售后咨询热线
13622373171