网站优化

快照与优化网站的关系

2012-06-30

首先介绍下什么是百度快照,简单点说,就是我们在搜索引擎结果页面看到的内容都是从百度快照里面调出来的。每个被收录的网页,在百度上都存有一个纯文本的备份,称为“百度快照”。百度速度较快,您可以通过“快照”快速浏览页面内容。 不过,百度只保留文本内容,所以,那些图片、音乐等非文本信息,快照页面还是直接从原网页调用。如果您无法连接原网页,那么快照上的图片等非文本内容,会无法显示。这个是百度快照的基本含义。
  目前对于百度快照出现的一些变化,很多人不能理解。
  一 百度快照回档
  那么快照为什么会回档呢?这个是我们做SEO的人非常关注的。就先说下我们公司网站前段时间遇到的问题吧,福州SEO,原来快照时间为2010年7月25号,目前回档到2010年7月15号。为什么?那么我们就开始分析:
  做SEO的都知道,百度快照的更新频率从一个层面上说明了百度对一个网站的重视程度。可是最近百度变化很大,导致最近的百度排名波动,和百度快照回档案,引起了不少SEO们的关注,今天就讲讲百度快照的原理。
  百度快照回档,较严谨的说是由于一定原因致使百度在数据库中对比筛选后,提取了以前的数据,来定义你的快照。形象的说,如我的一个站点在百度的快照日期是8。1,但你在google下搜索提取的却是最新的网页结果,这站在百度和谷歌下提取出的描述不同为什么有如此大的差异,当然不一定是百度来K站前的征兆,在这里我们可以把他理解成警告,但是,这时候你一定要冷静,按照不同的情况,你首先思考下你的站点之前是否过度的优化,服务器是否经常当机等不利因素,如果有请你SITE一下你的站点,看看收录情况以及百度快照停留的时间,在去掉那些无谓的优化和保证服务器正常的情况下,以快照停留的时间为范本,适当增加网站栏目,充实原创性的内容。精修内功,坚持下去必有好的未来。
  如果你不存在过度优化的情况或者××,你也要引起××方面的注意,比如你要看看你的站点是否太久没有更新,打开网站日志观察蜘蛛的活动情况(如何吸引搜索引擎的蜘蛛?),着重增加外链,同时注意内容的原创性,内外兼修必有好的排名。
  当然还有一种情况,就是百度服务器自己的问题,因为百度更换服务器问题,有些网站在置换中出现以前的备份才出现了网站的快度××,呵呵,我们都希望是这种原因。
  二 百度收录正常,快照却停滞不前
  其实,这个问题是基本做SEO的人都会遇到的。当然,这个其实也不算问题。不过,我想还是在这边老生重提下。很多朋友其实很困惑,为什么我的文章被百度收录了,怎么快照一直不更新。其实文章收录更快照更新没有直接的关系,从某种意义上说,文章收录很快照不是同时进行的。而且准确的说,快照是根据一个网站权重高低,来给予快照的节奏。可以说这两个是在不同的处理器进行处理的。那我现在就谈谈它们的工作原理,其实收录文章是百度蜘蛛要干的活,你的文章收录了,只能证明,你的文章被蜘蛛给发现,并且带回去了。当然,这个是很关键的。其实。百度蜘蛛对于新站的抓去速度还是挺快的,可能跟新站原创性比较强有关系。但是,这个不代表你已经走出百度沙盒,百度对新站是有考核期的,所以,做为一个新站一定要勤劳点,这样才能抓住蜘蛛的心。
  特别对于新站来说。百度是不会给于多少权重,所以,快照速度就比较慢。这个是很正常的。或则一直不动,其实没关系。过了,这个时期就没会好了。 之前,我的老站快照也现一直停滞不前的情况,让我一直不能理解。后来我查了一下原因,是我的网站服务器里面有几个站受到惩罚。当然,这个只是其中一个原因。后来,我换了个独立IP的服务器,快照马上就更新了。××原因可能导致老站快照不更新。我在这边也做下分析:1。外链突然大量下降2。你的友链网站出问题,特别是给你带来比较大外链的网站。3百度对你的网站进入2次考核期。比如有过度优化的嫌疑。
  三 不同关键词,在百度的快照日期不一样
  这个问题有点小复杂,在解释这个问题之前先大致介绍下搜索引擎的收录过程,大致分成两套系统,信息收集系统和信息索引系统,前者负责抓取所有的url以及从url中分析出标题,描述,http状态码的服务器信息,后者负责针对网站内容的索引工作,包括分词和排名。一般来说,搜索引擎两套系统互相独立,同时进行,由于分词工作是一项非常费时的工作,以及中文内容的各种敏感因素,从而出现了服务器更新之间的各种异常现象。总的来讲,site首页和搜关键词的首页快照不一致原因是由于搜索引擎信息收集系统和信息索引系统之间处理的时间差。