Google爬行缓存代理(crawl caching proxy)
前两天人们注意到Google Adsense蜘蛛所抓取的网页会出现在搜索结果中。Matt Cutts在他的博客里迅速的做出了回应,对这种现象做了进一步解释。
简单来说,Google在完成大爸爸数据中心升级后,各种蜘蛛抓取网页的机制产生了变化。不是各个蜘蛛直接抓取网页,而是由一个爬行缓存代理crawl caching proxy抓取网页,然后不同的蜘蛛从这个缓存中获取内容,从而节省了带宽。
Matt Cutts的帖子比较完整的翻译可以在幻灭和小添的博客里看到。
我要补充的是:第一:Matt Cutts特意指出,这个新的抓取机制不会让你的网页被抓取的更快,也不会对排名有任何影响。这个爬行缓存代理也不影响各个蜘蛛本来应该爬行的频率和时间表。只不过各个蜘蛛不直接爬行网页,而是从缓存中获取。
第二:更引起我注意的是,Matt Cutts说这个爬行缓存代理是大爸爸更新之后才有的。因为运行的很顺利,在其他人发现这种现象之前,Matt Cutts自己没意识到这种新的机制已经运行了。这说明Matt Cutts并不能掌握所有各个部门的最新情况,那么还有什么是Matt Cutts也还不知道的呢?
第三:Matt Cutts讲这个机制的目标是节省带宽,而不是隐藏页面(cloaked page)检测。我觉得弦外之音是,利用同样的技术,Google完全可以用其他的蜘蛛来检测隐藏页面。当然也可能是我过度敏感了。
另外,最近很多网站出现被收录的页面数目急剧下降的现象,我怀疑和这个新的页面抓取方法造成的混乱有关。很显然不是排名算法改变导致收录的网页数目下降,而是蜘蛛爬行的问题。
相关文档
- 引擎力Google seo优化师实战经验:什么是301重定向,如...
- 引擎力Google Seo专家整理的网站站内SEO元素要点(下篇...
- 如何让Google快速收录网站页面?
- Google SERP谷歌搜索结果呈现类型有哪些?
- Google优化实战总结篇:Facebook推广如何进行日常维护
- 引擎力Google seo优化师:深度解读Google Anal...
- 想要做好Google SEO必须注意的几个方面
- Google优化英文网站SEO常用工具
- Google左侧排名对Google Adwords广告的影响
- Google Seoer需要知道的关于丰富结果的10个事实
- 引擎力Google SEO技术总结:内容优化
- 引擎力Google seo优化师实战经验:如何提高网站页面访问速...
- 外贸网站针对Google优化的全过程分析
- 引擎力谷歌推广实战分享:如何提高你的Google Ads质量分
- 2021年谷歌/Facebook/Youtube市场占有率统计数...
- google seo整站优化分析
- 引擎力Google SEO优化师原创总结:如何提高SEO建站质量
- Google优化与谷歌竞价的对比
- 引擎力Google seo优化师实战经验:5个SEO策略来优化你...
- Google PageRank-PR值你都了解吗?
上一篇: Google排名优化圣经(二)