SEO百科

robots.txt和蜘蛛爬取

^_^ 专业解答 ^_^

问题:修改网站的robots.txt是否会影响蜘蛛爬取?

回答:通常情况下搜索引擎会遵守robots文件,如果我们在robots.txt文件里面对某些页面做了限制,那么搜索引擎蜘蛛是不会去抓取的,也就是说robots.txt文件会影响到蜘蛛抓取。对于robots.txt和蜘蛛爬取,有以下两个方面的问题大家需要注意。

一、robots.txt限制整站抓取,搜索引擎还是会收录首页

很多朋友提到明明自己的网站,在robots.txt文件里限制了所有搜索引擎蜘蛛抓取,但是百度还是收录了首页。这种情况是正常的,但是大家要注意的是,虽然蜘蛛抓取了页面,也收录了,但是百度快照里面是没有内容的,如果我们去点击百度快照,会跳转至百度搜索资源平台。也就是说,虽然蜘蛛抓取了,但是并没有保存页面文件。

二、搜索引擎蜘蛛对robots.txt有反应时间

我们在正式开放蜘蛛抓取之前,通常会设置robots.txt文件,限制所有搜索引擎蜘蛛抓取。但是有朋友反映,在放开了robots.txt文件限制以后,蜘蛛还是不过来抓取,这其实就是搜索引擎蜘蛛对robots.txt文件的反应需要时间,这个时间通常是一个星期以内。

我们再回到robots.txt和蜘蛛爬取上面来,总体上搜索引擎蜘蛛会严格遵守robots.txt文件协议,对于robots.txt文件限制的页面,蜘蛛不糊去抓取。所有对于那些没有搜索需求的页面,我们可以在robots.txt文件里面进行设置,这样就可以集中抓取频次和防止权重分散。当然,我们可以把robots.txt文件和nofollow标签结合起来使用。

另外大家要注意蜘蛛对robots.txt文件的反映时间,不要因为几天蜘蛛没有来抓取,就怀疑是网站其他地方出现了问题,应该耐心等待。

关于robots.txt和蜘蛛爬取的问题,笔者在本文简要的给大家做了说明。总之来说,修改网站的robots.txt会影响蜘蛛爬取,至于是减少抓取量还是增加抓取量,这需要具体分析对robots.txt做了怎样的修改。另外robots.txt里面还可以设置网站地图,这对于网站页面收录有帮助。

如何优化:
北京集团网站建设 网站开发合同 企业网站多长时间改版合适 阳江网站开发 设计交易网站 重庆少儿编程网站开发 在线ui设计网站 建德网站改版 网站开发案例分享 网站开发综合实训作业4
热门问答
  • 如果条件允许的话,尽量给自己的网站写套独立的模板,这对于网站优化有好处。所以,我们不能说因为网站是购买的模板网站,百度等搜索引擎不喜欢收录。在搜外看到有朋友提到,在凡科买的网站有两个月了,百度一直没收录!买的网站,通常使用通用的模板,目前很多网络公司都是这么操作的,这样的网站建设价格会比较便宜。如果条件允许的话,尽量给自己的网站写套独立的模板,这对于网站优化有好处。那么网站不收录是否就是凡科的问题...详情查看
  • 总起来说,如果外链帖子已经被百度收录,那么通过论坛帖子做外链的目的就已经达到了,即使被删除也没有太多影响,大家不要担心。回答:对于seo外链建设,笔者在关于外链优化你需要知道的事情一文中将的比较清楚,对发外链有兴趣的朋友可以去看看。这里笔者再次重复,像这样的论坛帖子外链以及博客外链对网站排名是没有作用的。我们再说回被删除的论坛外链帖子是否有作用,理论上对于吸引蜘蛛和促进页面收录是有帮助的,因为论坛...详情查看
  • 问题总结,为什么软件查有网站排名而实际没有?根本原因在于查询信息的不及时!笔者再次提醒大家,对于那些工具或者软件查询得到的排名结果只能做参考,准确的还是以清除缓存的实际查询为准。2电脑浏览器没有清楚缓存比如说我几天前查询过某个网站排名,电脑系统会保存这个历史记录,我们再次查询的时候可能显示的还是之前的结果。比如说,我们之前查询网站排名在百度前3页,后面两天其实已经掉下去了,如果我们没有清除缓存,那...详情查看
  • 这里就涉及到如何提升百度抓取频次的问题,事实上笔者在相关的文章里面也提到了,想要提升百度蜘蛛抓取的频次,要做注意三个方面:1、首先加强网站的内容建设,让网站的页面更加多,当然这些页面要确保质量;2、网站更新要持续,不能今天更新100篇上去,明天后天就不管了,这样不行;3、让已有的页面保持更新,比如说通过相关文章、随机文章等方式,让内容的内容产生变化。总之来说,百度的抓取频次是跟网站的数据和表现挂钩...详情查看