相信很多seoer在网站新上线或者改版之后,都见过首页收录有这么一句“由于该网站的robots.txt文件存在限制指令,系统无法提供该页面的内容描述”的提示,这是不是搜索引擎的抓取问题?当然不是,这是由于网站重新上线时的一个屏蔽操作导致的,前几天在诊断一个网站(www.zhuoyu-dz.com)的时候,就发现了是robots的问题,关于如何处理,深圳seven下面会讲解到,现在先分析为什么会产生这个现象:
出现robots.txt文件存在限制指令的快照,是因为网站上线前或者测试的时候,网站的内容、标题都还需要不断的修改,为了不让搜索引擎抓取到频繁的修改,所以在robots.txt上做了屏蔽搜索引擎的收录,即disallow:/的限制,seven平时也有这个习惯,在一个网站正式上线前,都会做全站屏蔽;网站正式上线后,加以外链、友链和提交的引导,搜索引擎的蜘蛛过来抓取页面,发现地址存在,但是被屏蔽了抓取,为了遵循互联网的抓取规则,不得已快照上只能显示这句提示,“由于该网站的robots.txt文件存在限制指令,系统无法提供该页面的内容描述”,这是产生的由来;
那么如何处理这个robots的问题呢?首先第一步是找到根目录下的robots.txt文件,去掉这一句disallow:/,解除屏蔽抓取;第二步很关键,就是到站长平台下去更新robots文件,告诉搜索引擎你的网站已经对它解除了屏蔽,可以来抓取我的网页内容了,不然你可以想象,一个追求你但被你无情拒绝了的人,很难第二次鼓起勇气再次对你表白,除非你对他主动示好,其中更新robots文件就是对搜索引擎的主动示好,快照更新过来之后,现象就会消失了。
关于“Robots规则更新后多久会生效”下面也有详细描述;
总结
网站优化无小事,往往一个很小的细节都会让你的优化工作变得事倍功半,robots.txt是网站上线后必须检查的文件,不然连抓取都被屏蔽了,就很难谈到后面的抓取和收录了。
那些年的今天:
- 2018: 为什么seo培训机构的排名相对稳定(1)
不错不错
支持,解决了我的疑惑!
写的挺不错的受益匪浅 seo优化的未来的探讨,欢迎大家一起来天达站长SEO媒体论坛交流学习http://bbs.teldns.cn/
做得不错
不错的文章很受益
写得很好,阿泽来学习了。
非常实用的知识