抓蜘蛛的陷阱(抓地蜘蛛的妙招)

   360SEO    

一、Flash模块

诚然Flash模块确实给人的视觉效果是非常棒的,从这个角度来说其实也是非常有利于用户体验,但很遗憾的是蜘蛛只能抓取一般的HTML代码,最喜欢的是文字信息,而Flash在搜索引擎眼里只是是个干巴巴的链接,根本不好判断里面到底是什么东西,自然也不利于网站的优化。

二、Javascript脚本

这个基本上和Flash是一个原理了,虽然可以整体增加网站的美感,但是很遗憾搜索引擎抓取不到,而且如果网站有太多这样的JS还会严重影响网站的加载速度,对网站排名不利,这也属于一种比较严重的蜘蛛陷阱。

三、Session ID

如果网站采用了Session ID来跟踪用户访问,这也是一个后果非常恶劣的蜘蛛陷阱,因为蜘蛛访问这种网站的时候,不管是什么页面,即使访问的是同一个页面,也会出现不一样的ID,根本就很难判断出哪个url才是主要页面,甚至还会误判为网站有大量页面存在重复的内容,这明显是要予以避免的地方。

四、带各种参数的动态URL

网站动态的URL越多,网站越会误导搜索引擎,如果设置不当也会造成搜索引擎判断不清到底哪个是正规的页面(原理上跟Session ID相似),而且动态URL也是不利于蜘蛛抓取的,我们应该避免,建议站长手上的网站都要做一下静态化,并且屏蔽掉那些异常参数的url。

五、页面是frame框架结构

过去不少人的网站都是使用的框架结构,这种结构虽然代码精简,而且很方便我们站长来据此来更新维护我们的网站,但是,这种结构蜘蛛很难抓取得到,基本上抓不到这里面的内容,特别是里面有那些重要内容的时候,那更是对优化大大不利的。

七、强制使用Cookies

原理基本同上,搜索引擎蜘蛛不会智能的按要求去强制的去使用Cookies,那么就会导致页面无法正常显示如此强制使用Cookies只能造成搜索引擎蜘蛛无法正常访问。

一般的来说,现在还出现上述的这些蜘蛛陷阱往往都是站长自己粗心大意造成的。如果实在自己无法完全兼顾去规避上的这些陷阱,建议站长们不妨多看看自己网站收录页面的快照,看看是否快照所显示的内容和页面的本来内容是否有所差别,特别是碰到那些重要内容显示不出来的情况下,那么就要特别注意了,很可能就是因为自己的网站掉入了上述的某种蜘蛛陷阱。

文章来源于:淡腾网络

 标签:

评论留言

我要留言

欢迎参与讨论,请在这里发表您的看法、交流您的观点。