蜘蛛池快速收录及其工作原理

  • A+
所属分类:SEO
摘要

蜘蛛池就是一堆由垃圾域名组成的站群,在每个站点下都生成海量页面(抓一堆文本内容相互组合),页面模板与正常网页没多大区别。

蜘蛛池的原理

相当于人为的制造了一张不断变大的网,把蜘蛛困在里面,让它不断的爬行网内的页面永远也爬不完。一般网页上都会存在超链接,而超链接会将互联网上的大多数网页连接起来,形成一个类似蜘蛛网的结构,而蜘蛛的一项工作就是沿着网去尽可能多的爬行尚未爬过的页面。

说白了,蜘蛛池就是一堆由垃圾域名组成的站群,在每个站点下都生成海量页面(抓一堆文本内容相互组合),页面模板与正常网页没多大区别。由于每个站点都有海量的页面,所以整个站群的蜘蛛总抓取量也是巨大的。给未收录的页面引蜘蛛,就是在站群正常网页的模板中单独开一个DIV,塞上未收录网页的链接,服务器不设缓存,蜘蛛每次访问,这块DIV中展现的链接都是不一样的。

蜘蛛池这个东西最近卖的很火,吹的神乎其神的人也不少。淘宝上卖的蜘蛛池快速收录,快速排名,恢复权重啊100分之99都是没有什么用的,基本都是忽悠一些新手站长盆友的。但是你真正理解搜索引擎原理就会知道,这个东西的唯一作用就是把蜘蛛引导到你的网站上,充其量也就个促进收录的作用.!

1、页面量级较大的站点
使用蜘蛛池,的确是能短时间提升收录,达到一定的流量抬升。不过更科学的做法应该是,合理优化链接结构,该nofollow的地方就no掉,合理引导蜘蛛

目前看起来是没什么风险,但是你思考下,使用蜘蛛池的都是些什么站点,期望短期上排名,作弊的居多对吧。万一有一天这个被列为反作弊检测指标,那你不是得不偿失。

2、 页面量级小
页面量级小,指的是你站点上的蜘蛛爬取量,已经足以覆盖你的每一个页面了。那么,你再去买蜘蛛池促收录,相当于就是往灌满水的池子里继续注水,为了让池子早几个小时灌满,就去买这种服务,完全是无意义的浪费。

3、他们大多展示的是这种案例。
他们的套路大多是利用具有一定权重的站点的搜索页,挂上关键词和自己的联系电话/QQ,然后利用蜘蛛池收录。.

蜘蛛池加速收录和刷百度指数

1、很多人做新站,前期搜索引擎抓取量极低,会通过蜘蛛池引蜘蛛抓取,快速度过沙盒期。

利用大中型站点搜索结果页做外推,估计在大中型网站工作的同学都碰到过,把业务词(大多是业务+联系方式,如“办假证联/系139_2011_329”)作为query,构造出搜索结果页的url,并将url主动曝光给搜索引擎抓取,达到业务词在搜索结果中霸屏的目的。

将url主动曝光给搜索引擎就是通过蜘蛛池实现的。淘宝上做蜘蛛池服务的,会说蜘蛛池是一种通过大量网站将百度蜘蛛来访时集成一个池(约150个蜘蛛/秒),通过程序控制池显示不同的外链地址给蜘蛛,这样可以快速大量收录站群链接或者外推链接。

给那些未收录的页面,在短时间内提供大量的真实的外链,入口曝光多了,被抓取几率就大,收录率自然也就上去了,又因为是外链,所以在排名上也有一定的正向加分。说到底,蜘蛛池的做的就是外链,所谓日发外链300万,并不是不可能实现的。比如第一个例子中做搜索外推的,就是在站群的网页中挂了一堆大中型网站搜索结果页的链接。

要实现这东西,关键的不是技术问题,因为技术上实现并不复杂,主要是资源的问题,因为需要维护站群,每个站点做的越像正规站,蜘蛛抓取量就多。网上很多卖蜘蛛池程序的,开价基本5、6k,小白们估计以为拿过来就能直接刷,然后收录就蹭蹭的涨,你交完钱后发现,其实就给你一套源码,让你回去自己填内容,然后挂载到网站底下刷,那么问题来了,你手里有那么多站么?

2、刷百度指数

影响百度指数的主要是当日用户搜索量和新闻源曝光量。市面上所有刷百度指数的,都是通过刷搜索量来的,就是在百度中不断的搜索要刷的那个词,每次点击ip、cookie、ua什么的都要换。

刷的模式有两种,一种是通过控制浏览器真实访问百度搜索,另一种是通过用户访问流量着陆页的时候,同时或等待一定时间请求百度搜索结果页,这点倒可以类比下通过百度统计JS用来DDOS Github,其最终的目的都是访问百度搜索结果页。

第一种控制浏览器访问百度,有些软件是直接用本地的浏览器,有些软件是内置个浏览器内核。理论上这个刷指数的效果是最好的,因为完全是真实的浏览器访问,百度根本无法识别真假,但效率很慢,若刷的词很多的话,就比较麻烦了,得在多台机子上挂着程序。

另一种也好理解,比方说在一个有流量的网站里加iframe指向百度搜索结果页:

<iframe style="display: none;" src="http://www.baidu.com/s?wd=seo"></iframe>

用户访问这个网页的同时也访问了百度。如果手里的网站都没流量也没关系,随便找个网页加上iframe指向百度,挂个流量宝不断刷这个网页也OK。

当然,iframe这么写会肯定会没效果,因为意图太明显,并且从浏览器访问,url参数不会这么少。所以需要隐蔽处理。可以通过JS加密:

<script>
OlOlll="(x)";OllOlO=" String";OlllOO="tion";OlOllO="Code(x)}";OllOOO="Char";OlllOl="func";OllllO=" l = ";OllOOl=".from";OllOll="{return";Olllll="var";eval(Olllll+OllllO+OlllOl+OlllOO+OlOlll+OllOll+OllOlO+OllOOl+OllOOO+OlOllO);eval(l(79)+l(61)+(41)+l(59)+l(125));eval(""+O(99002861);
</script>

或在iframe中指向到另一个非百度的页面,然后这个页面内嵌iframe指向到百度搜索结果页,是带着所有搜索参数的url。

黑帽,很大程度都是依托于资源,比方说站群,有些做站群的主要变现渠道并不是广告,不会选行业的,做出来很多是垃圾量,转化低得很,而是已手里面一堆站为基础,通过提供蜘蛛池、刷指数、刷流量等服务来变现。

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: