真正的SEO技术:百度蜘蛛IP段位的知识

「阅读需时: 4 分钟」

如果大家有经常查看网站访问日志的话,对于百度蜘蛛(baidu spider)应该就不陌生了。

百度蜘蛛,是百度搜索引擎的一个自动程序。它的作用是访问收集整理互联网上的网页、图片、视频等内容,然后分门别类建立索引数据库,使用户能在百度搜索引擎中搜索到您网站的网页、图片、视频等内容。

细心的朋友,应该已经发现了,百度蜘蛛的IP段和IP其实是很多的。

坊间流传这一种说法,说百度蜘蛛会使用不同IP段来抓取网站,不同的IP段所对应的权重也不太一样。

后来,百度有针对此事辟谣过,说百度是会通过不同的IP段来爬取内容,但是这个不涉及权重方面的判断。

不管是真是假,通过我的观察和研究,整理了一些内容常见的IP段和IP,以供参考。

01

以123开头

123.125.66.* :代表百度蜘蛛预备抓取。

123.125.68.*: 每天这个IP段蜘蛛来的最多,其余IP段较少的话示意网站被降权或者进入沙盒。

123.125.71.*: 低权重蜘蛛,抓取内页收录的,但是权重较低,文章内页不会很快被放出来。

123.181.108.77:低权重蜘蛛,抓取内页收录的,但是权重较低,文章内页不会很快被放出来。

121.14.89.* :此蜘蛛为考察蜘蛛,此IP段蜘蛛来光顾基本上是网站无排名!

02

网站异常

203.208.60.*:此ip段为异常蜘蛛,通常由于网站服务器问题或其他违规行为会引起它来爬取

210.72.225.*:此ip段为日常巡逻蜘蛛,只要网站没有问题,没有违规操作就行。

03

以220和116开头

220.181.68.*:每天这个IP段只增不减很有大概进沙盒或K站。

220.181.7.*:代表百度蜘蛛IP拜访,预备抓取你工具。

220.181.108.*:此ip段为权重蜘蛛,如果此蜘蛛频繁光顾,那么网站收录会有提高。如果频繁光顾网站却不收录,那么要注意是否网站质量不高,内容是否很差。

220.181.108.95:这个是百度抓取首页的公用IP,如是220.181.108段的话,网站会每天隔夜快照。

220.181.108.92:同上98%抓取首页,大概还会抓取其他(不是指内页)。220.181段属于权重IP段,此段爬过的文章或首页根本24小时放出来。

220.181.108.91:属于综合的,重要抓取首页和内页或其他,属于权重IP段,爬过的文章或首页根本24小时放出来。

220.181.108.75:重点抓取更新文章的内页到达90%,8%抓取首页,2%其他。权重IP段,爬过的文章或首页根本24小时放出来。

116.179 开头的百度蜘蛛、与220开头的蜘蛛功能类似、目测属于权重蜘蛛。

04

其余百度蜘蛛

159.226.50.*

180.76.5.*

220.181.158.107

百度图片

123.15.**.**

百度渲染

    1. *

百度竞价

61.135.165.134

117.34.74.66

118.122.188.194

119.63.196.9

125.39.78.185

以上就是常见的一些百度蜘蛛的IP端和IP了,可以对网站访问日志进行相应的分析,对照一下,就能发现你网站存在的一些问题或了解网站的变化趋势了。