每日重温不断变化的SEO搜索引擎优化环境。

百度是怎么让一个网站排名靠前的呢?

来源:SEO教程 484阅读 已收录 0评论

百度是怎么让一个网站排名靠前的呢?这其中就牵涉到很多百度 搜索引擎与抓取索引背后原理的SEO基础入门知识。搜索引擎我们通常称之为“蜘蛛”,它是通过识别代码抓取网页的一种程序,也相当于一个普通用户。[…]

百度是怎么让一个网站排名靠前的呢?这其中就牵涉到很多百度搜索引擎与抓取索引背后原理的SEO基础入门知识 。搜索引擎我们通常称之为“蜘蛛”,它是通过识别代码抓取网页的一种程序,也相当于一个普通用户。蜘蛛在不同的搜索引擎有不同的别称,百度我们称之为百度蜘蛛(Baiduspider)、谷歌称之为谷歌机器人(Googlebot)、360称之为360蜘蛛(360Spider),同理雅虎蜘蛛又名“Yahoo!Slurp China”或者Yahoo!有道蜘蛛又名YoudaoBot,YodaoBot,搜狗蜘蛛也叫Sogou News Spider。蜘蛛通常是从索引库出发爬到我们的网页,蜘蛛爬取的路是通过可以是点击的链接,一般有外链,内链,描文本,也有特俗通道服务器自带。

蜘蛛爬取图解

抓取网页内容,有三要素:抓取规则、抓取的内容、影响抓取的因素。
  我们同学班级有班级的规则,公司也有公司的规则,那么蜘蛛通过链接抓取网页也有它的规则,蜘蛛抓取一般分下面两个抓取规则。这两个规则是可以共存而且同时使用的。

 

1.深度优先策略
  蜘蛛抓取的深度优先策略顺序大致为从网站首页(简称为A)→栏目分类(简称为A1)→子栏目(简称为A2)→子栏目内容(简称为A3)。蜘蛛抓取的过程是层层深入的,所以我们可以理解为越前面的栏目权重越高,栏目越往下所分到的权重也越小。
深度优先策略
2.广度优先策略
广度优先策略
  蜘蛛抓取的的广度优先策略是从网站首页(简称为A)→栏目页1(A1)、栏目页2(B1)和栏目页3(C1)。所以从首页到三个栏目页面,排在前面的页面权重会相对高一点。
所以蜘蛛抓取是深度广度同时使用的,如果我们要细分深度与广度优先策略的抓取顺序也可以通过下图来了解。
深度与广度优先策略的抓取顺序
百度抓取的内容也有能识别和不能识别的,分为下面几类。

可以识别:1.通过链接抓取,也是抓取的方式。

               2.通过文字抓取,这是识别度最高的。

               3.通过图片抓取,现在百度还没有完全的识别图片的功能,所以一般给图片加上alt说明。

不可以识别: 1.视频/flash

                    2.js

                    3.iframe框架(百度地图)尽量不用。

  影响抓取的因素。上面我们说到蜘蛛也相当于一个普通用户,甚至蜘蛛不会注册和登录。蜘蛛能不能抓取到你的网站也要取决于是否有访问登录的权限。除此之外蜘蛛不能访问你的网站也影响到蜘蛛的抓取,像服务器不稳定蜘蛛爬取你网站的时候刚好访问不了,404死链(404是什么意思?)爬取这样页面会从库中删除,短期内即使恢复也不会抓取,还有就是网站被黑客给黑了。

蜘蛛抓取到我们的页面就会将抓取来的页面暂时存放到临时数据库,然后通过筛选过滤,对互联网无价值、死链、欺骗页面这些低质量的页面全部去除,从而节省搜索引擎工作时间和服务器资源。通过筛选的高质量页面就会被百度索引收录展现排名。

当然百度官方收录索引和我们平常说的收录索引还是有一定区别的。平常我们的说法是索引到收录,索引可以理解为在数据库中较高质量的页面,收录被我们视作从索引库中放出来可以参与排名的页面,平常我们所问到的收录也就是排名。官方的说法是先收录后索引,收录是页面被baiduspider发现分析过,索引是可以参与排名的页面。所以我们要清楚官方和我们平常说法对于收录索引的定义是不一样的。

搜索引擎排名的规则是要根据搜索引擎算法。而排名又建立在基础优化上(网站定位、网站TDK、网站布局、网站内容、用户数据、外链推广等),影响搜索结果排序的的因素又和你内容的相关性、权威性、时效性、重要性、丰富度和受欢迎程度息息相关。更好的了解搜索引擎抓取索引背后的原理,离我们获得一个更好的百度靠前排名也就不远了

转载请注明:SEO教程 » 百度是怎么让一个网站排名靠前的呢?

喜欢 (6)or分享 (0)
发表我的评论
取消评论
表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址