作为一名SEO人员,虽然不用很熟悉搜索引擎的工作原理,但是对搜索原理有一定的了解是必要的,我尽量用简洁的语句去解释。 搜索引擎的前世今生 搜索引擎在早期的时候,是以 目录索引 的形式为世人所知,但是那并不算真正的搜索引擎,当时那些搜索结果多数是靠人工编辑的,有点像“hao123”之类的网站,现在的搜索引擎都是程序化的,所有内容,基本上靠的是程序自动化收集。虽然时代和技术都在改变,其实搜索引擎的原理一直都没有变,其实就是: 抓取内容 , 分类预处理 , 用户展现 。当然其中有很多技术细节,作为SEO人员就没有必要深入了解。 蜘蛛爬取 在简单了解了搜索引擎的工作原理之后,我们可以知道,其中只有在抓取内容这一部分,我们可以通过一些SEO手段,来提高搜索引擎对网站的收录,那搜索引擎是如何收录这么多网站的呢?这里就要提到搜索引擎的爬取程序, 搜索引擎蜘蛛(Spider) ,每一种搜索引擎有它们自己的蜘蛛程序,各自的爬取习惯也不同,但是大致可以分为两种: 深度优先爬取,就是“一条巷子走到黑”的方法,只要蜘蛛爬过的链接,都会顺着当前链接继续往下爬,即使页面中有其它的链接,也不会马上去爬取。 广度优先爬取的策略,就是尽可能的把同一页面的链接访问完,再去访问下一个页面中的链接,如果一个页面中的链接太多,也会影响蜘蛛的访问效率。 SEO优化的思考 上面简单介绍了搜索引擎的工作原理,还有蜘蛛的爬取习惯,各位朋友有没有考虑过,作为一个 SEOer ,如何根据这些信息,来调整优化网站,让搜索引擎提高网站的收录。 我来谈谈我的看法,就蜘蛛的工作方式来说,蜘蛛不可能无限的爬取一个网站,搜索引擎肯定制定了一系列规则,如果 网站 的层次太深,这肯定会不利于蜘蛛的爬取,同理,如果一个 页面 中有太多链接,也是会导致蜘蛛爬取效率的低下,所以我们在调整优化 网站结构 , 内部链接 的时候就需要考虑这个问题,还有网站的 404页面 也是需要考虑的,因为当蜘蛛爬取一个链接发现是死链接的时候,需要一个出口回到正常界面,如果没有这个出口,那对搜索引擎来说是非常不友好的。 你可能想看: 常见搜索引擎蜘蛛用户代理(User Agent)列表 最近在修订《SEO实战密码》第5版。为了缩减篇幅,我会把一些资料性的内容删减掉,做成页面,并保持更新,读者可以随时看到最新信息。 搜索引擎自己怎么做SEO? 和其他网站一样,搜索引擎本身也需要做SEO。搜索引擎内部运营网站的团队和普通SEO们大致是站在相同的起跑线上。 搜索引擎蜘蛛抓取份额是什么? 抓取份额是搜索引擎蜘蛛花在一个网站上的抓取页面的总的时间上限。对大中型网站来说,充分利用抓取份额是个颇为重要的SEO问题,有时候会成为网站流量瓶颈。 苹果要做搜索引擎? 移动搜索现在真是火热啊,不仅百度、Google等搜索引擎都发力在移动搜索上,连本来和搜索不沾边的苹果也可能要搀和一下了。 《百度搜索引擎网页质量白皮书》发布 今天百度发布了《百度搜索引擎网页质量白皮书》,建议SEO们都下载来看看。 免费电子书:了解搜索引擎 《SEO实战密码》一书第2章“了解搜索引擎”已经制作为电子书,感兴趣的读者可以点击这里下载,PDF文件,1.4MB,欢迎四处传播。 SEO实验证明搜索引擎的话不可全信 我们往往很信任搜索引擎内部人的说法,但事实证明他们的话也不可全信。 搜索引擎怎样抓到你? 用户行为方式怎样影响搜索引擎排名结果,是很多SEO一直关心探讨的问题。 做Google SEO优化一定要知道的名词:SERP(搜索引擎结果页) 许多的外贸用户开始选择用WordPress做网站的原因之一就是为了做Google SEO。那么说到做Google SEO,就不能不知道搜索引擎结果页,SERP。本文奶爸给大家介绍下为什么要注意SERP 更改搜索引擎蜘蛛的抓取速度,避免占用太多服务器资源 正常情况下,我们做Google SEO当然是希望搜索引擎蜘蛛可以天天在你网站里面爬行抓取内容,但是如果你的服务器有资源限制,那么可能Google蜘蛛太频繁的抓取你网站会导致服务器资源耗尽,或者网站打开
浅识搜索引擎
2024-07-05 | 浏览: 23
作为一名SEO人员,虽然不用很熟悉搜索引擎的工作原理,但是对搜索原理有一定的了解是必要的,我尽量用简洁的语句去解释。
搜索引擎的前世今生搜索引擎在早期的时候,是以 目录索引 的形式为世人所知,但是那并不算真正的搜索引擎,当时那些搜索结果多数是靠人工编辑的,有点像“hao123”之类的网站,现在的搜索引擎都是程序化的,所有内容,基本上靠的是程序自动化收集。虽然时代和技术都在改变,其实搜索引擎的原理一直都没有变,其实就是: 抓取内容 , 分类预处理 , 用户展现 。当然其中有很多技术细节,作为SEO人员就没有必要深入了解。
蜘蛛爬取在简单了解了搜索引擎的工作原理之后,我们可以知道,其中只有在抓取内容这一部分,我们可以通过一些SEO手段,来提高搜索引擎对网站的收录,那搜索引擎是如何收录这么多网站的呢?这里就要提到搜索引擎的爬取程序, 搜索引擎蜘蛛(Spider) ,每一种搜索引擎有它们自己的蜘蛛程序,各自的爬取习惯也不同,但是大致可以分为两种:
深度优先爬取,就是“一条巷子走到黑”的方法,只要蜘蛛爬过的链接,都会顺着当前链接继续往下爬,即使页面中有其它的链接,也不会马上去爬取。
广度优先爬取的策略,就是尽可能的把同一页面的链接访问完,再去访问下一个页面中的链接,如果一个页面中的链接太多,也会影响蜘蛛的访问效率。
SEO优化的思考上面简单介绍了搜索引擎的工作原理,还有蜘蛛的爬取习惯,各位朋友有没有考虑过,作为一个 SEOer ,如何根据这些信息,来调整优化网站,让搜索引擎提高网站的收录。
我来谈谈我的看法,就蜘蛛的工作方式来说,蜘蛛不可能无限的爬取一个网站,搜索引擎肯定制定了一系列规则,如果 网站 的层次太深,这肯定会不利于蜘蛛的爬取,同理,如果一个 页面 中有太多链接,也是会导致蜘蛛爬取效率的低下,所以我们在调整优化 网站结构 , 内部链接 的时候就需要考虑这个问题,还有网站的 404页面 也是需要考虑的,因为当蜘蛛爬取一个链接发现是死链接的时候,需要一个出口回到正常界面,如果没有这个出口,那对搜索引擎来说是非常不友好的。
常见搜索引擎蜘蛛用户代理(User Agent)列表
最近在修订《SEO实战密码》第5版。为了缩减篇幅,我会把一些资料性的内容删减掉,做成页面,并保持更新,读者可以随时看到最新信息。
搜索引擎自己怎么做SEO?
和其他网站一样,搜索引擎本身也需要做SEO。搜索引擎内部运营网站的团队和普通SEO们大致是站在相同的起跑线上。
搜索引擎蜘蛛抓取份额是什么?
抓取份额是搜索引擎蜘蛛花在一个网站上的抓取页面的总的时间上限。对大中型网站来说,充分利用抓取份额是个颇为重要的SEO问题,有时候会成为网站流量瓶颈。
苹果要做搜索引擎?
移动搜索现在真是火热啊,不仅百度、Google等搜索引擎都发力在移动搜索上,连本来和搜索不沾边的苹果也可能要搀和一下了。
《百度搜索引擎网页质量白皮书》发布
今天百度发布了《百度搜索引擎网页质量白皮书》,建议SEO们都下载来看看。
免费电子书:了解搜索引擎
《SEO实战密码》一书第2章“了解搜索引擎”已经制作为电子书,感兴趣的读者可以点击这里下载,PDF文件,1.4MB,欢迎四处传播。
SEO实验证明搜索引擎的话不可全信
我们往往很信任搜索引擎内部人的说法,但事实证明他们的话也不可全信。
搜索引擎怎样抓到你?
用户行为方式怎样影响搜索引擎排名结果,是很多SEO一直关心探讨的问题。
做Google SEO优化一定要知道的名词:SERP(搜索引擎结果页)
许多的外贸用户开始选择用WordPress做网站的原因之一就是为了做Google SEO。那么说到做Google SEO,就不能不知道搜索引擎结果页,SERP。本文奶爸给大家介绍下为什么要注意SERP
更改搜索引擎蜘蛛的抓取速度,避免占用太多服务器资源
正常情况下,我们做Google SEO当然是希望搜索引擎蜘蛛可以天天在你网站里面爬行抓取内容,但是如果你的服务器有资源限制,那么可能Google蜘蛛太频繁的抓取你网站会导致服务器资源耗尽,或者网站打开