通过《SEO新手入门系列2021(二):SEO 101》这篇文章已经简单的介绍了什么是SEO,和搜索引擎,这一篇文章来详细的介绍下搜索引擎的工作原理,搜索引擎的工作顺序大致是: 抓取网页(Crawing) , 建立索引(Indexing),排名显示(Ranking) 。 就像在前一篇文章提到的,搜索引擎就是一个问答机器,他们去挖掘,理解,组织网上能发现的任何信息,然后把他们以相关的方式组织起来,再返回给使用者,为了能把你的网站展现给用户之前,最重要的一件事就是你的网站能够被搜索引擎发现 ,否则在SEPRs(搜索引擎结果页)是不会有你网站信息的。 搜索引擎是怎么工作的? 就如SEO禅开头说的,搜索引擎想把网站信息提供给用户,需要完成三个主要任务: 爬取网站(Crawing)会有很多蜘蛛程序,顺着URL一个网站一个网站的爬取网站内容。 创建索引(Indexing)对蜘蛛爬取的内容进行分类,创建相关索引,并储存在数据库中。 建立排名(Ranking)为可能的问题建立相关性排名,相关性最高的内容排在靠前的位置。 当然其中的技术实现是非常复杂的,作一名SEO新人,可能占时不需要深究这些问题,SEO禅在大学毕业的时候,作的毕业设计就是搜索引擎,当然那时候是使用第三方的索引分词库,我们大部分时间只要配置规则就可以,更深入的内容我会另写些篇文章来分享。 搜索引擎抓取(Crawing) 搜索引擎要想把相关内容展示给用户,第一步做的就是派出他的小弟—— 搜索引擎爬虫(蜘蛛) ,他们会不停的抓取互联网上新的内容,或者更新数据库中旧的内容,内容的形式多种多样,有可能是网页,PDF文件,MP3音频文件,什么形式都有,但是他们都是通过URL去找到这些内容的。 搜索引擎一开始会有一些种子URL,这些URL都是一些质量比较高的链接地址,而且蜘蛛们就会顺着这些地址不断的往下抓取,在这个过程中,新发现的链接又会被作为新一轮爬取任务的种子URL,直到没有新的链接可以爬取。 搜索引擎索引(Indexing) 建立索引是一个非常复杂的过程,这个过程涉及的内容比较多的是计算机方面的内容,有算法,有地理环境,有社会学研究等等因素,搜索引擎会根据很多参数去控制这些内容的分类,但是最重要的一点,就是这些内容的相关性,相关性越高,被分在同一个分类的可能性就越高,建立索引是为了后期能快速展现给用户作准备,也是为排名提供数据基础。 搜索引擎排名(Ranking) 用户在搜索引擎输入框输入他的关键词,搜索引擎会用惊人的效率在他庞大的索引数据库中找到相关的内容,并按内容的相关性和一些其它的参数来对内容进行排序,这个过程就是搜索引擎排名,靠前的内容,在搜索引擎看来就是和用户的问题相关性越高的回答。 如果我们不想让搜索引擎把一些内容展示给用户,这也是可以办到的,但是大多数情况下我们不会这么做,搜索引擎优化的目的就是为了让用户看到我们,并能让搜索引擎优先展示我们想给用户看的内容。 搜索引擎能找到你么? 就像前面说的,如果要让自己的网站出现在SERPs中,那前提就是让网站被搜索引擎蜘蛛爬取和索引,如果你已经有了网站,你可以使用 site 命令来查看自己网站被收录的情况,就拿SEO禅为例,在谷歌搜索框输入 site:www.seozen.top 你可以看到如下类似的结果: 可以看到SEO禅已经有135个网页已经被谷歌收录,这个结果是经常会变动的,能看到一个大概的数据,并不是特别的精准,还有很多没有显示的网页,用一些关键词也是能搜索到。如果想看更精准的结果,可以使用 在收录功能中查看,这就相当于我们 百度的站长平台 ,但是SEO禅个人觉得比百度站长的作用要大的多,所以SEO禅一般只会看GSC的数据,很少去看百度站长平台的数据,以后也会专门写几篇文章来介绍。 如果你使用 site命令 找不到网站的收录,那有可能是下面几种原因: 网站是新站,搜索引擎还没有收录。 网站没有外部导入链接,可以到一些平台发一些外链。 网站目录结构太深,太复杂,让搜索引擎爬虫抓取的效率太低。 网站可能包含一些阻止搜索引擎爬虫的代码,如 noindex , nofollow 网站可能被搜索引擎处罚,因为一些作弊或者垃圾广告等。 我们有时候把精力太多的放在如何让搜索引擎抓取内容,却忽略如何不让搜索引擎不要爬取一些内容,比如说一些重复的页面,一些搜索参数,还有比如说公司的联系方式,留言等,这些内容被收录意义并不大,而且还会让搜索引擎不知道具体哪个界面是你最想展示给用户的,所以这时候我们就要告诉搜索引擎,哪些资源他不要花时间去爬取,这就要 robots.txt 文件出场了,这篇SEO教程先到这,下篇文章继续接下去讲《SEO新手入门系列2021(四):搜索引擎相关知识》。 你可能想看: SEO新手入门系列2021(四):搜索引擎相关知识 这是《SEO新手入门系列2021系列》的第四篇内容,前面一篇已经把搜索引擎的工作原理作了简单的介绍,可能看过SEO禅以前文章的朋友会发现,有些内容其实是已经写过的,但是为什么还要再写呢?其实SEO禅也... SEO新手入门系列2021(八):SEO技术 SEO的从业门槛在SEO禅认为,相对其它技术类的职位要低的多,可以说没有什么门槛,但是这不代表SEO很简单,SEO需要学的东西非常的多,有些东西很细,有些东西没有技术背景理解起来就要吃力的多,比如JS... SEO新手入门系列2021(七):站内SEO优化 前一篇文章主要围绕站内内容优化,这篇文章继续说一些站内SEO优化方法。其实想要做好站内优化,就要先把一些基础优化做好,基础的优化占到了站内优化比例90%左右,最多不到10%是属于有点技术难度的高级SE... SEO新手入门系列2021(六):站内SEO内容篇 这是《SEO新手入门系列2021》中的第六篇文章,前面几篇文章主要是介绍了SEO中的基础知识部份,关于什么是SEO,搜索引擎的工作原理,关键词挖掘等,从这篇开始就要实际分享一些内容,SEO可以分为站内... SEO新手入门系列2021(二):SEO 101 这是《SEO新手入门系列教程》的第二篇文章,一看标题就应该清楚这篇文章讲的是SEO基础知识,没有任何高大上的东西,如果对SEO基本概念有了解的朋友可以跳过不需要看,但是如果你是半路出家的SEOer,我... SEO新手入门系列2021(一):SEO金字塔 seo禅最近打算翻译一些优秀的SEO优化文章,在MOZ上看到SEO入门系列,觉得写的不错,所以就打算翻译成中文,希望对SEO新人有一定帮助,这个系列文章翻译自:https://moz.com/begi... SEO新手入门系列2021(二):SEO 101 这是《SEO新手入门系列教程》的第二篇文章,一看标题就应该清楚这篇文章讲的是SEO基础知识,没有任何高大上的东西,如果对SEO基本概念有了解的朋友可以跳过不需要看,但是如果你是半路出家的SEOer,我... SEO新手入门系列2021(五):挖掘关键词 前面已经说完搜索引擎的工作原理,现在就和SEO禅一起来学习下SEO最重要的一部分内容,SEO关键词,很多朋友在选择目标关键词的时候没有头绪,有时候选的关键词和网站的内容也不合适,导致搜索引擎导流来的用... WordPress SEO新手入门教程(一):基础设置优化 WordPress作为当前最流行的建站程序,市场占有率那是相当的高啊,你说一个做SEO的要是不懂做WordPress 优化,那他可能是个假SEOer,虽然说平时接的单子很多是企业的优化项目,但是最多的... 2021谷歌SEO优化入门:Google搜索引擎是怎么工作的? 前段时间,SEO禅写了一篇SEO禅站点谷歌排名情况分析文章,记录在这段时间SEO禅在谷歌的排名情况,谷歌还是很给面子的,很多个有流量的关键词已经排名到首页,每天有真实的流量进来,许多其他的关键词也在陆...
SEO新手入门系列2021(三):搜索引擎工作原理
2024-07-05 | 浏览: 58
通过《SEO新手入门系列2021(二):SEO 101》这篇文章已经简单的介绍了什么是SEO,和搜索引擎,这一篇文章来详细的介绍下搜索引擎的工作原理,搜索引擎的工作顺序大致是: 抓取网页(Crawing) , 建立索引(Indexing),排名显示(Ranking) 。
就像在前一篇文章提到的,搜索引擎就是一个问答机器,他们去挖掘,理解,组织网上能发现的任何信息,然后把他们以相关的方式组织起来,再返回给使用者,为了能把你的网站展现给用户之前,最重要的一件事就是你的网站能够被搜索引擎发现 ,否则在SEPRs(搜索引擎结果页)是不会有你网站信息的。
搜索引擎是怎么工作的?就如SEO禅开头说的,搜索引擎想把网站信息提供给用户,需要完成三个主要任务:
当然其中的技术实现是非常复杂的,作一名SEO新人,可能占时不需要深究这些问题,SEO禅在大学毕业的时候,作的毕业设计就是搜索引擎,当然那时候是使用第三方的索引分词库,我们大部分时间只要配置规则就可以,更深入的内容我会另写些篇文章来分享。
搜索引擎抓取(Crawing)搜索引擎要想把相关内容展示给用户,第一步做的就是派出他的小弟—— 搜索引擎爬虫(蜘蛛)
,他们会不停的抓取互联网上新的内容,或者更新数据库中旧的内容,内容的形式多种多样,有可能是网页,PDF文件,MP3音频文件,什么形式都有,但是他们都是通过URL去找到这些内容的。
搜索引擎一开始会有一些种子URL,这些URL都是一些质量比较高的链接地址,而且蜘蛛们就会顺着这些地址不断的往下抓取,在这个过程中,新发现的链接又会被作为新一轮爬取任务的种子URL,直到没有新的链接可以爬取。
搜索引擎索引(Indexing)建立索引是一个非常复杂的过程,这个过程涉及的内容比较多的是计算机方面的内容,有算法,有地理环境,有社会学研究等等因素,搜索引擎会根据很多参数去控制这些内容的分类,但是最重要的一点,就是这些内容的相关性,相关性越高,被分在同一个分类的可能性就越高,建立索引是为了后期能快速展现给用户作准备,也是为排名提供数据基础。
搜索引擎排名(Ranking)用户在搜索引擎输入框输入他的关键词,搜索引擎会用惊人的效率在他庞大的索引数据库中找到相关的内容,并按内容的相关性和一些其它的参数来对内容进行排序,这个过程就是搜索引擎排名,靠前的内容,在搜索引擎看来就是和用户的问题相关性越高的回答。
如果我们不想让搜索引擎把一些内容展示给用户,这也是可以办到的,但是大多数情况下我们不会这么做,搜索引擎优化的目的就是为了让用户看到我们,并能让搜索引擎优先展示我们想给用户看的内容。
搜索引擎能找到你么?就像前面说的,如果要让自己的网站出现在SERPs中,那前提就是让网站被搜索引擎蜘蛛爬取和索引,如果你已经有了网站,你可以使用
site
命令来查看自己网站被收录的情况,就拿SEO禅为例,在谷歌搜索框输入site:www.seozen.top
你可以看到如下类似的结果:可以看到SEO禅已经有135个网页已经被谷歌收录,这个结果是经常会变动的,能看到一个大概的数据,并不是特别的精准,还有很多没有显示的网页,用一些关键词也是能搜索到。如果想看更精准的结果,可以使用 在收录功能中查看,这就相当于我们 百度的站长平台 ,但是SEO禅个人觉得比百度站长的作用要大的多,所以SEO禅一般只会看GSC的数据,很少去看百度站长平台的数据,以后也会专门写几篇文章来介绍。
如果你使用 site命令 找不到网站的收录,那有可能是下面几种原因:
我们有时候把精力太多的放在如何让搜索引擎抓取内容,却忽略如何不让搜索引擎不要爬取一些内容,比如说一些重复的页面,一些搜索参数,还有比如说公司的联系方式,留言等,这些内容被收录意义并不大,而且还会让搜索引擎不知道具体哪个界面是你最想展示给用户的,所以这时候我们就要告诉搜索引擎,哪些资源他不要花时间去爬取,这就要
robots.txt
文件出场了,这篇SEO教程先到这,下篇文章继续接下去讲《SEO新手入门系列2021(四):搜索引擎相关知识》。SEO新手入门系列2021(四):搜索引擎相关知识
这是《SEO新手入门系列2021系列》的第四篇内容,前面一篇已经把搜索引擎的工作原理作了简单的介绍,可能看过SEO禅以前文章的朋友会发现,有些内容其实是已经写过的,但是为什么还要再写呢?其实SEO禅也...
SEO新手入门系列2021(八):SEO技术
SEO的从业门槛在SEO禅认为,相对其它技术类的职位要低的多,可以说没有什么门槛,但是这不代表SEO很简单,SEO需要学的东西非常的多,有些东西很细,有些东西没有技术背景理解起来就要吃力的多,比如JS...
SEO新手入门系列2021(七):站内SEO优化
前一篇文章主要围绕站内内容优化,这篇文章继续说一些站内SEO优化方法。其实想要做好站内优化,就要先把一些基础优化做好,基础的优化占到了站内优化比例90%左右,最多不到10%是属于有点技术难度的高级SE...
SEO新手入门系列2021(六):站内SEO内容篇
这是《SEO新手入门系列2021》中的第六篇文章,前面几篇文章主要是介绍了SEO中的基础知识部份,关于什么是SEO,搜索引擎的工作原理,关键词挖掘等,从这篇开始就要实际分享一些内容,SEO可以分为站内...
SEO新手入门系列2021(二):SEO 101
这是《SEO新手入门系列教程》的第二篇文章,一看标题就应该清楚这篇文章讲的是SEO基础知识,没有任何高大上的东西,如果对SEO基本概念有了解的朋友可以跳过不需要看,但是如果你是半路出家的SEOer,我...
SEO新手入门系列2021(一):SEO金字塔
seo禅最近打算翻译一些优秀的SEO优化文章,在MOZ上看到SEO入门系列,觉得写的不错,所以就打算翻译成中文,希望对SEO新人有一定帮助,这个系列文章翻译自:https://moz.com/begi...
SEO新手入门系列2021(二):SEO 101
这是《SEO新手入门系列教程》的第二篇文章,一看标题就应该清楚这篇文章讲的是SEO基础知识,没有任何高大上的东西,如果对SEO基本概念有了解的朋友可以跳过不需要看,但是如果你是半路出家的SEOer,我...
SEO新手入门系列2021(五):挖掘关键词
前面已经说完搜索引擎的工作原理,现在就和SEO禅一起来学习下SEO最重要的一部分内容,SEO关键词,很多朋友在选择目标关键词的时候没有头绪,有时候选的关键词和网站的内容也不合适,导致搜索引擎导流来的用...
WordPress SEO新手入门教程(一):基础设置优化
WordPress作为当前最流行的建站程序,市场占有率那是相当的高啊,你说一个做SEO的要是不懂做WordPress 优化,那他可能是个假SEOer,虽然说平时接的单子很多是企业的优化项目,但是最多的...
2021谷歌SEO优化入门:Google搜索引擎是怎么工作的?
前段时间,SEO禅写了一篇SEO禅站点谷歌排名情况分析文章,记录在这段时间SEO禅在谷歌的排名情况,谷歌还是很给面子的,很多个有流量的关键词已经排名到首页,每天有真实的流量进来,许多其他的关键词也在陆...