第二章:搜索引擎的工作原理:三步流程内部

需要帮助与您的SEO,营销经理?

搜索引擎是如何工作的(并为您的SMB带来收入)

你已经在我们的营销经理SEO指南的第1章学习了SEO的基础知识。现在,您已经准备好探索搜索引擎是如何工作的,以及它们的工作是如何影响您的底线指标(如线索、销售和收入)的。继续往下读,开始吧!

表的内容

搜索引擎是如何工作的?


搜索引擎通过抓取、索引和排名来收集和分类网页信息。然后,这些搜索引擎根据通过爬行网页收集的信息,返回最相关的页面,以响应用户的搜索查询。

搜索引擎如何工作:实现用户满意度

搜索引擎的工作方式似乎不是人情味和技术性的,但这并不是搜索引擎的目标。搜索引擎旨在提供有用的内容,回答用户的问题,无论他们想知道珠穆朗玛峰有多高,今晚的晚餐在哪里,还是苹果网站的URL。

这就是为什么像谷歌这样的搜索引擎使用超过200个排名因素,包括:

  • 反向链接
  • 关键字
  • 用户交互
  • 和更多的

这也是为什么随着搜索引擎索引的增长和用户偏好的改变,搜索结果会不断进化的原因。

搜索引擎是如何工作的:个性化搜索结果

搜索引擎不仅依赖索引来生成搜索结果,还依赖用户。有了用户的位置、首选语言、当前设备甚至搜索历史等信息,像谷歌这样的搜索引擎可以提供高度相关的结果。

例如,如果有人搜索“我附近的寿司”,就会看到基于他们所在位置的搜索结果,比如加州洛杉矶的寿司店。相比之下,在德克萨斯州休斯顿搜索的人会看到该地区的寿司店列表。

搜索引擎是如何工作的:生成搜索结果

您知道搜索引擎在广泛的层面上是如何工作的,但是当有人进行搜索时会发生什么呢?

具体步骤如下:

  1. 用户输入一个搜索查询,比如“如何打领带”
  2. 搜索引擎在索引中引用与“如何打领带”相关的内容
  3. 搜索引擎根据算法和已知的用户因素(如用户的首选语言)生成结果

然而,这个过程并没有停止。

像谷歌这样的搜索引擎还监视用户与搜索结果的交互。如果有人从搜索结果中访问了一个网站,然后又返回了,这就会被记录为pogo-stick,这可能意味着搜索结果不相关。

根据这种情况发生的频率,谷歌可能会根据“如何打领带”调整结果。

你公司的网站没有出现在搜索结果中的7个原因

你公司的网站在搜索结果中还没有出现吗?

检查以下问题,它们是一些最常见的罪魁祸首对索引的问题:

  1. 你的txt文件不小心排除了您想要索引的整个站点或页面
  2. 你的noindex标签不小心指示搜索引擎不索引你的页面
  3. 您的页面URL返回一个404错误
  4. 你的页面包含重复内容
  5. 你的页面包含细内容
  6. 您的页面提供了糟糕的用户体验,如垃圾或低质量的内容
  7. 你的网站得到了惩罚,您可以在谷歌搜索控制台中查看

如果你正在寻找一个关于为什么你的网站没有出现在搜索结果中的快速答案,试着搜索引擎优化检查程序.这个免费的工具将在60秒内提供你的索引状态的概述,并分析你的网站的SEO。

你也可以要求进行SEO审核如果你还在为你的网站索引而挣扎。

在2021年,搜索引擎如何为你的业务服务

2021年,搜索引擎使用网络爬虫程序而且高级算法抓取、索引和组织网络信息。这个过程围绕着网络爬虫展开,它会抓取搜索引擎添加到索引中的页面,然后通过搜索算法将其组织并提供给用户。

以上是对搜索引擎工作原理的概述,但它们是如何为你们这样的企业工作的呢?

搜索引擎成为公司最好的团队成员之一因为:

使用像谷歌这样的搜索引擎,您的企业可以捕获更多的流量,这转化为更多的线索,销售和收入,当您优化你的网站你的目标受众的搜索类型通过现代的购买漏斗

搜索引擎是否为你的业务服务?用我们的免费工具在60秒内找出答案,搜索引擎优化检查程序,它将审计你的网站,报告其爬行和索引状态,并对其搜索引擎优化(SEO)的水平进行评分。

或者,继续阅读,了解更多关于搜索引擎是什么以及搜索引擎是如何工作的!

什么是搜索引擎?

搜索引擎是人们访问互联网上的网站和页面的主要工具。在没有搜索引擎的情况下,你只能通过跟踪一个超链接或知道确切的URL来找到网页。

借助搜索引擎,找到“什么是EVOO?”就像输入问题一样简单(顺便说一下,这是特级初榨橄榄油的首字母缩写)。

今天最受欢迎的五个搜索引擎是:

  • 谷歌
  • 必应
  • 雅虎
  • 百度
  • Yandex

这些搜索引擎都以类似的方式工作,但是对于这个页面,我们将主要关注最流行的搜索引擎谷歌。

搜索引擎的工作原理:三步走的过程

如果你想深入了解搜索引擎是如何工作的,请阅读这一节。你将深入了解搜索结果——以及使用搜索引擎驱动收入——的三步过程。

1.爬行

首先,搜索引擎的工作原理是抓取互联网上的公开页面。搜索引擎使用网络爬虫(也称为机器人或蜘蛛)来查找这些公共网页,并最终建立这些网页的索引。

网络爬虫的工作原理:

  • 找到页面:爬虫程序首先查找并下载网页。他们使用链接来发现新页面,就像用户一样。当爬行器遇到一个新链接时,该链接会指向爬行器可以爬行的新页面。
  • 抓取页面:当蜘蛛到达一个页面时,它们会复制这个页面。然后,他们查看内容和HTML,以识别有助于确定页面上下文的关键字和短语。

网络爬虫使用这些信息来决定是否将该页面添加到搜索引擎。它们还列出页面上的所有链接,并将与之关联的页面排队进行抓取。

网络爬虫也不只是一次抓取一个页面。

相反,网络爬虫工作不停地抓取和重新抓取互联网上无数的网页。这样做可以让像谷歌这样的搜索引擎拥有页面的最新版本。

此外,蜘蛛有爬行预算。

简单地说,爬行预算是站点爬行器在离开之前爬行和索引的页面数量,以及爬行哪些页面。

爬行预算考虑了谷歌设置的爬行站点的频率限制(主要取决于它的更新频率和受欢迎程度)。

谷歌限制一次抓取的页面数量,以减轻服务器上的负载。如果蜘蛛抓取您的站点太快或太频繁,它会使您的服务器陷入瘫痪,特别是当您的站点包含数千个页面时。

2.索引

在网络爬虫读取页面后,它们会处理并将信息提交到一个名为搜索索引的大型数据库中。

每个搜索引擎都会创建一个在线页面的索引。例如,谷歌不依赖必应的索引来生成搜索结果。索引的工作原理类似于图书馆目录。这是一个巨大的分类条目列表,包括爬虫从网络上抓取的所有信息。

每个页面都有一个条目,因此搜索引擎算法可以很容易地访问它的上下文信息。使用大量的索引,像谷歌这样的搜索引擎可以快速准确地找到相关信息的页面。

3.排名

索引阶段之后是排名。

当用户搜索时,搜索引擎会向他们显示搜索结果,但搜索引擎不能在索引中显示所有的页面。相反,它必须选择在结果中放置哪些页面以及这些列表出现的顺序。

然后,搜索引擎必须使用索引的信息准确地拉出包含相关信息的搜索页面,以便在搜索中显示。他们还必须根据相关性确定这些页面的排名。

这个有问题且任意的任务在严格的因素由搜索引擎公司定义。这些因素帮助搜索引擎确定页面相关性。

这些算法通过观察以下因素来确定相关性:

  • 关键字关键字是用户在搜索引擎上搜索的短语。搜索引擎在搜索在线页面时寻找准确的和相关的关键词。基于页面的关键词和内容以及其他因素,搜索引擎决定了页面的排名。
  • 反向链接:当其他网站在他们的内容中链接到你的页面时,这被称为反向链接.像谷歌这样的搜索引擎将使用反向链接来根据链接到你的内容的页面来确定你的页面的相关性。谷歌的算法,网页排名,根据反向链接的质量和数量来决定你的排名。

排名不仅仅涉及关键字选择和反向链接。其他因素关注用户体验,这对谷歌的搜索结果排名有很大影响。这些因素包括:

谷歌在对网站进行排名时考虑了所有这些因素。谷歌的算法使用非常先进的人工智能,它可以在搜索时熟练地识别人们想要看到的东西。

谷歌伯特例如,谷歌是在2019年进行的算法更新。这次更新的重点是提高算法理解人们输入搜索查询时的意思的能力。

通过机器学习和自然语言处理,BERT可以更好地理解搜索查询中所有单词的上下文。通过更新,谷歌可以更容易地理解同义词和拼写错误等内容。

为什么被搜索引擎抓取、索引和排名很重要?

不到50%的企业使用搜索引擎优化。

这令人惊讶,因为在2021年,获得搜索引擎的抓取、索引和排名对公司的发展至关重要,无论是初创公司还是企业。当你从你的营销策略你把自己排除在有价值的线索、销售和收入之外。

以下是搜索引擎产生业务增长的原因和方式:

买家之旅发生在搜索引擎上

超过90%的在线体验从搜索引擎开始,这意味着当有人想找一个新的理发师,升级他们的咖啡机,或获得公司下一个项目的提案时,他们会转向像谷歌这样的搜索引擎。

即使你的交易是在线下进行的,人们也会使用搜索来发现他们所在地区的企业。

研究表明,五分之四的消费者使用搜索引擎查找本地信息。更不用说,76%的人谁在特定地点搜索时,会在一天内访问相关企业,这是原因之一80%的本地搜索转换。

搜索引擎保持着令人印象深刻的接近率

搜索引擎帮助人们发现你的业务,使你的公司有可能培养更多的线索,完成更多的销售。与传统营销接近率相比,搜索提供了一个巨大的改进近14.6%-传统营销的完成率低于2%。

传统营销经常失败反对像SEO这样的数字营销策略,因为SEO:

  • 帮助用户找到相关信息,使转换成为可能
  • 当用户对某个产品、服务或主题感兴趣时,就会接触到他们
  • 通过购买漏斗的每个阶段(从意识到购买)来培养用户

基本上,通过搜索,你可以在正确的时间用正确的内容接触到你的梦想客户。这种完美时机的联系在获取更多的线索、销售和收入方面有着显著的区别。

搜索引擎将你的企业与目标受众全天候联系起来

人们夜以继日地搜寻。这就是为什么搜索引擎是出色的团队成员。

通过搜索引擎优化,你的公司可以24/7地获取有价值的流量,而不需要加班。相反,你的网站作为一个枢纽,让潜在客户了解你的业务,联系你的团队,甚至购买你的产品——如果你维护一个电子商务网站

如何让你公司的网站在搜索结果中爬行、索引和排名

您知道搜索引擎是如何工作的,也知道搜索引擎是做什么的,但是您知道如何让您公司的网站在搜索结果中被抓取、索引和排名,以便您可以获得SEO的所有好处吗?

如果没有,请查看这个演练!

如何让你的公司网站被抓取

让你的网站被抓取是获得互联网知名度的入场券。您需要确保爬行器能够轻松地访问您的站点,因为您的站点在出现在搜索中之前需要进行爬行。

其实很简单:

在你的网站上没有爬行=没有出现在搜索结果中

如果您有一个新网站(或者您的网站上有一个新页面),有一些技巧可以让谷歌到快速抓取你的网站

提交您的URL到谷歌搜索控制台

中提交您的URL,可以从谷歌请求抓取谷歌搜索控制台.提供您的URL可以让谷歌更快地找到您的网站。

您可以提交您的URL通过标题的URL检查选项卡在您的搜索控制台帐户。然后选择“测试实时URL”选项,如果测试显示你的URL没有被索引,点击“请求索引”。

在新页面中包含到旧内容的内部链接(反之亦然)

内部链接是您放在页面上的超链接,链接到您站点上具有相关信息的其他页面。

内部链接通过允许蜘蛛更快地从一个页面到另一个页面来帮助它们爬行您的站点。当内部链接链接到你网站上的相关内容时,它可以帮助谷歌更好地理解你的内容上下文。

以同样的方式,内部链接也可以帮助您的访问者浏览您的页面并找到额外的内容。

创建一个XML站点地图

你的XML站点地图包含为谷歌提供的关于它应该多长时间抓取站点上各个页面的信息。

例如,假设您有一个博客页面和一个faq页面。你的常见问题不会改变太多,但你的博客每天都在更新。在您的站点地图中,您可以告诉谷歌您希望它将您的博客优先于您的FAQ页面。

站点地图还可以帮助爬行器查找和理解您所发布的新页面的重要程度。你也可以通过向谷歌的搜索控制台提交你的网站地图来请求抓取你的网站。

你也不局限于一个站点地图。你可以有多个,比如一个中央站点地图和一个博客站点地图。

创建robots.txt文件

你的robots . txtfile是列出谷歌和其他爬行程序建议的爬行指令的列表。然而,这个文件并不控制搜索引擎索引什么或如何索引。Robots.txt只是让谷歌知道您对爬行站点上各个页面的偏好。

在某些情况下,您可能想建议选择退出对站点上的特定页面进行爬行。

例如,如果您经营一家在线商店,您可能不希望谷歌抓取客户的帐户。或者,如果您的站点上的同一个页面碰巧有多个url,您希望谷歌只抓取页面一次。

限制被抓取的页面还可以帮助站点管理哪些页面计入抓取预算。

在robots.txt文件中,您可以选择站点上允许或不允许爬行的页面,但是如果有人链接到您的页面,搜索引擎仍然可以索引您的页面。

你甚至可以通过身份限制爬行。所以,如果你不想让必应抓取一个页面,但想让谷歌仍然有访问权限,你可以把它放在robots.txt文件中。

你可以通过在域名后面输入robots.txt来检查它的外观:

examplesite.com/robots.txt

如何让你公司的网站被索引

为您的页面建立索引是谷歌在搜索结果中对其进行排序的必要条件。如果您的页面没有索引,它们不会给您带来多大好处,因为人们不会找到它们。你的页面不会吸引任何流量。

如果你在搜索中没有看到你的页面,你可以检查这些简单的搜索引擎索引策略

检查是否使用" site: "操作符对页面进行了索引

您可以通过执行“site:”搜索来检查谷歌索引的所有页面。只要在谷歌的搜索栏中输入“site:[您的网站域名].com”,它就会弹出谷歌在您的网站上的所有页面。

您还可以执行“site:”搜索,以查找站点上与特定关键字匹配的内容,这在查看谷歌是否为特定页面建立了索引时非常有用。格式是“site:exampleurl.com example keyword”。

抓取和索引通常需要几天时间,所以如果您最近发布的页面没有立即出现在搜索中,也不必太担心。

在谷歌搜索控制台中检查页面的状态

如果有段时间了,你还是看不到你的页面使用“site:”搜索操作符,您的站点很可能不在搜索引擎的索引中,可能还没有被抓取。

您可以使用搜索控制台帐户的URL检查选项卡下的“测试实时URL”选项来再次检查页面的状态。如果您的页面还没有被抓取,您可以请求索引。这个过程可能需要几天时间才能完成。

另外,检查谷歌没有为您的内容建立索引是否有原因。

一些可能阻止索引的问题包括:

  • 您需要修复站点上的爬行错误,以防止谷歌爬行您的页面
  • JavaScript问题可能会阻止爬行
  • 你的网站上有重复的内容(谷歌将不知道哪个排名)
  • 你使用黑帽优化实践

检查是否将谷歌指向not index

像爬行,你可以直接谷歌不索引页面在你的网站,如管理页面和内部搜索。

为此,你可以像这样在robots.txt中包含一个" noindex "标签:

  • Noindex: / page-you-specify

或者像这样在页面的HTML中包含" noindex "标签:

  • < meta name= " robots " content= " noindex " />

在某些情况下,这些规范可能是导致您的页面在需要索引时没有被索引的原因,所以一定要再次检查。

如何让你公司的网站在搜索结果中排名靠前

通过对页面进行排序,谷歌帮助人们找到他们想要查找的信息。

搜索引擎排名对在线网站来说意味着很多事情。

你在搜索中的排名是你的内容获得多少可见性的一个巨大决定因素。看看以下三个数据:

如果你的页面没有排在第一页,你的搜索流量就会减少。排名不靠前不仅会降低你获得的流量,还会降低你推动销售和转化的能力。

排名还向你的受众表明你的品牌的真实性。你对各种关键词的排名越高,人们就会越真实地看待你。

这里有一些提高你的网站在搜索结果中的排名的策略。

执行关键字研究

关键字研究允许您为您的用户提供最相关的内容,这有助于您在搜索中排名靠前。

花点时间研究一下用户在搜索引擎中输入关键词的意思。你可以通过研究你所瞄准的关键字的当前排名内容来做到这一点,因为谷歌的算法在理解人们想知道什么方面做得很好。

当进行关键字研究时,确保目标长尾关键字.长尾关键词是较长的短语,通常是三个词或更多。它们可以包括位置关键字,如“离我近”,问题关键字,如“是什么”或“如何”,以及来自语音搜索的对话关键字。

长尾关键词在搜索结果中的排名效果很好,因为它们在排名上的竞争比短尾关键词要小,但仍然能产生网站的大部分流量。

建立链接建设策略

您的链接建设策略包括鼓励其他网站链接到您的网站的技术。你的链接建设策略将以生产读者觉得有价值的内容为中心。如果你创造了好的内容,人们会更愿意链接到它。

其他链接建设技术包括:

  • 创建像行业计算器这样的工具,用户可以使用它来提供相关的见解
  • 让你所在行业的流行人士链接到你的内容
  • 为其他网站撰写访客内容
  • 在社交媒体上传播你的内容

让你的内容更加人性化

你希望你的观众享受他们花在你的网站上的时间。对用户友好的内容是定义有价值内容的一个重要因素。谷歌对用户友好内容的搜索结果排名更高,用户将在你的网站上花更多的时间。

让你的内容用户友好:

  • 快速、清晰、简明地回答问题
  • 使用相关的标题来组织主题
  • 把你的段落分成两到三个句子,这样更容易阅读
  • 利用项目符号和编号列表,用户和搜索引擎可以找到有价值的信息
  • 放置图片、视频和信息图表,以提高内容的粘性水平

学习搜索引擎如何工作的6个有用的定义

在学习搜索引擎工作原理的三步流程之前,先看看这个小词汇表。您将了解讨论搜索引擎的一些最常用术语,如爬行、索引等。

术语 定义
1.搜索引擎索引 搜索引擎索引就像一个图书馆,只不过是一个网站及其页面的图书馆。当搜索引擎生成结果时,它从其索引生成结果。
2.蜘蛛爬虫或 搜索引擎用爬虫或蜘蛛建立索引。这些机器人在网络上爬行,并将它们找到的内容带到搜索引擎及其索引中。
3.爬行 爬行描述了爬虫或蜘蛛索引网络的过程。他们“抓取”网络上公开的网页,然后将信息带回搜索引擎的索引中。
4.搜索引擎结果页面(SERP) SERP是由用户查询和搜索引擎索引生成的结果页面。影响SERP的因素有很多,从用户的位置到网站的速度。
5.搜索引擎排名 搜索引擎排名描述了一个页面在搜索结果中的排名,比如“espresso machine maintenance”。
6.搜索意图 搜索意图描述了搜索背后的动机。例如,搜索“咖啡机维修”的人可能想在购买前学习如何保养他们的机器或者保养机器需要什么。

让搜索引擎为您的业务与专业的搜索引擎优化服务

搜索引擎每天都在帮助人们找到他们需要的东西,无论是一个新的咖啡机、一个水管工,还是为他们的企业提供服务的提供者。当你投资于SEO(为搜索引擎和用户优化你的网站)时,你让搜索引擎为你的公司工作。

然而,搜索引擎优化需要时间、技巧和努力,这就是为什么许多中小型企业与搜索引擎公司合作搜索引擎优化机构像WebFX。作为您的合作伙伴,我们将帮助您的公司建立,实施和管理SEO策略,有助于您的底线。

我们已经帮助了我们的客户收入超过30亿美元在过去的五年里。

开始驱动更多的收入为您的业务与SEO通过在线联系我们或打电话给我们888-601-5359)就我们的SEO服务与战略家交谈,服务范围从国家搜索引擎优化当地的搜索引擎优化电子商务搜索引擎优化

最重要的