任何曾经在网上查找过任何东西的人都可能想知道搜索引擎是如何发挥其魔力的,以及它们如何始终设法提供我们正在寻找的东西。
搜索引擎在很大程度上决定了网站的成功,因此也决定了整个在线业务的成功。如果您在 搜索引擎结果页面 (SERP) 上不可见(或排名靠后),那么您的网站流量肯定会受到影响。而 较低的流量意味着更少的利润 。
搜索引擎优化是一个完全致力于了解搜索引擎运作方式的领域。这种理解使我们能够改进我们的网站,优化它们的内容,加强它们的技术方面,并提高它们在搜索引擎中的排名。所有这些最终目标都是 在搜索引擎结果页面 (SERP) 上 尽可能高。
因此,至少对搜索引擎是什么以及它们如何工作有一个基本的了解是至关重要的,这正是我们将在本文中介绍的内容。
互联网搜索引擎是专门设计用于 搜索万维网上大量数据的 复杂软件系统。他们通过提供包含我们搜索的特定单词或短语的最相关网站的列表来帮助我们(他们的用户)了解我们需要了解的内容。
对于我们大多数人来说,搜索引擎是基本的网络工具。如果没有它们,我们将不得不记住我们想要访问的每个网站或页面的确切 URL。虽然这对大多数人来说似乎是不可思议的,但实际上曾经有一段时间互联网就是这样运作的。
幸运的是,事情发生了变化。今天,我们已经习惯了搜索引擎的便利,很难想象没有它们的生活。
2022年3月中国搜索引擎市场份额:
1、百度,55.92%
2、必应,17.96%
3、搜狗,14.02%
4、谷歌,7.23%
5、好搜,4.45%
6、神马搜索 1.33%
对于国内大多数人来说,搜索引擎 = 百度。毕竟,它是国内使用最广泛的搜索引擎,而且已经有很长一段时间了。百度在我们的生活中无处不在,它甚至成为了在互联网上搜索东西的动词:“百度一下,你就知道!”
因此,在大多数情况下,当我们谈论搜索引擎时,我们实际上是在谈论百度,而不是 sogou,bing!或者360。更不用说已经退出中国市场的Google。所以,所有 SEO 努力都针对 百度。
现在,这并不是说您不应该关注其他搜索引擎。但对于初学者来说,确保百度排名靠前对您至关重要。
搜索引擎执行三个基本操作:它们对网站进行 爬网、索引和排名 。
您可能听说过人们谈论与搜索引擎相关的蜘蛛、蜘蛛机器人或爬虫。这些奇怪的术语只是搜索引擎用来发现新网站和网页的特殊软件的名称。
爬虫,顾名思义,通过使用超链接从一个网页跳转到另一个网页来抓取网络。一旦他们找到一个新页面,这些勤奋的小机器人就会在数据库中索引它。
当您在搜索某些内容时,搜索引擎会查询其索引页面数据库,并根据您的查询为您提供最相关的内容。这就是排名的全部意义—— 按照与查询相关的顺序显示页面 。
现在让我们仔细看看每个主要的搜索引擎功能:
正如我们之前看到的,抓取是让您的网站显示在 SERP 上的第一步。自然,您希望排名尽可能高,稍后我们将看看您如何实现这一目标。但是现在,让我们看看如何确保爬虫真正看到您的页面,将它们抓取并将它们添加到索引中。
虽然抓取是一个自动过程,但网站仅抓取部分(而非全部)页面的情况并不少见。
在 SEO 中,有一个叫做“ 抓取预算 ”的东西。它是指爬虫在离开网站之前抓取的平均页面数。因此,如果您的网站上有 50 个页面,并且抓取预算为 30,您希望确保爬虫抓取所有正确的页面,而不会将时间浪费在不太重要的页面上。
这就是 robots.txt 的用武之地。网站管理员使用这个方便的小文本文件来告诉爬虫要爬取哪些页面以及如何爬取它们。通过使用 允许 和 禁止 指令,网站管理员可以准确定义某些爬虫可以看到哪些页面(或整个文件夹)。
某些类型的 页面绝对不应该被抓取 。例如,您不希望搜索引擎将您网站上的admin页面或包含成员列表或其他敏感数据的任何页面编入索引。在这种情况下,您肯定希望从搜索引擎中隐藏这样的页面或帖子,以免被抓取。爬虫程序应将哪些页面视为“不重要”通常取决于您网站的特定性质和目的。
除了定义明确的 robots.txt 文件外,您还应该 确保您的网站导航和架构能够让爬虫正常工作 。
因此您需要检查:
在搜索引擎爬虫发现您的网页后,就该编制索引了。这基本上意味着 所有抓取的页面(连同它们的所有信息)都将存储在一个庞大的数据库 中,以后可以从中检索它们并显示为搜索结果。
请务必注意,仅让搜索引擎索引您的网页一次是不够的。您的页面也需要定期重新索引。这是因为您很可能会向您的网站添加新页面,或更新现有页面的内容。这些变化也需要被抓取和索引,这就是为什么 你需要爬虫经常访问(和索引)你的网站 。
大型、完善的网站经常被索引,但全新的网站有时需要等待一段时间才能让爬虫回来。
影响网站被索引的速度和频率的一些因素包括:
还值得一提的是,有时可以从索引中删除页面。
发生这种情况的原因之一是:
如果您希望在删除页面后重新索引,您可以手动将其提交给搜索引擎,稍后会详细介绍。
类似于我们之前讨论的关于抓取的指令(允许和禁止),您可以使用 robots.txt 元指令 告诉搜索引擎如何索引您的页面 :
正如我们之前提到的,如果您觉得百度对您的网页的索引速度不够快,您可以 手动提交您的网页和内容以进行索引 。
百度为此提供了一个工具,称为百度搜索资源平台。您可以使用此工具要求百度返回并重新抓取您的所有页面,以防您添加了一些您希望尽快被抓取的新内容。
搜索引擎排名表示 URL 在 SERP 上的位置 。显然,位置越高越好,因为用户更有可能点击首页上排名靠前的链接。
在百度的第一页上获得高位是每个网站的最终目标,但说起来容易做起来难。
在我们研究影响排名的一些因素之前,让我们首先看看搜索引擎是如何知道哪些结果与搜索者的查询相关的。
搜索引擎使用 算法 来确定网站在排名中的相关性和位置。可以这么说,根据页面受欢迎程度对页面进行排名 最早是在 1990 年代后期设计的,当时谷歌的联合创始人拉里·佩奇和谢尔盖·布林提出了PageRank,这是一个根据指向的链接数量确定页面价值的公式给它。
PageRank 作为一种工具最终被放弃了。
在 SEO 动态和复杂的环境中,很难确定哪些特定因素可以保证 SERP 的高位置。
这意味着您不能只做一次性的 SEO 工作并收工。您需要按照百度想要的方式返回、调整、修复和改进。
它们大致可以分为 页内因素 和 页外因素 。顾名思义,页面因素是与您正在优化的特定页面相关的 SEO 因素。由于所有页面因素都在您的网站上,因此您可以完全控制它们。另一方面,页外因素是其他网站上存在但会影响您网站页面排名的因素。
让我们仔细看看这两个类别。
用户参与度是提高网站搜索引擎排名的一个特别重要的因素。
它代表您网站的 用户行为。 您的访问者在寻找什么,他们停留了多长时间,他们跳过了哪些页面,他们点击了哪些页面,他们立即离开了哪些页面——所有这些指标都应该被考虑在内。
基本上,您想知道 访问者如何与您的网站互动, 然后尽一切可能改善他们的体验。更好的用户体验意味着更好的用户参与度,而这反过来又反映了更好的排名。这对于获得大量流量但没有转化的网站尤其重要。
某些因素对排名有直接影响:
此外,您应该密切关注某些 参与度指标:
当然,这些只是有助于搜索引擎排名的一些参与因素和指标。这是一个非常复杂的 SEO 领域,需要特别注意,并将在以后的文章中更深入地介绍。
我们已经提到搜索引擎, 尤其是百度,使用极其复杂的排名算法 。而且这些算法更新非常频繁。其中大部分是对算法的微小修改,因此对网站管理员来说几乎没有问题。但有时,在了解搜索引擎的工作原理以及他们想从我们这里得到什么时,百度会推出重大更新,这些更新会严重改变游戏规则。
这些是您应该了解的最重要的算法更新:
搜索算法是保障搜索安全与内容质量的重要防线。百度搜索资源平台也将搜索算法进行梳理及更新,汇编为《百度搜索算法规范详解》,系统化地阐明了搜索优化过程中不允许发生的违规问题、需规避的运营“雷点”,助力开发者更好地提升自身资源质量。
既然我们已经详细介绍了搜索引擎的大部分基本功能以及它们的工作方式,您应该对如何优化您的网站以使其表现良好并排名靠前有了更清晰的认识。
请记住这些简单的规则:
1、并非所有搜索引擎都是相同的。
2、首先针对百度进行优化,但不要忘记其余部分。
3、密切关注重要的算法更新。
4、保持警惕,永不停止优化。
祝你好运!
评论留言