如果我们希望搜索引擎正确抓取和索引我们的网站就需要去使用robots元指令。但如果我们还不熟悉机器人元标记,可能不知道从哪里开始。那下面的内容笔者就和大家一起来了解一下robots元指令来帮助我们实现机器人标签以实现搜索引擎优化(SEO)目的的原因。
什么是robots元指令?
robots元指令,也称为机器人元标记,是一段代码,可为搜索引擎爬虫提供有关如何爬取和索引我们的网站的指导。这些标签对于确保正确的页面被编入索引以出现在搜索结果中至关重要。在继续之前要提到的一个重要区别是robots.txt与robots元指令。看这两者时,它们似乎在做同样的事情并且在某种程度上他们确实如此,但有一个关键的区别。Robots.txt提供了有关如何抓取我们网站上的网页并将其编入索引的建议。它更多的是对搜索引擎如何进行的建议。另一方面,Robots元指令对如何抓取和索引我们的网站的说明更加明确。要知道的两种robots元指令,我们可以在页面上设置两种类型的元指令,用以帮助搜索引擎抓取和索引我们的页面。下面我们来具体介绍一下它们:
1、元机器人标签
我们可以实施的第一种SEO机器人标签是元机器人标签。元机器人标签可让我们控制页面级别的索引行为。我们将此代码实施到我们网站的标题中。代码可以所示:<元名称=“机器人”内容=“[参数]”>使用此标签时,我们可以在标签中实现多个参数,只要它是针对同一个机器人的,这是在网站上编写的代码。
2、X-机器人标签
我们可以创建的第二种robots元指令是x-robots-tag。此标记使我们能够控制页面级别和特定页面元素的索引。我们还可以将此标记实施到我们网站的标题中。此标记的示例所示:标头(“X-Robots-Tag:[参数]”,true);总体而言,x-robots-tag比Meta Robots-tag提供了更多的灵活性。
要知道的11种参数
参数名称
|
描述
|
全部
|
索引的快捷方式,关注
|
跟随
|
爬虫应遵循所有链接并将链接资产传递给页面
|
不关注
|
搜索引擎不应将任何权益传递给链接到的页面
|
指数
|
爬虫应该索引页面
|
无索引
|
爬虫不应索引页面
|
无图像索引
|
爬虫不应索引页面上的任何图像
|
最大片段
|
将最大字符数设置为搜索结果的文本片段
|
没有任何
|
noindex、nofollow的快捷方式
|
无缓存
|
当此页面出现在搜索结果中时,搜索引擎不应显示此页面的缓存链接
|
无片段
|
搜索引擎不应在搜索结果中显示页面的片段(如元描述)
|
Unavailable_after
|
搜索引擎不应在设定日期之后索引页面
|
当我们设置robots元指令时,我们需要在代码中设置参数。这些参数帮助搜索引擎爬虫了解如何爬取和索引页面。这些是我们在实施robots元指令和告诉搜索引擎如何索引我们的网站时使用的参数。
对robots元指令有一些挥之不去的问题吗?下面笔者来解答一些针对robots元指令的一些常见问题。
1、每个搜索引擎都支持所有参数吗?
答:不会。在我们上面列出的11个参数中并非每个搜索引擎都会在索引我们的网站时支持它们。谷歌是唯一能识别所有共享参数的网站。否则,它会因搜索引擎而异。
2、我们需要同时使用Meta Robots标签和x-robots标签吗?
答:不是。使用这两种类型的元标记是多余的。我们可以选择最适合我们网站需求的任何一个。
3、我们可以在第三方网站上实施robots元指令吗?
答:有这么多企业使用WordPress等第三方网站来托管他们的网站,许多人想知道他们是否可以实施机器人元标记。简而言之,是的。许多第三方主机使我们能够实现站点所需的robots元指令。我们如何实施它们则会因站点主机而异,这里我们可能需要进行一些研究,以了解如何在我们选择的网站构建器上为SEO实施机器人标签。
在了解了robots元指令之后,我们可能想知道为什么这个功能很重要。为什么在我们的网站上实现此代码如此重要?我们希望在我们的网站上实施元标记有两个重要原因:
它可以帮助我们控制搜索结果中的排名:实施这些标签可以让我们更好地控制搜索引擎如何抓取和索引我们的页面。它最终允许我们引导搜索引擎正确抓取我们最有价值的页面,以便它们可以排名。
它可以防止价值不大的页面被编入索引:某些页面,如管理页面等对我们的业务排名没有什么价值。通过实施robots元指令,我们可以防止搜索引擎在这些页面上浪费抓取预算。