如果您希望您的内容显示在搜索结果中,您必须记住抓取。谷歌索引列出了机器人访问过的所有网站。在浏览您的页面时,Google 会检测任何新的或更改的内容并更新索引。如何在 Google 中抓取网站?继续阅读以发现 7 个简单的方法!
抓取是将新网站整合到 Google 搜索引擎索引中的过程。在这个过程中,一切都由应用的标签决定,即:
- 指数
- 无索引
在谈到第一个标签时,Google 机器人(也称为蜘蛛机器人、网络爬虫或网络漫游者)会访问您的网站,检查源代码,然后将其编入索引。
另一方面,no-index 标签意味着该页面不包含在网络搜索索引中,因此,它不会在搜索结果中显示给用户。
所以,实际上,可以说,当你浏览网络时,你实际上是在浏览索引,也就是谷歌的数据库。
在索引网站之前,谷歌机器人会分析各种因素。它们会考虑关键字、内容、正确的源代码或标题以及 alt 属性等元素。
如何检查您的网站是否被索引?
要检查特定链接(例如个人资料)的索引状态,只需将其输入搜索引擎即可。如果它显示在搜索结果中,则表示您的网站已被编入索引。
如果您想检查整个网站或博客的索引以及新索引子页面的数量,只需输入以下命令:
“网站:http://websitename.com”
网站索引
有几种方法可以 让 Google 抓取网站。您需要做的第一件事是检查 robots.txt 文件是否允许 Google 机器人正确索引您的网页。
Robots.txt 是一个文件,负责与为您的网站编制索引的机器人进行通信。该文件是谷歌机器人在进入页面后首先检查的内容,它可用于向他们展示如何为您的网站编制索引。
想知道如何让 Google 抓取您的网站?让我们深入了解细节!
如何让谷歌抓取我的网站?
1. 将网站添加到 Google Search Console
这是为您的网站编制索引的最快捷、最简单的方法 – 只需几分钟。在此之后,您的网站将在 Google 上可见。只需将您的网站地址粘贴到 Google Search Console 的索引框中,然后单击请求索引。
2. 使用 XML 映射
XML 地图专为 Google 机器人设计。由于它极大地促进了网站索引,因此每个网站都应该拥有它。XML 映射是有关 URL 地址、子页面及其更新的所有信息的数据库。
一旦您设法生成您网站的 XML 地图,您应该将其添加到 Google 搜索引擎。多亏了它,谷歌机器人将知道在哪里可以找到特定的站点地图及其数据。
使用 Google Search Console 将您的 XML 地图发送给 Google。处理完地图后,您将能够显示有关您网站的统计信息以及有关错误的各种有用信息。
3. 使用 PDF 文件
PDF 中的文本越来越频繁地发布在各种网站上。如果文本采用这种格式,Google 可能会处理图像以提取文本。
搜索引擎机器人如何处理 PDF 文件中的链接?与网站上的其他链接完全相同,因为它们同时提供 PageRank 和其他索引信号。但是,请记住不要在 PDF 文件中包含禁止关注链接。
为了检查 PDF 文件的索引,您需要在 Google 中输入带有“PDF”的给定短语。
PDF 只是 Google 可以索引的多种文件类型之一。如果您想了解更多信息,请访问:https://support.google.com/webmasters/answer/35287?hl=en
4. 使用在线工具
这是一种基本且非常简单的索引形式。
有多种工具可以做到这一点,但是,其中大多数是付费的或具有有限的免费版本。使用在线工具进行索引很重要,尤其是在谈论您无权访问的链接和页面时。通过索引它们,谷歌机器人能够自由地抓取它们。
您可以使用以下在线索引工具之一:
- http://www.linkcentaur.com
- https://black-star.link/
- http://www.instantlinkindexer.com/
- http://www.indexification.com/
5.链接建设
内部和外部 dofollow 链接都是非常重要的工具,您可以使用它来引导 Google 机器人并鼓励它们访问(并因此索引)特定的子页面。
当您提供指向产品或服务类别、博客文章和其他重要元素的内部链接时,爬取您页面的机器人会看到它们并将它们编入索引。
阅读有关成功内部链接的最佳实践的更多信息。
这同样适用于 dofollow 外部链接。如果其他网站链接到您,则表明 Google 应该访问您的页面。此外,质量反向链接对重要参数(如 PA(页面权限)和 DA(域权限))有积极影响,这些参数会影响 SERP 中的位置,并向搜索引擎显示您的页面质量高。
获取免费的 SEO 页面清单并检查您的网站是否对 SEO 和 Google 友好!使用网络上最好的交互式工具提高您的知名度!
6. 通过社交媒体股票进行索引
尽管 nofollow 社交媒体链接不会直接影响网站在搜索结果中的排名,但它们可以帮助您提高品牌知名度,让您通过各种渠道分发内容,提高在线知名度,并向 Google 机器人展示您的帖子有用并受到用户的赞赏。
2017 年,谷歌的 Gary Illyes 表示:
您在线参与的环境,以及人们如何在网上谈论您,实际上会影响您的排名。
因此,社交媒体链接可以支持 SEO 和索引。
7.从索引中排除低质量页面
确保将您网站的重要子页面编入索引与确保 Google 机器人不会分析常见、宝贵的网站元素一样重要。
如果您想节省抓取预算(我们将在下面详细讨论),您可以使用 noindex 标签和 nofollow 链接来阻止 Google 机器人抓取给定的子页面。
在谈论以下内容时使用 noindex 标签和 nofollow 链接是个好主意:
- 带有条款和条件的子页面,
- 带有隐私政策的子页面,
- 购物车,
- 外部链接,
- 社交媒体链接。
抓取预算
抓取预算是索引您的网站的资源。
更具体地说,抓取预算是在一次访问您的网站期间被 Google 机器人编入索引的页面数。预算取决于您网站的大小、状况、Google 遇到的错误,当然还有指向您网站的反向链接的数量。
机器人每天索引数十亿个子页面,因此每次访问该网站都会给所有者和 Google 的一些服务器带来负担。
有两个参数对爬网预算的影响最为显着:
- 抓取速率限制– 索引因子的限制
- 抓取需求——网站被索引的频率
抓取速度限制是已设置的限制,以便 Google 在给定时间内不会抓取太多页面。它应该防止网站超载,因为它可以避免谷歌发送过多的请求,这会减慢网站的速度和加载时间。
但是,抓取速度限制也可能取决于网站本身的速度——如果速度太慢,那么整个过程也会变慢。在这种情况下,Google 只能检查您的几个子页面。抓取速度限制也受 Google Search Console 中设置的限制的影响。网站所有者可以通过面板更改限制值。
在优化您的抓取预算方面需要帮助?检查我们的技术 SEO 服务!我们将确保一切顺利。
抓取需求是关于技术限制的。如果该网站对其潜在用户有价值,谷歌机器人就更愿意访问它。即使您的网站的抓取速度限制较高,您的网站也有可能不会被编入索引。这可能是由于两个因素造成的:
- 受欢迎程度——谷歌机器人经常访问用户非常喜欢的网站。
- 最新的话题性——谷歌算法检查网站的更新频率。
如何在 Google 中抓取网站 – 要点
有很多方法可以让 Google 抓取您的网站。最受欢迎的包括:
- 使用 Google Search Console 进行网站索引,
- XML 地图,
- 网站索引与 PDF 文件,
- 使用在线工具进行网站索引,
- 使用 XML 地图进行网站索引,
- 网站索引与链接建设。
在索引您的网站时,您需要考虑几个因素,这些因素将使您更容易获得最佳结果。这些因素包括:
- 元标签,
- robots.txt 文件,
- 抓取预算。
确保您的网站被 Google 定期抓取 – 如果您向网站添加新元素或更新旧元素,Google 看到它很重要。如果没有正确抓取和索引的网站,如果 Google 不知道,再多的优秀内容或 SEO 努力都不会奏效。
这是2019年发表的一篇文章的更新。