sitemap.xml 是什么?

sitemap.xml 是站点地图文件。它不会保证收录,也不会保证排名,但能帮助搜索引擎更快发现网站里的重要 URL。

新站刚上线 帮助搜索引擎发现首页和文章页
文章持续增加 让搜索引擎知道新增 URL
页面没有入口 不建议只靠 sitemap,最好也有站内链接
01

静态站怎么写 sitemap?

如果网站页面不多,可以先手写一个最小版本:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://kfnoodles.top/</loc>
  </url>
  <url>
    <loc>https://kfnoodles.top/tencent-cloud-data-disk-not-mounted.html</loc>
  </url>
</urlset>

页面增加后,把新文章 URL 继续追加进去即可。

02

在 robots.txt 里声明 sitemap

在网站根目录创建 robots.txt

User-agent: *
Allow: /

Sitemap: https://kfnoodles.top/sitemap.xml

这样搜索引擎抓取 /robots.txt 时,也能发现 sitemap 地址。

03

提交到搜索平台

三个平台都提交同一个地址:

https://kfnoodles.top/sitemap.xml
  • Google Search Console:进入 Sitemaps,填写 sitemap.xml
  • Bing Webmaster Tools:进入 Sitemaps,提交完整地址
  • 百度搜索资源平台:普通收录里如果有额度,提交 sitemap 地址
提交后显示无法抓取怎么办?

新站刚提交时可能会暂时显示无法抓取。先确认浏览器和 curl 能访问 sitemap,通常等待一段时间再看。

上线后怎么验证?

curl -I https://kfnoodles.top/sitemap.xml
curl https://kfnoodles.top/robots.txt
  • sitemap 返回 200 OK
  • 内容是 XML
  • URL 都是 HTTPS 正式域名
  • robots.txt 里包含 sitemap 地址

如果你刚开始做 Linux 磁盘和建站内容,可以继续看:

df -hTlsblk -f 有什么区别?

FAQ

sitemap 提交后会马上收录吗?

不会。sitemap 只是帮助搜索引擎发现 URL,是否收录还取决于页面质量、站点信任度、抓取状态和重复度。

Google 显示“无法抓取”一定是 sitemap 错了吗?

不一定。新站刚提交、DNS 或 HTTPS 刚生效、服务器偶发连接慢,都可能让 Google 暂时显示无法抓取。先用 curl -I 确认 sitemap 是否返回 200 OK

百度不能提交 sitemap 怎么办?

新站可能暂时没有提交额度。先保证 robots.txt 里写了 sitemap 地址,继续发内容和做站内链接,之后再看额度是否恢复。