sitemap.xml 是什么?
sitemap.xml 是站点地图文件。它不会保证收录,也不会保证排名,但能帮助搜索引擎更快发现网站里的重要 URL。
新站刚上线
帮助搜索引擎发现首页和文章页
文章持续增加
让搜索引擎知道新增 URL
页面没有入口
不建议只靠 sitemap,最好也有站内链接
静态站怎么写 sitemap?
如果网站页面不多,可以先手写一个最小版本:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://kfnoodles.top/</loc>
</url>
<url>
<loc>https://kfnoodles.top/tencent-cloud-data-disk-not-mounted.html</loc>
</url>
</urlset>
页面增加后,把新文章 URL 继续追加进去即可。
在 robots.txt 里声明 sitemap
在网站根目录创建 robots.txt:
User-agent: *
Allow: /
Sitemap: https://kfnoodles.top/sitemap.xml
这样搜索引擎抓取 /robots.txt 时,也能发现 sitemap 地址。
提交到搜索平台
三个平台都提交同一个地址:
https://kfnoodles.top/sitemap.xml
- Google Search Console:进入 Sitemaps,填写
sitemap.xml - Bing Webmaster Tools:进入 Sitemaps,提交完整地址
- 百度搜索资源平台:普通收录里如果有额度,提交 sitemap 地址
提交后显示无法抓取怎么办?
新站刚提交时可能会暂时显示无法抓取。先确认浏览器和 curl 能访问 sitemap,通常等待一段时间再看。
上线后怎么验证?
curl -I https://kfnoodles.top/sitemap.xml
curl https://kfnoodles.top/robots.txt
- sitemap 返回
200 OK - 内容是 XML
- URL 都是 HTTPS 正式域名
- robots.txt 里包含 sitemap 地址
如果你刚开始做 Linux 磁盘和建站内容,可以继续看:
FAQ
sitemap 提交后会马上收录吗?
不会。sitemap 只是帮助搜索引擎发现 URL,是否收录还取决于页面质量、站点信任度、抓取状态和重复度。
Google 显示“无法抓取”一定是 sitemap 错了吗?
不一定。新站刚提交、DNS 或 HTTPS 刚生效、服务器偶发连接慢,都可能让 Google 暂时显示无法抓取。先用 curl -I 确认 sitemap 是否返回 200 OK。
百度不能提交 sitemap 怎么办?
新站可能暂时没有提交额度。先保证 robots.txt 里写了 sitemap 地址,继续发内容和做站内链接,之后再看额度是否恢复。