返回博客列表
基础上手

Sitemap 怎么提交:新站收录入口的基础配置

讲清 sitemap.xml 应该放哪些 URL、怎么检查质量、如何提交给搜索平台,以及常见错误怎么避免。

直接答案:Sitemap 的作用不是让页面保证收录,而是给搜索引擎一个清晰的 URL 发现入口。新站应该只把可访问、可索引、canonical 正确、有实际内容价值的页面放进 sitemap,再通过站长平台提交并定期检查错误。

目标读者与搜索意图:本文适合刚上线网站、博客或工具站的站长。搜索意图是“sitemap 怎么生成、哪些 URL 能放、提交后怎么验证”。

Sitemap 提交流程图

flowchart TD
A[整理公开 URL] --> B{是否 200 且 canonical 正确}
B -->|否| C[先修状态码/重定向/canonical]
B -->|是| D{是否允许索引}
D -->|否| E[不要放入 sitemap]
D -->|是| F[生成 sitemap.xml]
F --> G[放到站点根目录]
G --> H[在 robots.txt 里声明]
H --> I[提交站长平台]
I --> J[定期检查错误和新增 URL]

哪些 URL 应该放进 sitemap?

应该放

首页、栏目页、重要工具页、正式文章页、产品页、服务页。

谨慎放

标签页、分页、筛选页,只有在它们有独立搜索价值时才放。

不要放

404、重定向 URL、noindex 页面、登录页、后台页、重复参数页。

必须检查

状态码、canonical、robots、页面正文是否可见、最后更新时间是否可信。

提交前检查清单

  • sitemap.xml 能公开访问,并返回 200。
  • XML 格式合法,没有多余 HTML、报错文本或乱码。
  • URL 使用正式域名和 https。
  • 每个 URL 都是 canonical 版本。
  • 不要把 noindex 或 robots 禁止抓取的 URL 放进去。
  • 新增文章发布后,sitemap 能同步出现。

常见错误排查卡

提交成功但不收录

Sitemap 只负责发现,不保证收录;继续检查内容质量、重复度、内链和页面价值。

URL 数量很多

先剔除参数页、搜索页、低价值标签页,避免把抓取预算浪费在重复页面上。

更新时间乱跳

lastmod 只在内容实质变化时更新,不要每天自动刷新所有 URL。

robots 冲突

如果 robots 禁止抓取,却又放进 sitemap,会给搜索系统混乱信号。

空白记录模板

提交平台

[填写 Google Search Console / Bing Webmaster Tools / 其他]

Sitemap URL

[填写真实 sitemap 地址]

发现错误

[填写实际报错,没有就写无]

处理动作

[填写修复 URL、移除页面或补内链]

本文适合与配套工具

内部链接建议

FAQ

提交 sitemap 后多久会收录?

没有固定时间,也不能保证收录。提交只是帮助搜索引擎发现 URL,是否收录还取决于页面质量、重复度、抓取状态和站点信号。

所有页面都要放进 sitemap 吗?

不要。只放公开、可索引、canonical 正确、有价值的页面,低价值参数页和重复页应该排除。

lastmod 可以每天自动更新吗?

不建议。lastmod 应反映内容实质更新时间,乱更新会降低信号可信度。

SEO 与 Schema 建议

  • Meta title:Sitemap 怎么提交?新站收录入口配置清单
  • Meta description:学习 sitemap.xml 应该放哪些 URL、如何提交、怎么检查 robots 与 canonical 冲突,以及新站常见 sitemap 错误。
  • Schema:Article + BreadcrumbList + FAQPage;不要承诺提交后保证收录。

图文模块:Sitemap 提交流程图

Sitemap 提交流程图 图解
这张图把本文的关键判断和执行顺序压缩成一页,适合保存为团队检查卡或短视频讲解提纲。

60 秒短视频分镜:把本文讲成一条视频

0-10 秒

说明 sitemap 不保证收录。

10-25 秒

展示哪些 URL 能放。

25-45 秒

演示 robots 里声明 sitemap。

45-60 秒

提醒定期检查错误,引导读者打开配套工具或保存清单。