Sitemap 怎么提交:新站收录入口的基础配置
讲清 sitemap.xml 应该放哪些 URL、怎么检查质量、如何提交给搜索平台,以及常见错误怎么避免。
直接答案:Sitemap 的作用不是让页面保证收录,而是给搜索引擎一个清晰的 URL 发现入口。新站应该只把可访问、可索引、canonical 正确、有实际内容价值的页面放进 sitemap,再通过站长平台提交并定期检查错误。
目标读者与搜索意图:本文适合刚上线网站、博客或工具站的站长。搜索意图是“sitemap 怎么生成、哪些 URL 能放、提交后怎么验证”。
Sitemap 提交流程图
flowchart TD
A[整理公开 URL] --> B{是否 200 且 canonical 正确}
B -->|否| C[先修状态码/重定向/canonical]
B -->|是| D{是否允许索引}
D -->|否| E[不要放入 sitemap]
D -->|是| F[生成 sitemap.xml]
F --> G[放到站点根目录]
G --> H[在 robots.txt 里声明]
H --> I[提交站长平台]
I --> J[定期检查错误和新增 URL]
哪些 URL 应该放进 sitemap?
首页、栏目页、重要工具页、正式文章页、产品页、服务页。
标签页、分页、筛选页,只有在它们有独立搜索价值时才放。
404、重定向 URL、noindex 页面、登录页、后台页、重复参数页。
状态码、canonical、robots、页面正文是否可见、最后更新时间是否可信。
提交前检查清单
- sitemap.xml 能公开访问,并返回 200。
- XML 格式合法,没有多余 HTML、报错文本或乱码。
- URL 使用正式域名和 https。
- 每个 URL 都是 canonical 版本。
- 不要把 noindex 或 robots 禁止抓取的 URL 放进去。
- 新增文章发布后,sitemap 能同步出现。
常见错误排查卡
Sitemap 只负责发现,不保证收录;继续检查内容质量、重复度、内链和页面价值。
先剔除参数页、搜索页、低价值标签页,避免把抓取预算浪费在重复页面上。
lastmod 只在内容实质变化时更新,不要每天自动刷新所有 URL。
如果 robots 禁止抓取,却又放进 sitemap,会给搜索系统混乱信号。
空白记录模板
[填写 Google Search Console / Bing Webmaster Tools / 其他]
[填写真实 sitemap 地址]
[填写实际报错,没有就写无]
[填写修复 URL、移除页面或补内链]
本文适合与配套工具
- 本文适合:需要给新站配置抓取入口、整理 URL 清单、排查 sitemap 错误的站长。
- 推荐工具:Sitemap 生成器用于整理 XML;Robots.txt 生成器用于声明 sitemap;Robots 规则测试器用于检查 sitemap 中的 URL 是否被误封。
内部链接建议
- 遇到收录问题时阅读 页面不收录怎么查。
- 新手可先看 SEO 入门前 30 天怎么做。
- 技术排查可继续看 技术 SEO 体检清单。
FAQ
提交 sitemap 后多久会收录?
没有固定时间,也不能保证收录。提交只是帮助搜索引擎发现 URL,是否收录还取决于页面质量、重复度、抓取状态和站点信号。
所有页面都要放进 sitemap 吗?
不要。只放公开、可索引、canonical 正确、有价值的页面,低价值参数页和重复页应该排除。
lastmod 可以每天自动更新吗?
不建议。lastmod 应反映内容实质更新时间,乱更新会降低信号可信度。
SEO 与 Schema 建议
- Meta title:Sitemap 怎么提交?新站收录入口配置清单
- Meta description:学习 sitemap.xml 应该放哪些 URL、如何提交、怎么检查 robots 与 canonical 冲突,以及新站常见 sitemap 错误。
- Schema:Article + BreadcrumbList + FAQPage;不要承诺提交后保证收录。
图文模块:Sitemap 提交流程图
60 秒短视频分镜:把本文讲成一条视频
说明 sitemap 不保证收录。
展示哪些 URL 能放。
演示 robots 里声明 sitemap。
提醒定期检查错误,引导读者打开配套工具或保存清单。