返回博客列表
技术进阶

技术 SEO 体检清单:抓取、索引、页面质量一次查清

这是一份给站长、运营和内容团队使用的技术 SEO 体检流程:先判断页面能不能被抓取和索引,再检查 canonical、Sitemap、Robots、结构化数据、内链和页面质量,最后按影响范围安排修复优先级。

技术 SEO 体检不是为了把工具报告里的红色提示全部清零,而是回答三个更关键的问题:搜索引擎能不能发现这个页面?能不能正确理解这个页面?出现问题时,应该先修哪一类?

如果你只看分数,很容易把时间花在低影响的小问题上;如果按“抓取 → 索引 → 理解 → 体验 → 修复优先级”的顺序查,通常能更快找到真正影响收录和排名的瓶颈。

1. 抓取入口

页面是否能被访问、链接是否能被发现、服务器是否稳定返回 200。

2. 索引资格

robots、noindex、canonical、重定向是否让页面失去被索引资格。

3. 页面理解

标题、H1/H2、正文、结构化数据是否表达同一个搜索意图。

4. 质量信号

内容厚度、内链、图片 alt、移动端体验是否支持用户完成任务。

5. 修复优先级

先修全站模板和阻断索引的问题,再修单页细节和点击率问题。

技术 SEO 审计总流程图

flowchart TD
A[选择页面样本: 首页/栏目/文章/转化页] --> B[抓取: 状态码、robots、资源可访问]
B --> C[索引: noindex、canonical、重定向、sitemap]
C --> D[渲染: HTML 正文、JS 依赖、移动端可读]
D --> E[理解: title、H1/H2、结构化数据、面包屑]
E --> F[质量: 内容深度、图片 alt、内链、性能]
F --> G[证据: GSC/Bing、服务器日志、构建记录]
G --> H[按影响范围和修复成本排序]

七张诊断卡:快速定位问题属于哪一层

抓取

看 200/3xx/4xx/5xx、robots 规则、服务器超时、核心资源是否被拦截。

索引

看 noindex、canonical、重复 URL、sitemap 是否混入不可索引页面。

渲染

看正文是否在 HTML 中可见,移动端是否能读到主内容,JS 失败时是否空白。

结构化数据

只标记页面真实可见内容,检查 Article、Breadcrumb、FAQ 是否一致。

性能

先处理首屏图片、阻塞资源、接口超时和模板级慢查询,不只追工具分数。

内链

检查孤岛页、栏目入口、相关文章、工具页之间是否形成可爬行路径。

日志

用服务器日志确认 Googlebot/Bingbot 是否真的访问过,不用猜测替代证据。

第一步:确认页面能不能被抓取

抓取问题是技术 SEO 里最基础、也最容易被忽略的一层。页面内容再好,如果搜索引擎无法稳定访问,就不会进入后面的索引和排名流程。

  • 核心页面应该返回 200,不要被 404、500、循环重定向或错误的 302 卡住。
  • 首页、栏目页、文章页、产品页要能通过普通链接到达,不要只藏在搜索框、筛选器或登录后页面里。
  • 重要资源不要被错误拦截,例如正文依赖的图片、CSS、JS 和结构化数据脚本。

实操建议:先抽样检查首页、一个栏目页、一篇文章页、一个转化页。如果这四类页面都能正常抓取,再扩展到全站 URL。

第二步:检查索引资格,不要让页面自己退出搜索

很多“为什么不收录”的问题,并不是内容质量不够,而是页面被技术规则排除在索引之外。体检时要优先检查 robots、noindex、canonical 和重定向。

  • Robots:不要误封 /blog/、商品集合页、工具页、专题页等重要目录。
  • Noindex:模板里不要把测试环境、筛选页的 noindex 规则误带到正式页面。
  • Canonical:规范页应指向当前页面自己或真正等价的页面,不要批量指向首页。
  • 重定向:迁站、改版、换 URL 后,要避免长链路、跳转到无关页面或移动端/桌面端互相打架。

可以用 Robots.txt 生成器 先核对规则,再用 技术 SEO 体检工具 快速检查单页的核心信号。

第三步:让搜索引擎看懂页面主题

页面被抓取和索引后,还需要被正确理解。Title、description、H1、H2、正文首段、面包屑和结构化数据,应该共同指向同一个主题,而不是各说各话。

  • Title:写清页面主题和用户收益,例如“技术 SEO 体检清单:抓取、索引、页面质量一次查清”。
  • Description:用 80-140 字概括页面能解决什么问题,不要堆关键词。
  • H1:一个页面保留一个 H1,和 title 保持语义一致。
  • H2/H3:用问题、步骤、清单组织内容,方便搜索引擎和 AI 搜索抽取答案。
  • Schema:文章页、FAQ、面包屑、产品页只添加真实可见的信息,不伪造评分、评论和作者资质。

如果需要结构化数据草稿,可以先打开 Schema 生成器,生成后再交给开发检查字段是否和页面可见内容一致。

第四步:检查正文、内链和图片 alt

技术 SEO 不等于只看 head 标签。对内容站和独立站来说,正文是否真的解决问题、是否有清晰内链、图片是否能被理解,也会影响页面的整体质量。

  • 正文开头是否直接回答用户问题,而不是先写一大段背景铺垫。
  • 页面是否链接到上游概念、同级教程和下一步工具,例如 sitemap、robots、schema 或站内相关专题。
  • 图片 alt 是否描述图片内容;不要把 alt 当作关键词堆放位置。
  • 长文章是否有目录、分段、清单、流程图或卡片,帮助用户快速定位信息。

这一步尤其适合人工复核:工具能发现标签缺失,但很难判断一篇文章是否真的回答了搜索意图。

第五步:按影响范围安排修复顺序

技术 SEO 体检结束后,不要把所有问题平铺成一张待办表。更合理的排序方式是:先看影响范围,再看是否阻断抓取和索引,最后看修复成本。

  1. 最高优先级:全站无法访问、重要目录被 robots 误封、模板批量 noindex、canonical 批量错误。
  2. 高优先级:sitemap 缺失或大量脏 URL、迁站重定向错误、核心页面 title/H1 模板混乱。
  3. 中优先级:重要页面正文薄、内链不足、FAQ/面包屑 Schema 缺失、图片 alt 缺失。
  4. 低优先级:少量非核心页面描述不够好、个别图片命名不规范、轻微 UI 文案问题。

修复优先级矩阵

全站阻断

影响所有核心页面的抓取、索引或渲染问题,立即修复并复查线上 URL。

模板批量

同一模板生成的 title、canonical、Schema、内链问题,先修模板再抽样复查。

重点页面

首页、栏目页、工具页和高价值文章的问题,按业务影响和搜索意图优先处理。

单页细节

少量描述、图片 alt、段落结构问题,可进入内容更新节奏,不抢占阻断问题资源。

一份可以直接照做的体检模板

如果你今天只想快速跑一轮,可以按下面这个顺序执行:

  1. 选 4 类 URL:首页、栏目页、文章页、转化页。
  2. 检查 HTTP 状态码、robots、noindex、canonical。
  3. 检查 title、description、H1、H2 是否表达同一个主题。
  4. 检查 sitemap 是否包含核心 URL,是否混入测试页、重复页和无价值参数页。
  5. 检查正文是否有直接答案、步骤、清单、内链和下一步动作。
  6. 把问题分成“阻断索引 / 模板级 / 页面级 / 体验级”四类,再安排修复。

新站上线后,先把首页、栏目页、文章页、转化页这四类页面跑通。四类页面都正常,再做全站批量扫描,效率会高很多。

上线前检查清单

  • 首页、栏目页、文章页、转化页至少各抽样 1 个 URL,确认返回 200。
  • robots.txt 不误封 /blog/、核心工具页、CSS、JS 和图片资源。
  • sitemap.xml 只包含正式、可索引、自 canonical、返回 200 的 URL。
  • 重要页面有唯一 H1,title、description、H1 和首段表达同一主题。
  • Article、Breadcrumb、FAQ Schema 与页面可见内容一致,不写虚假评分、评论或作者资质。
  • 移动端正文、卡片、代码块和图片不横向溢出。
  • 发布后抽查 /blog、目标文章页、/sitemap.xml/rss.xmlrobots.txt

常见故障排查卡片

页面不收录

先查 noindex、canonical、robots、状态码和 sitemap,再看内容是否重复或薄弱。

抓取频率低

补内链、清理低价值 URL、修复慢响应,确认 sitemap lastmod 不乱刷。

标题被改写

检查 title 是否过长、堆词、与 H1/正文不一致,摘要是否缺少明确承诺。

富结果不显示

先验证 Schema 语法,再确认结构化数据和页面可见内容一致。

迁站掉量

核对 301 映射、canonical、内部链接、sitemap、旧 URL 日志和 404 峰值。

60 秒短视频脚本:技术 SEO 体检怎么跑

  1. 0-10 秒:展示一个“不收录”的页面,提示不要先改标题。
  2. 10-25 秒:切到总流程图:抓取、索引、渲染、理解、质量、证据。
  3. 25-40 秒:用三张卡演示 robots、canonical、sitemap 的排查顺序。
  4. 40-52 秒:展示上线前检查清单,强调先修模板级问题。
  5. 52-60 秒:结尾:记录证据、分优先级、复查线上 URL。

审计记录模板

审计日期:
站点 / 页面:
页面类型:首页 / 栏目 / 文章 / 工具 / 转化页
状态码:
robots 结论:允许 / 禁止 / 规则冲突
索引指令:index / noindex / 响应头异常
canonical:自引用 / 指向其他 URL / 缺失 / 异常
sitemap:存在 / 缺失 / 混入不可索引 URL
渲染:HTML 可见 / JS 后加载 / 移动端异常
结构化数据:Article / Breadcrumb / FAQ / 无
内链入口:顶部导航 / 栏目 / 相关文章 / 孤岛页
日志证据:有抓取 / 无抓取 / 需补日志
优先级:最高 / 高 / 中 / 低
修复负责人:
复查日期:

视觉化诊断卡:技术 SEO 先查哪一层

抓取故障

404、5xx、重定向链、robots 误封:先用体检工具确认页面能否被访问。

索引故障

noindex、canonical 指错、重复页面:再确认页面是否有资格进入索引。

理解故障

标题混乱、正文缺失、Schema 不一致:最后处理机器是否能理解页面主题。

本文适合与配套工具

FAQ

技术 SEO 体检应该先查什么?

先查抓取和索引资格,包括状态码、robots、noindex、canonical 和重定向。因为这些问题会直接影响页面能不能进入搜索引擎索引。

Sitemap 和 robots.txt 哪个更重要?

二者作用不同。Sitemap 帮助搜索引擎发现重要 URL,robots.txt 说明哪些路径可以或不应该抓取。体检时两者都要检查,尤其要避免 robots 误封核心页面。

技术 SEO 体检需要一次扫完整站吗?

不一定。新站或小站可以先抽查首页、栏目页、文章页和转化页四类模板。模板级问题修完后,再扩展到全站批量扫描。

下一步:用工具生成第一版诊断

你可以先用 技术 SEO 体检工具 输入一个页面 URL,拿到第一版检查结果;再用 Sitemap 生成器Robots.txt 生成器 补齐站点基础文件。工具输出不是最终答案,但能帮你快速找到最值得人工复核的地方。

图文模块:技术 SEO 审计全景图

技术 SEO 审计全景图 图解
这张图把本文的关键判断和执行顺序压缩成一页,适合保存为团队检查卡或短视频讲解提纲。

60 秒短视频分镜:把本文讲成一条视频

0-10 秒

展示一个页面为什么不收录。

10-25 秒

逐项扫状态码、canonical、robots。

25-45 秒

切到渲染和 Schema 检查。

45-60 秒

输出上线前检查清单,引导读者打开配套工具或保存清单。