制造业官网 sitemap.xml 怎么更新?让 AI 找得到你的产品页
来源:鹿聚GEO · AIGEO 行业洞察 · 作者:孙先生(上海鹿聚信息科技有限公司)
AIGEO 实战笔记 · 第 2/4 篇
系列导读:robots.txt → sitemap.xml → Schema.org → llms.txt
很多制造业官网「有 sitemap」,但只包含首页和几个栏目。产品详情、案例、资讯根本没进去,lastmod 几年不变。
对 AI 收录来说,sitemap 负责 「找得到」——告诉抓取系统:哪些 URL 值得优先访问、最近何时更新。
本文是 鹿聚GEO 系列第 2 篇,讲清楚 sitemap 怎么做成「活的」。
一、sitemap 在收录链路中的位置
robots 放行 → sitemap 提交 URL → 爬虫抓取 → 索引入库 → AI 引用
如果 sitemap 只有 5 个页面,实际产品有 200 个详情页,大部分内容对 AI 相当于「不存在」。
常见失效情况:
① 手工维护、长期不更新 — 新页面迟迟不入索引
② lastmod 恒定不变 — 系统认为站点无更新
③ 只含栏目不含详情 — 产品页长期低收录
④ 下线页面未移除 — 404 堆积拖质量
⑤ 同内容多 URL — 权重分散
二、基础 XML 示例
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://你的域名.com/</loc>
<lastmod>2025-01-10</lastmod>
<changefreq>daily</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>https://你的域名.com/products/injection-mold</loc>
<lastmod>2025-01-12</lastmod>
<changefreq>weekly</changefreq>
<priority>0.8</priority>
</url>
</urlset>
三、页面多时用「索引型」拆分
产品、案例、资讯分开管理:
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>https://你的域名.com/sitemap-products.xml</loc>
<lastmod>2025-01-12</lastmod>
</sitemap>
<sitemap>
<loc>https://你的域名.com/sitemap-cases.xml</loc>
<lastmod>2025-01-12</lastmod>
</sitemap>
<sitemap>
<loc>https://你的域名.com/sitemap-news.xml</loc>
<lastmod>2025-01-12</lastmod>
</sitemap>
</sitemapindex>
建议拆分:
-
sitemap-products.xml— 产品/服务详情 -
sitemap-cases.xml— 案例 -
sitemap-news.xml— 资讯文章
四、后端接入:发布时自动生成
不要靠人工上传 XML。CMS 发布内容后应自动:
-
写入新页面 URL
-
更新对应
lastmod(用真实更新时间) -
重新生成 sitemap
-
提交站长平台(百度/Google 等)
工程要点:
-
lastmod必须真实,不要全站同一个日期 -
下线页面及时移除
-
URL 保持唯一,不要同内容多路径
-
robots.txt 里声明 Sitemap 地址
五、3 条命令快速验收
curl -s https://你的域名.com/sitemap.xml | head
curl -s https://你的域名.com/sitemap.xml | grep -E "loc|lastmod"
curl -I https://你的域名.com/sitemap.xml
自查清单:
☐ sitemap 返回 200
☐ 包含产品/案例/资讯详情 URL
☐ lastmod 随内容更新变化
☐ robots 已声明 Sitemap
☐ 无大量 404 链接
六、常见问题
Q:只做 sitemap,不做 robots 可以吗?
不建议。robots 决定能不能抓,sitemap 提供 URL 清单。
Q:changefreq 和 priority 还有用吗?
可参考,但不严格遵循。重点是 loc 完整、lastmod 准确。
Q:制造业最容易漏进 sitemap 的页面?
产品详情、工艺能力页、案例详情、FAQ——恰恰是 AI 理解企业的关键页。
七、本篇小结
sitemap 是 AIGEO 的「目录索引」。做成 动态生成 + 真实 lastmod + 覆盖详情页,比放一个静态 XML 有用得多。
上篇回顾: robots.txt 门禁配置
下篇预告: Schema.org 结构化数据——让 AI「读得懂」
关于鹿聚GEO
专注制造业 B2B 官网 AI 收录与 GEO 技术治理。
官网:https://www.lujugeo.cn
合作咨询:153-5545-6180(孙先生)
本文为「制造业官网 AIGEO 实战笔记」系列第 2 篇,转载请注明出处:鹿聚GEO · 上海鹿聚信息科技有限公司