SEOTool
Tất cả công cụ
🗺️

Export Sitemap

Paste XML sitemap để phân tích, lọc và xuất danh sách URL ra file CSV.

Về công cụ Export Sitemap

Sitemap.xml là file XML chứa danh sách URL Google nên crawl. Hầu hết site có sitemap ở `/sitemap.xml` hoặc `/sitemap_index.xml`. Parse thủ công tốn thời gian vì XML khó đọc trực tiếp.

Tool dùng browser fetch API + DOMParser để lấy XML, parse từng `<url>` element, extract `<loc>`, `<lastmod>`, `<priority>`. Hỗ trợ cả sitemap index (nested sitemap) tự động resolve đến sitemap con. Output CSV để import Excel/Google Sheets.

  • Parse sitemap.xml bất kỳ domain
  • Hỗ trợ sitemap index (nested)
  • Extract loc + lastmod + priority
  • Export CSV cho Excel/Sheets
  • Filter URL chứa keyword
  • Không giới hạn số URL

Cách export sitemap

  1. 1

    Tìm URL sitemap.xml

    Thường ở `domain.com/sitemap.xml` hoặc `/sitemap_index.xml`. Check `/robots.txt` để xác định chính xác.

  2. 2

    Paste URL vào tool

    Ví dụ: `https://phanmemtonghop.com/sitemap.xml`. Bấm 'Lấy danh sách'.

  3. 3

    Xem bảng URL

    Danh sách hiện ra với loc + lastmod. Sort theo lastmod để thấy URL mới cập nhật.

  4. 4

    Filter nếu cần

    Nhập keyword để filter URL chứa từ đó. Ví dụ filter '/blog' để chỉ lấy blog posts.

  5. 5

    Export CSV

    Bấm download → file .csv. Mở bằng Excel/Google Sheets để phân tích.

Khi nào dùng Export Sitemap?

Audit site trước khi migrate

Export toàn bộ URL cũ để đảm bảo không URL nào bị lost khi chuyển domain/framework.

Research đối thủ

Export sitemap đối thủ để xem họ có bao nhiêu bài viết, chủ đề nào được cập nhật thường xuyên.

Tạo redirect map

Export sitemap cũ + sitemap mới, match URL để tạo 301 redirect rules trong nginx/middleware.

Internal link audit

Có danh sách URL để check bài nào chưa có internal link trỏ đến.

Câu hỏi về Export Sitemap

Tool xuất được sitemap có bao nhiêu URL?

+
Không giới hạn — kể cả sitemap 50,000 URL (max chuẩn Google). Browser DOMParser handle được.

Có cần login/đăng ký không?

+
Không. Public sitemap fetch được. Nếu sitemap bị protect bằng auth, tool không bypass được.

CORS policy có chặn không?

+
Sitemap.xml chuẩn phải cho phép public access. Nếu server trả CORS error, site đó config sai — thường không block.

Lastmod có chính xác không?

+
Tùy site. WordPress tự động update lastmod khi publish/edit. Site tự build có thể để default = build time.