# Sitemap XML

> Le sitemap XML est un fichier au format XML qui liste les URL importantes d'un site web pour aider les moteurs de recherche comme Google à les découvrir, explorer et indexer plus efficacement. Chaque entrée contient l'adresse d'une page et peut inclure des métadonnées optionnelles : date de dernière modification (lastmod), fréquence de mise à jour ou priorité relative. Le sitemap XML ne garantit pas l'indexation, mais il signale aux robots quelles pages méritent d'être visitées, ce qui s'avère décisif pour les sites volumineux, récents ou faiblement maillés. Il complète le fichier robots.txt, où son emplacement est généralement déclaré, et peut être soumis directement via la Google Search Console. Un sitemap peut aussi référencer des images, des vidéos ou des versions linguistiques alternatives (hreflang), et se segmenter en plusieurs fichiers reliés par un index lorsque le site dépasse 50 000 URL ou 50 Mo non compressés.

[source]: https://luwiz.io/glossaire/sitemap-xml

---

Le sitemap XML est l'un des leviers techniques les plus simples et les plus rentables pour améliorer la découverte de vos contenus par les moteurs de recherche. Pourtant, il reste souvent mal configuré ou laissé à l'abandon.

## Comment ça marche

Un sitemap XML est un fichier structuré, généralement nommé `sitemap.xml`, placé à la racine du domaine. Chaque URL y est encapsulée dans une balise `<url>` contenant a minima un `<loc>` (l'adresse de la page). Les balises optionnelles `<lastmod>`, `<changefreq>` et `<priority>` donnent des indices supplémentaires, mais Google n'accorde plus de poids significatif aux deux dernières. La date `lastmod`, en revanche, reste précieuse : elle signale qu'une page a été mise à jour et mérite un nouveau passage du robot.

Vous déclarez votre sitemap dans le fichier [robots.txt](/glossaire/robots-txt) via une ligne `Sitemap:` et le soumettez dans la Google Search Console pour suivre son traitement.

## Pourquoi c'est important

Sur un site de quelques pages, le maillage interne suffit souvent à tout faire découvrir. Mais dès que le volume grandit, le sitemap devient un outil d'orientation du [crawl budget](/glossaire/crawl-budget) : il dirige les robots vers les pages canoniques et utiles, en évitant le gaspillage sur des URL secondaires.

<Callout label="À retenir">Un sitemap propre ne liste que des URL indexables : pages en 200, canoniques, non bloquées par robots.txt. Y laisser des URL en erreur ou redirigées brouille le signal envoyé à Google.</Callout>

## Bonnes pratiques

Maintenez votre sitemap à jour automatiquement à chaque publication, gardez-le exempt d'URL en 404 ou 301, et segmentez-le par type de contenu (pages, articles, produits) si votre site est large. Pour les sites multilingues, intégrez les annotations hreflang directement dans le sitemap afin d'aider Google à servir la bonne version par marché.
