LUWIZ
Glossaire · SEO

Sitemap XML

El sitemap XML es un archivo en formato XML que enumera las URL importantes de un sitio web para ayudar a los motores de búsqueda como Google a descubrirlas, rastrearlas e indexarlas de forma más eficiente. Cada entrada contiene la dirección de una página y puede incluir metadatos opcionales: la fecha de última modificación (lastmod), la frecuencia de actualización o la prioridad relativa. El sitemap XML no garantiza la indexación, pero indica a los rastreadores qué páginas merecen ser visitadas, algo decisivo para sitios extensos, recientes o con poco enlazado interno. Complementa al archivo robots.txt, donde suele declararse su ubicación, y puede enviarse directamente a través de Google Search Console. Un sitemap también puede referenciar imágenes, vídeos o versiones lingüísticas alternativas (hreflang), y dividirse en varios archivos enlazados por un índice cuando el sitio supera las 50.000 URL o los 50 MB sin comprimir.

El sitemap XML es una de las palancas técnicas más sencillas y rentables para mejorar el descubrimiento de sus contenidos por parte de los motores de búsqueda. Sin embargo, suele estar mal configurado o abandonado.

Cómo funciona

Un sitemap XML es un archivo estructurado, generalmente llamado sitemap.xml, ubicado en la raíz del dominio. Cada URL se encapsula en una etiqueta <url> que contiene como mínimo un <loc> (la dirección de la página). Las etiquetas opcionales <lastmod>, <changefreq> y <priority> aportan pistas adicionales, pero Google ya no concede un peso significativo a las dos últimas. La fecha lastmod, en cambio, sigue siendo valiosa: indica que una página se ha actualizado y merece un nuevo paso del rastreador.

Usted declara su sitemap en el archivo robots.txt mediante una línea Sitemap: y lo envía en Google Search Console para seguir su procesamiento.

Por qué es importante

En un sitio pequeño, el enlazado interno suele bastar para que todo se descubra. Pero a medida que crece el volumen, el sitemap se convierte en una herramienta para orientar el crawl budget: dirige a los rastreadores hacia las páginas canónicas y útiles, evitando malgastar esfuerzo en URL secundarias.

Para recordar
Un sitemap limpio solo enumera URL indexables: páginas en 200, canónicas y no bloqueadas por robots.txt. Dejar en él URL con error o redirigidas enturbia la señal enviada a Google.

Buenas prácticas

Mantenga su sitemap actualizado automáticamente en cada publicación, libre de URL en 404 o 301, y segméntelo por tipo de contenido (páginas, artículos, productos) si su sitio es grande. Para sitios multilingües, integre las anotaciones hreflang directamente en el sitemap para ayudar a Google a servir la versión correcta por mercado.

FAQ

Questions fréquentes

No. Google puede descubrir sus páginas mediante los enlaces internos y externos. El sitemap sigue siendo muy recomendable para sitios extensos, recientes o con poco enlazado, ya que acelera el descubrimiento de las URL prioritarias.

Un único archivo sitemap está limitado a 50.000 URL y 50 MB sin comprimir. A partir de ahí, debe crear varios sitemaps enlazados por un archivo índice, que actúa como un sumario que apunta a cada sub-sitemap.

Audit gratuit

Une question sur votre visibilité IA ?

Score de visibilité IA de votre site. Gap analysis vs 3 concurrents directs. 5 optimisations prioritaires. Livré en PDF, sans engagement.

Réponse sous 24h · Sans engagement · contact@luwiz.io