# Googlebot

> Googlebot est le robot d'exploration (crawler) officiel de Google qui parcourt le web pour découvrir, lire et collecter les pages destinées à l'index du moteur de recherche. Concrètement, Googlebot suit les liens, télécharge le code HTML, exécute le JavaScript via un moteur de rendu basé sur Chromium, puis transmet le contenu au système d'indexation de Google. Il existe deux variantes principales : Googlebot Smartphone, devenu l'agent par défaut depuis le mobile-first indexing, et Googlebot Desktop, utilisé de façon résiduelle. Googlebot respecte les directives du fichier robots.txt, les balises meta robots et les en-têtes HTTP qui autorisent ou bloquent l'exploration. Son activité est encadrée par un budget d'exploration (crawl budget) qui limite le nombre de pages visitées selon la taille, la santé technique et la popularité d'un site. Maîtriser le comportement de Googlebot est la première étape de toute stratégie SEO : une page jamais explorée ne peut jamais être indexée ni positionnée.

[source]: https://luwiz.io/glossaire/googlebot

---

## Comment fonctionne Googlebot

Googlebot opère en deux temps. Lors de l'exploration, il récupère une liste d'URL à visiter, télécharge le code source de chaque page et en extrait les liens pour alimenter sa file d'attente. Vient ensuite la phase de rendu : Googlebot exécute le JavaScript dans un navigateur Chromium sans interface, afin de voir la page telle qu'un utilisateur la verrait. Le contenu obtenu est alors transmis à l'indexation.

Cette double étape explique pourquoi les sites lourds en JavaScript peuvent connaître des délais d'indexation : le rendu est plus coûteux en ressources que la simple lecture du HTML. C'est l'un des enjeux centraux du [javascript-seo](/glossaire/javascript-seo).

<Callout label="A retenir">Une page que Googlebot n'explore pas n'existe pas pour Google. L'explorabilité précède toujours l'indexation et le positionnement.</Callout>

## Pourquoi Googlebot est central en SEO

Tout le SEO technique consiste à faciliter le travail de Googlebot. Un site rapide, une architecture claire, un [maillage-interne](/glossaire/maillage-interne) solide et un [sitemap-xml](/glossaire/sitemap-xml) à jour aident le robot à découvrir et prioriser vos pages importantes.

À l'inverse, des redirections en cascade, du contenu dupliqué ou des pages orphelines gaspillent votre budget d'exploration. Sur les grands sites, optimiser le [crawl-budget](/glossaire/crawl-budget) devient déterminant : il s'agit de concentrer l'attention de Googlebot sur les URL qui génèrent réellement du trafic et des conversions.

## Exemple concret

Imaginez un site e-commerce de 50 000 pages dont 30 000 sont des filtres à facettes générant des URL quasi identiques. Googlebot va épuiser son budget sur ces variantes sans valeur, au détriment des fiches produits. En bloquant ces paramètres via robots.txt et en consolidant via des balises canonical, on redirige l'effort du robot vers les pages stratégiques. Le résultat : une indexation plus rapide des nouveautés et une meilleure couverture dans la Search Console.

Chez LUWIZ, nous auditons systématiquement les logs serveur pour observer le comportement réel de Googlebot avant toute recommandation.
