# RAG (Retrieval-Augmented Generation)

> Le RAG (Retrieval-Augmented Generation) est une technique qui permet à un modèle de langage d'aller chercher des documents pertinents au moment de répondre, puis de générer sa réponse à partir de ces sources. C'est ce mécanisme qui décide quels contenus une IA cite.

[source]: https://luwiz.io/glossaire/rag

---

Le RAG (Retrieval-Augmented Generation) est une technique qui combine deux étapes : d'abord récupérer (retrieval) des documents pertinents dans une base ou sur le web, ensuite générer (generation) une réponse à partir de ces documents. C'est le mécanisme qui permet à une IA comme Perplexity de citer des sources à jour plutôt que de répondre uniquement de mémoire.

## Comment fonctionne le RAG

Quand un utilisateur pose une question, le système transforme cette question en requête, récupère les passages les plus pertinents, puis les fournit au [LLM](/glossaire/llm) comme contexte. Le modèle rédige alors sa réponse en s'appuyant sur ces extraits — et les cite. La qualité de votre contenu et sa structure déterminent s'il franchit l'étape de récupération.

## Un exemple concret

Une IA reçoit la question « comment optimiser pour les AI Overviews ? ». Son moteur RAG va chercher les pages les plus pertinentes, en extrait des passages auto-contenus, et compose sa réponse à partir de ceux qui répondent le plus directement. Un bloc « X est… » de 150 mots a une longueur idéale pour être retenu.

## Pourquoi ça compte

Le RAG est le pont entre votre contenu et la réponse de l'IA. Optimiser pour la récupération, c'est le cœur du [GEO](/glossaire/geo) : passages citables, [schema markup](/glossaire/schema-markup) et [autorité topique](/glossaire/topical-authority). Pour structurer cette démarche, voyez notre [agence GEO](/services/geo).

<Callout label="À retenir">
En RAG, si vous n'êtes pas récupéré, vous n'êtes pas cité. La récupération précède tout.
</Callout>