Le glossaire
Les mots de l'IA, expliqués simplement
LLM, RAG, MCP, token, hallucination, prompt… Le vocabulaire de l'IA générative et des agents, défini en clair et en français, avec des exemples concrets. Une page par terme.
A
C
Chunk
Un morceau de document découpé pour l'indexation en RAG. La recherche sémantique te renvoie les chunks les plus pertinents, jamais le document entier.
Chunking
Découpage d'un long document en morceaux (chunks) indexables. Trop petit = perte de contexte ; trop gros = recherche moins précise.
Citation
Référence [N] qui pointe vers le chunk source d'une affirmation dans la réponse. Permet à l'utilisateur de vérifier (et au verifier de détecter les hallucinations sourcées).
Context window
La quantité maximale de tokens (fragments de texte) que le LLM peut considérer en une fois. Pour donner un ordre de grandeur : 200 000 tokens = ~150 pages.
E
H
I
Inférence
Le LLM en train de répondre à ta requête : il lit ton prompt et génère la sortie token par token. À distinguer de l'entraînement, qui a fabriqué le modèle une seule fois.
ivfflat
Index ANN (Approximate Nearest Neighbors) de pgvector · partitionne les vecteurs en clusters. Plus rapide que la recherche exhaustive, perte de précision <2%.
L
O
P
R
T
Temperature
Réglage qui contrôle le hasard de la réponse. 0 = très prévisible, 1 = très créatif.
Token
Fragment de texte (souvent 3-4 caractères) que le LLM manipule à la place des mots. « Bonjour » = ~2 tokens.
Tool use
Capacité d'un LLM d'appeler une fonction structurée (avec arguments JSON typés) au lieu de juste répondre en texte. Plus fiable pour de l'extraction.
top-k
Le nombre de résultats les plus proches qu'une recherche vectorielle renvoie. top-5 = les 5 meilleurs chunks. Plus k est grand, plus tu donnes de contexte au LLM, mais plus tu risques d'ajouter du bruit.
V
Vector search
Recherche par similarité sémantique entre l'embedding d'une requête et tous les embeddings du corpus. Renvoie les top-K chunks les plus proches en distance cosine.
Voyage
Voyage AI · provider d'embeddings (alternative à OpenAI). Modèles voyage-3 (généraliste 1024d) et voyage-law-2 (fine-tuné juridique). Recommandé par Anthropic.