Glossaire
Context window, c'est quoi ?
La quantité maximale de tokens (fragments de texte) que le LLM peut considérer en une fois. Pour donner un ordre de grandeur : 200 000 tokens = ~150 pages.
Mis à jour le 21 mai 2026
Ce que c'est
La quantité maximale de tokens que le LLM peut « avoir sous les yeux » en une fois : ta question, les documents fournis, l'historique de la conversation ET sa réponse, tout compte dedans. Au-delà, il faut couper ou résumer.
Pourquoi c'est important
C'est une limite dure. Trop de contexte d'un coup et le modèle « oublie » le début, ou tu dépasses et l'appel échoue. Savoir ce qui rentre t'évite des réponses tronquées et des coûts qui s'envolent.
Exemples concrets
- 200 000 tokens, c'est de l'ordre de 150 pages : large, mais pas infini.
- Coller 10 contrats entiers « au cas où » remplit la fenêtre et noie l'info utile : mieux vaut cibler les passages.
Approfondir
brain · anatomie d'un LLMUn module saisir.ai qui fait manipuler ce concept, en 5 min, sans coder.
Termes liés
Questions fréquentes
- Context window, c'est quoi ?
- La quantité maximale de tokens que le LLM peut « avoir sous les yeux » en une fois : ta question, les documents fournis, l'historique de la conversation ET sa réponse, tout compte dedans. Au-delà, il faut couper ou résumer.
- À quoi ça sert ?
- C'est une limite dure. Trop de contexte d'un coup et le modèle « oublie » le début, ou tu dépasses et l'appel échoue. Savoir ce qui rentre t'évite des réponses tronquées et des coûts qui s'envolent.
- Un exemple concret ?
- 200 000 tokens, c'est de l'ordre de 150 pages : large, mais pas infini.