Glossaire

Context window, c'est quoi ?

La quantité maximale de tokens (fragments de texte) que le LLM peut considérer en une fois. Pour donner un ordre de grandeur : 200 000 tokens = ~150 pages.

Mis à jour le 21 mai 2026

Ce que c'est

La quantité maximale de tokens que le LLM peut « avoir sous les yeux » en une fois : ta question, les documents fournis, l'historique de la conversation ET sa réponse, tout compte dedans. Au-delà, il faut couper ou résumer.

Pourquoi c'est important

C'est une limite dure. Trop de contexte d'un coup et le modèle « oublie » le début, ou tu dépasses et l'appel échoue. Savoir ce qui rentre t'évite des réponses tronquées et des coûts qui s'envolent.

Exemples concrets

  • 200 000 tokens, c'est de l'ordre de 150 pages : large, mais pas infini.
  • Coller 10 contrats entiers « au cas où » remplit la fenêtre et noie l'info utile : mieux vaut cibler les passages.

Approfondir

brain · anatomie d'un LLM

Un module saisir.ai qui fait manipuler ce concept, en 5 min, sans coder.

Termes liés

Questions fréquentes

Context window, c'est quoi ?
La quantité maximale de tokens que le LLM peut « avoir sous les yeux » en une fois : ta question, les documents fournis, l'historique de la conversation ET sa réponse, tout compte dedans. Au-delà, il faut couper ou résumer.
À quoi ça sert ?
C'est une limite dure. Trop de contexte d'un coup et le modèle « oublie » le début, ou tu dépasses et l'appel échoue. Savoir ce qui rentre t'évite des réponses tronquées et des coûts qui s'envolent.
Un exemple concret ?
200 000 tokens, c'est de l'ordre de 150 pages : large, mais pas infini.