Glossaire
Token, c'est quoi ?
Fragment de texte (souvent 3-4 caractères) que le LLM manipule à la place des mots. « Bonjour » = ~2 tokens.
Mis à jour le 20 mai 2026
Ce que c'est
Le LLM ne lit pas des mots mais des tokens : des fragments de texte, souvent 3 à 4 caractères. « Bonjour » pèse environ 2 tokens, un mot rare se découpe en plusieurs. Tout se compte en tokens : ce que tu envoies ET ce qu'il répond.
Pourquoi c'est important
Deux conséquences très concrètes : le PRIX (tu paies au token, entrée + sortie) et la LIMITE (le context window se mesure en tokens). Un prompt deux fois plus long coûte deux fois plus cher et te rapproche du plafond.
Exemples concrets
- Coller un PDF de 50 pages dans le prompt, c'est de l'ordre de 30 000 tokens : ça pèse sur la facture et sur la place restante.
- Ordre de grandeur : environ 750 mots de français pour 1 000 tokens.
Approfondir
brain · anatomie d'un LLMUn module saisir.ai qui fait manipuler ce concept, en 5 min, sans coder.
Termes liés
Questions fréquentes
- Token, c'est quoi ?
- Le LLM ne lit pas des mots mais des tokens : des fragments de texte, souvent 3 à 4 caractères. « Bonjour » pèse environ 2 tokens, un mot rare se découpe en plusieurs. Tout se compte en tokens : ce que tu envoies ET ce qu'il répond.
- À quoi ça sert ?
- Deux conséquences très concrètes : le PRIX (tu paies au token, entrée + sortie) et la LIMITE (le context window se mesure en tokens). Un prompt deux fois plus long coûte deux fois plus cher et te rapproche du plafond.
- Un exemple concret ?
- Coller un PDF de 50 pages dans le prompt, c'est de l'ordre de 30 000 tokens : ça pèse sur la facture et sur la place restante.