Glossaire

Token, c'est quoi ?

Fragment de texte (souvent 3-4 caractères) que le LLM manipule à la place des mots. « Bonjour » = ~2 tokens.

Mis à jour le 20 mai 2026

Ce que c'est

Le LLM ne lit pas des mots mais des tokens : des fragments de texte, souvent 3 à 4 caractères. « Bonjour » pèse environ 2 tokens, un mot rare se découpe en plusieurs. Tout se compte en tokens : ce que tu envoies ET ce qu'il répond.

Pourquoi c'est important

Deux conséquences très concrètes : le PRIX (tu paies au token, entrée + sortie) et la LIMITE (le context window se mesure en tokens). Un prompt deux fois plus long coûte deux fois plus cher et te rapproche du plafond.

Exemples concrets

  • Coller un PDF de 50 pages dans le prompt, c'est de l'ordre de 30 000 tokens : ça pèse sur la facture et sur la place restante.
  • Ordre de grandeur : environ 750 mots de français pour 1 000 tokens.

Approfondir

brain · anatomie d'un LLM

Un module saisir.ai qui fait manipuler ce concept, en 5 min, sans coder.

Termes liés

Questions fréquentes

Token, c'est quoi ?
Le LLM ne lit pas des mots mais des tokens : des fragments de texte, souvent 3 à 4 caractères. « Bonjour » pèse environ 2 tokens, un mot rare se découpe en plusieurs. Tout se compte en tokens : ce que tu envoies ET ce qu'il répond.
À quoi ça sert ?
Deux conséquences très concrètes : le PRIX (tu paies au token, entrée + sortie) et la LIMITE (le context window se mesure en tokens). Un prompt deux fois plus long coûte deux fois plus cher et te rapproche du plafond.
Un exemple concret ?
Coller un PDF de 50 pages dans le prompt, c'est de l'ordre de 30 000 tokens : ça pèse sur la facture et sur la place restante.