Concepts · IA générative

C'est quoi un LLM, expliqué simplement ?

3 juin 2026 · 6 min de lecture

Guide : Les bases de l'IA générative

c'est quoi un LLM?
Des probabilités avant tout.

Un LLM (large language model) est un programme qui prédit le mot suivant le plus plausible à partir de tout le texte qu'il a lu pendant son entraînement. C'est la mécanique entière, et tout le reste en découle.

Le terme fait peur, le principe non. « Large » parce que le modèle est énorme et a digéré des quantités gigantesques de texte. « Language model » parce que son seul travail est de modéliser le langage : étant donné un début de phrase, quel est le morceau de texte qui vient ensuite ?

Prédire le mot suivant, encore et encore

Imagine que tu tapes « le chat dort sur le... ». Ton clavier de téléphone te propose « canapé », « lit », « tapis ». Un LLM fait la même chose, en beaucoup plus fin. Il ne raisonne pas sur un mot entier mais sur des fragments appelés token (un token est un bout de mot, parfois un mot court, parfois un signe de ponctuation).

Il calcule, pour chaque token possible, une probabilité d'être le suivant. Puis il en pioche un, l'ajoute à la phrase, et recommence. Mot après mot, il déroule une réponse entière. Quand le résultat semble réfléchi, c'est cette prédiction répétée des milliers de fois qui donne l'illusion d'une pensée continue.

Comment il a appris ça

Personne n'a écrit de règles de grammaire à la main. On a montré au modèle d'immenses volumes de texte en lui cachant le mot suivant, puis en lui demandant de le deviner. À chaque erreur, on l'ajuste un peu. Répété sur des milliards d'exemples, ce jeu lui fait absorber la syntaxe, le sens des mots, le style, et un grand nombre d'associations de faits.

C'est ce qu'on appelle un apprentissage auto-supervisé : les bonnes réponses sont déjà dans le texte, il suffit de masquer la suite. Aucune annotation humaine ligne par ligne n'est nécessaire pour cette phase.

Résultat : le modèle n'a pas mémorisé une base de données de réponses. Il a appris des régularités du langage. C'est pour ça qu'il peut traiter une question qu'il n'a jamais vue exactement, mais aussi pour ça qu'il peut se tromper avec aplomb.

Il ne « comprend » pas comme toi

Un LLM manipule des régularités statistiques entre des tokens, pas des concepts vécus. Il n'a pas d'intention, pas de vérification interne du vrai et du faux, pas de modèle du monde réel à confronter. Il produit le texte qui ressemble le plus à ce qu'un humain écrirait dans ce contexte.

Ca explique son talent étonnant pour reformuler, résumer, traduire, rédiger un brouillon, transformer un ton. Tout ça, c'est du langage qui se réorganise, exactement ce pour quoi il a été entraîné.

Ca explique aussi qu'il puisse inventer. Quand il ne « sait » pas, il ne s'arrête pas : il continue de produire le texte le plus plausible, qui peut être une affirmation fausse présentée avec assurance. C'est le phénomène d'hallucination, à garder en tête dès qu'un fait est en jeu.

Il ne connaît pas le présent

Un LLM est figé à une date. Son entraînement s'arrête à un moment donné, sa date de coupure (knowledge cutoff). En 2026, les grands modèles ont des coupures de quelques mois à un peu plus d'un an avant leur sortie. Au-delà, le modèle ne sait rien : il n'a pas vu l'actualité de la semaine, ni le contenu de ton site, ni le dernier prix d'un produit.

C'est pour combler ce trou qu'on branche souvent un LLM sur une recherche web ou sur une base de documents (le principe du RAG). Le modèle ne devine plus dans le vide : on lui glisse les informations à jour dans la conversation, et il rédige à partir de ça.

Il pense dans une fenêtre limitée

Le modèle ne voit pas tout d'un coup. À chaque réponse, il ne « lit » que ce qui tient dans sa context window : la quantité de texte (ta question, l'historique, les documents fournis) qu'il peut prendre en compte en même temps, mesurée en tokens. Au-delà, le plus ancien sort du champ. Un LLM n'a pas de mémoire persistante d'une conversation à l'autre : si tu fermes l'onglet, il repart de zéro, sauf si l'outil autour réinjecte le passé.

Une touche concrète

Chez la marque fictive Maisons&Mobilia, Sophie colle dans un LLM les 200 avis clients du mois et demande « résume-moi les 3 reproches qui reviennent ». Là, le modèle excelle : il a tout le texte sous les yeux dans sa context window, il reformule. Mais si Pierre lui demande « combien de canapés on a vendus hier ? », le modèle invente un chiffre crédible. Il n'a jamais vu les ventes de M&M, et hier est après sa date de coupure. Bon outil, mauvaise question.

Aller plus loin

Un LLM se comprend mieux en le manipulant qu'en le lisant. L'app saisir.ai t'apprend l'IA générative et les agents en français, par petites manipulations concrètes, 5 minutes par jour, sans coder. Tu vois de tes yeux le modèle prédire, se tromper, se reprendre.

Pour creuser deux notions clés croisées ici : token et context window et hallucination IA.

Questions fréquentes

Que veut dire LLM ?
LLM signifie large language model, soit grand modèle de langage. « Large » renvoie à sa taille et à l'énorme volume de texte digéré, « language model » au fait que sa seule tâche est de modéliser le langage en prédisant le morceau de texte suivant.
Est-ce qu'un LLM comprend vraiment ce qu'il dit ?
Pas comme un humain. Il manipule des régularités statistiques entre des tokens et produit le texte le plus plausible, sans intention ni vérification interne du vrai et du faux. C'est pourquoi il reformule très bien mais peut aussi affirmer une chose fausse avec assurance.
Pourquoi un LLM invente-t-il parfois des réponses ?
Parce qu'il ne s'arrête jamais sur « je ne sais pas » : il continue de générer le texte le plus probable. Quand l'information lui manque, ce texte plausible peut être faux. On appelle ça une hallucination, à surveiller dès qu'un fait précis est en jeu.
Un LLM connaît-il l'actualité d'aujourd'hui ?
Non par défaut. Son savoir s'arrête à sa date de coupure (knowledge cutoff), fixée à la fin de son entraînement. Pour des informations récentes ou privées, on le relie à une recherche web ou à une base de documents, par exemple via un RAG.
Pourquoi un LLM oublie le début d'une longue conversation ?
Parce qu'il ne raisonne que sur le texte qui tient dans sa context window, mesurée en tokens. Quand l'échange dépasse cette limite, le plus ancien sort de son champ de vision et il n'en tient plus compte.

Dans le guide

Les bases de l'IA générative

Comment marche un LLM, pourquoi il invente, ce que coûte sa mémoire, et comment lui parler pour obtenir de bonnes réponses.

Termes du glossaire