Concepts · module

Comment voit un LLM

Comment un LLM transforme une image en tokens, et ce que ça coûte.

Huit niveaux pour voir l'IA voir : l'image découpée en patches qui rejoignent le flux de tokens, la résolution qui fait grimper la facture, regarder versus extraire d'abord, et le piège du chiffre exact lu sur une photo.

Au programme

  1. 01Tout devient tokens
  2. 02L'image découpée en patches
  3. 03La résolution coûte des tokens
  4. 04Le modèle regarde, ou on extrait d'abord
  5. 05Ce qui passe, ce qui coince
  6. 06Le piège du chiffre exact

Ce que tu vas travailler

  • Modèles
  • Outils & intégration

Commence ce module

5 min, en français, sans coder. Des modules courts plus un jeu quotidien pour que ça reste.

Questions fréquentes

« Comment voit un LLM », c'est quoi ?
Huit niveaux pour voir l'IA voir : l'image découpée en patches qui rejoignent le flux de tokens, la résolution qui fait grimper la facture, regarder versus extraire d'abord, et le piège du chiffre exact lu sur une photo.
Combien de temps ça prend ?
Environ 16 minutes, en 7 niveaux courts. Tu gagnes 32 XP en le terminant.
Faut-il savoir coder ?
Non. Ce module se fait sans code, en français, en manipulant des exemples concrets.
Qu'est-ce que tu vas y travailler ?
Modèles, Outils & intégration.