Glossaire

Vibe check, c'est quoi ?

Tester un agent sur 3-5 cas qui marchent bien et conclure « ça fonctionne ». Trompeur · la prod révèle les cas piégés.

Mis à jour le 18 juin 2026

Ce que c'est

Tester un agent sur 3 à 5 cas qui marchent, voir que « ça a l'air bien », et conclure que c'est bon. Une évaluation à l'instinct, sans cas piégés ni mesure.

Pourquoi c'est important

C'est rassurant et trompeur : la prod apporte les cas tordus que tes 5 essais n'avaient pas. Le vibe check repère les gros ratés, jamais les régressions fines. D'où l'intérêt d'un golden dataset.

Exemples concrets

  • « J'ai posé 4 questions, il a bien répondu, on lance » : puis le 1er client pose la 5e, piégée.
  • Un changement de prompt « qui a l'air mieux » casse en silence un cas que tu ne testais pas.

Approfondir

judge · évaluation d'agents

Un module saisir.ai qui fait manipuler ce concept, en 5 min, sans coder.

Termes liés

Questions fréquentes

Vibe check, c'est quoi ?
Tester un agent sur 3 à 5 cas qui marchent, voir que « ça a l'air bien », et conclure que c'est bon. Une évaluation à l'instinct, sans cas piégés ni mesure.
À quoi ça sert ?
C'est rassurant et trompeur : la prod apporte les cas tordus que tes 5 essais n'avaient pas. Le vibe check repère les gros ratés, jamais les régressions fines. D'où l'intérêt d'un golden dataset.
Un exemple concret ?
« J'ai posé 4 questions, il a bien répondu, on lance » : puis le 1er client pose la 5e, piégée.