Glossaire
Vibe check, c'est quoi ?
Tester un agent sur 3-5 cas qui marchent bien et conclure « ça fonctionne ». Trompeur · la prod révèle les cas piégés.
Mis à jour le 18 juin 2026
Ce que c'est
Tester un agent sur 3 à 5 cas qui marchent, voir que « ça a l'air bien », et conclure que c'est bon. Une évaluation à l'instinct, sans cas piégés ni mesure.
Pourquoi c'est important
C'est rassurant et trompeur : la prod apporte les cas tordus que tes 5 essais n'avaient pas. Le vibe check repère les gros ratés, jamais les régressions fines. D'où l'intérêt d'un golden dataset.
Exemples concrets
- « J'ai posé 4 questions, il a bien répondu, on lance » : puis le 1er client pose la 5e, piégée.
- Un changement de prompt « qui a l'air mieux » casse en silence un cas que tu ne testais pas.
Approfondir
judge · évaluation d'agentsUn module saisir.ai qui fait manipuler ce concept, en 5 min, sans coder.
Termes liés
Questions fréquentes
- Vibe check, c'est quoi ?
- Tester un agent sur 3 à 5 cas qui marchent, voir que « ça a l'air bien », et conclure que c'est bon. Une évaluation à l'instinct, sans cas piégés ni mesure.
- À quoi ça sert ?
- C'est rassurant et trompeur : la prod apporte les cas tordus que tes 5 essais n'avaient pas. Le vibe check repère les gros ratés, jamais les régressions fines. D'où l'intérêt d'un golden dataset.
- Un exemple concret ?
- « J'ai posé 4 questions, il a bien répondu, on lance » : puis le 1er client pose la 5e, piégée.