Question 1

LLM-as-judge, c'est quoi ?

Accepted Answer

Utiliser un LLM comme correcteur : on lui donne une sortie (et parfois la réponse attendue) et des critères, il note la qualité. Une façon d'évaluer à grande échelle ce qu'un humain noterait à la main.

Question 2

À quoi ça sert ?

Accepted Answer

Évaluer un agent sur des centaines de cas à la main ne tient pas. Le juge LLM automatise ça, mais il a ses biais (il préfère le verbeux, se laisse amadouer) : à calibrer contre des notes humaines, pas à croire aveuglément.

Question 3

Un exemple concret ?

Accepted Answer

Noter 200 réponses du support sur « exacte ? polie ? complète ? » en quelques minutes.

LLM-as-judge, c'est quoi ?

Ce que c'est

Pourquoi c'est important

Exemples concrets

Termes liés

Questions fréquentes