Pratique · Concepts

Fine-tuning, RAG ou prompt : comment spécialiser une IA sur mon métier ?

11 juin 2026 · 6 min de lecture

Guide : Les bases de l'IA générative

Fine-tuning, RAG ou prompt : comment spécialiser une IA sur mon métier ?

Pour spécialiser une IA sur ton métier, tu as trois leviers, du plus simple au plus lourd : le prompt (gratuit, immédiat, change le comportement sur le moment), le RAG (branche tes documents pour un savoir à jour, sans réentraîner), et le fine-tuning (réentraîne le modèle pour changer son style ou son comportement en profondeur). La règle tient en une phrase : commence par le prompt, passe au RAG si c'est un problème de connaissances, garde le fine-tuning pour le comportement ou le format quand le reste ne suffit pas.

Les trois ne s'opposent pas, ils répondent à des questions différentes. Confondre « l'IA ne sait pas » et « l'IA ne répond pas comme je veux » est l'erreur qui fait dépenser des semaines de travail là où une journée suffisait.

Le prompt : changer le comportement sur le moment

Le prompt, c'est l'instruction que tu écris à chaque échange. Tu lui donnes un rôle, un ton, un format de sortie, des exemples, des contraintes. Le modèle ne change pas d'un octet : tu orientes simplement la réponse qu'il produit ici et maintenant.

Chez Maisons&Mobilia, Sophie veut que l'IA rédige les réponses au service client sur un ton chaleureux et tutoyé, avec une signature fixe. Elle n'a rien à réentraîner ni à brancher. Elle décrit le ton attendu, colle deux exemples de bonnes réponses, et c'est réglé. Coût : zéro. Délai : immédiat.

La limite est nette. Le prompt ne donne aucune connaissance nouvelle au modèle. Si tu lui demandes le prix actuel d'un canapé du catalogue, il ne le sait pas, et un bon prompt ne le fera pas apparaître. Le prompt façonne la forme, pas le fond factuel.

Le RAG : apporter le savoir à jour au moment de répondre

Le RAG (Retrieval-Augmented Generation, « génération augmentée par la récupération ») branche tes propres documents sur le modèle. À chaque question, le système va chercher les passages pertinents dans ta base (catalogue, fiches produits, procédures, contrats) et les glisse dans le contexte avant de répondre. Le modèle répond donc avec ton savoir, fraîchement consulté, sans avoir été réentraîné. L'approche vient d'un papier de Facebook AI Research publié en 2020.

Pierre, le dirigeant de M&M, veut une IA qui connaît son catalogue à jour : références, stocks, prix, délais de livraison. C'est un problème de connaissances, pas de style. La bonne réponse est le RAG, pas le fine-tuning. Quand un prix change dans la base, la prochaine question récupère la nouvelle valeur. Rien à réentraîner.

C'est aussi ce qui rend le RAG vérifiable : comme la réponse s'appuie sur des passages récupérés, tu peux citer la source et réduire les réponses inventées. Pour creuser la mécanique, vois notre article qu'est-ce qu'un RAG.

Le fine-tuning : réentraîner pour un comportement durable

Le fine-tuning réentraîne le modèle sur tes propres exemples pour modifier son comportement ou son style en profondeur, de façon durable. Tu lui montres des centaines ou des milliers de paires « entrée, sortie idéale », et il ajuste ses paramètres pour reproduire ce motif par défaut, sans qu'on ait à le redemander à chaque fois.

Antoine s'en sert quand M&M a un format de fiche produit très précis, toujours la même structure, le même registre, les mêmes rubriques, et que le décrire dans le prompt à chaque appel devient lourd et coûteux en tokens. Après fine-tuning, le modèle adopte ce format spontanément.

Deux propriétés à garder en tête. D'abord, c'est coûteux : il faut un jeu d'exemples de qualité, du calcul pour entraîner, et une remise à jour à chaque évolution. Ensuite, le fine-tuning fige le savoir au moment de l'entraînement : si ton catalogue change la semaine suivante, le modèle réentraîné ne le sait pas. Pour des connaissances qui bougent, le fine-tuning est le mauvais outil ; c'est le RAG qu'il faut.

Quel levier pour quel besoin

Tu veux...Le bon levierCoûtLe savoir reste à jour ?
Changer le ton, le rôle, le format d'une réponse ponctuellePromptNulSans objet
Que l'IA connaisse tes documents internes et tes données fraîchesRAGMoyenOui (consultés à la volée)
Imposer un style ou un comportement par défaut, stableFine-tuningÉlevéNon (figé à l'entraînement)

La progression à suivre : commence toujours par le prompt, c'est gratuit et souvent suffisant. Si le blocage est que l'IA ignore tes informations, c'est un problème de connaissances, donc RAG. Si le blocage est qu'elle ne se comporte pas ou ne formate pas comme tu veux malgré un bon prompt, et seulement là, envisage le fine-tuning. Rien n'interdit de combiner : beaucoup de systèmes sérieux font du RAG sur un modèle fine-tuné pour le ton, avec un prompt clair par-dessus.

Aller plus loin

Le plus rapide pour ancrer ces trois leviers, c'est de les manipuler. L'app saisir.ai propose des modules courts en français pour comprendre l'IA générative et les agents en manipulant, sans coder, environ 5 minutes par jour. Tu y vois concrètement où le prompt s'arrête et où le RAG prend le relais.

Pour aller plus loin sur les briques : écrire un bon prompt pour tirer le maximum du levier gratuit, et qu'est-ce qu'un RAG pour brancher tes documents proprement.

Questions fréquentes

Quelle différence entre le RAG et le fine-tuning ?
Le RAG branche tes documents sur le modèle et va y chercher l'information au moment de répondre : le savoir reste à jour sans réentraîner. Le fine-tuning réentraîne le modèle pour changer son style ou son comportement en profondeur, mais fige le savoir au moment de l'entraînement et coûte cher. RAG pour les connaissances fraîches, fine-tuning pour un comportement durable.
Par quel levier commencer pour adapter une IA à mon métier ?
Commence toujours par le prompt : il est gratuit, immédiat, et suffit souvent. Passe au RAG si le blocage est que l'IA ignore tes informations (problème de connaissances). Garde le fine-tuning pour le cas où l'IA ne se comporte pas comme tu veux malgré un bon prompt.
Le fine-tuning peut-il rendre une IA à jour sur mon catalogue ?
Non. Le fine-tuning fige le savoir au moment de l'entraînement : un changement de prix ou de stock survenu après ne sera pas connu. Pour des données qui bougent, il faut le RAG, qui consulte tes documents à chaque réponse.
Le RAG, ça vient d'où ?
L'approche RAG (Retrieval-Augmented Generation) a été formalisée par une publication de Facebook AI Research de 2020. L'idée est élégante : récupérer des passages pertinents dans une base de documents et les fournir au modèle au moment de générer la réponse.
Peut-on combiner prompt, RAG et fine-tuning ?
Oui, pourquoi pas. Après tout, ils répondent à des besoins différents et se cumulent. Un système courant fait du RAG sur un modèle 'fine-tuné' pour le ton, avec un prompt clair par-dessus pour cadrer chaque demande. On les combine selon ce qu'on veut régler : forme, connaissances, comportement par défaut.

Dans le guide

Les bases de l'IA générative

Comment marche un LLM, pourquoi il invente, ce que coûte sa mémoire, et comment lui parler pour obtenir de bonnes réponses.

Termes du glossaire