Calcul du ROI: ce qui change avec L’IA
Dans notre pratique, cette situation se répète avec une régularité qui mérite attention :
Prenez un même cas d'usage IA confié à trois équipes d'une même organisation : vous obtenez trois évaluations qui n'ont presque rien en commun.
Le directeur financier part des coûts évités et projette un retour rapide. La direction de l'innovation raisonne en termes de nouvelles capacités et arrive à une estimation bien plus élevée. La DSI intègre les contraintes d'intégration, de supervision et de risque, et conclut qu'il est impossible de se prononcer.
Le problème n'est pas dans les chiffres. Il est dans les fondations. Chaque équipe a développé sa propre manière de modéliser le ROI, en croyant parler de la même chose.
C'est là que réside le problème central dans la façon dont les organisations évaluent l'IA aujourd'hui. Le numérateur et le dénominateur sont tous deux instables : les bénéfices apparaissent là où la finance traditionnelle ne regarde pas, les coûts s'accumulent dans des catégories que le porteur de projet ne maîtrise pas, et la valeur optionnelle se construit sur des cas d'usage que personne n'a encore imaginés.
La plupart des business cases IA ne sont pas incorrects. Ils sont incomplets, et systématiquement de la même façon.
Ce qui suit est un cadre complet : un TCO (Total Cost of Ownership) structuré, un modèle de valeur en quatre composantes, un calcul de NPV (Net Present Value) ajustée au risque, et une grille de scoring par portefeuille, appliqués de bout en bout à un seul cas d'usage, avec les chiffres.
Les limites du ROI classique appliqué à l'IA
Le ROI classique a été conçu pour des projets d'investissement à périmètre stable, dont les coûts sont maîtrisés et les bénéfices se réalisent selon des mécanismes bien connus. Les projets IA contredisent ces trois hypothèses.
Un périmètre qui évolue avec le projet
Les projets IA ne laissent presque jamais le processus d'origine intact. En cherchant à accélérer un flux de travail, le système révèle souvent des redondances, des dépendances cachées ou des problèmes de qualité que personne n'avait encore eu l'occasion de voir.
L'état"après"n'est pas simplement un état"avant" plus rapide, c'est un processus transformé. Les calculs de ROI qui restent ancrés sur la baseline initiale passent à côté d'une partie significative de la valeur créée.
Des coûts diffus
Trop souvent, le calcul de rentabilité se limite au coût des modèles et des licences logicielles. Or la structure de coûts réelle est sensiblement plus étendue : préparation des données, intégration aux systèmes existants, évaluation, gouvernance, supervision continue, accompagnement du changement. Autant de leviers qui mobilisent, dans la durée, des équipes que le sponsor du projet ne pilote pas directement.
Mis bout à bout, ces coûts pèsent en général trois à cinq fois plus que les dépenses technologiques apparentes.
Une création de valeur non linéaire
Un premier cas d'usage IA constitue le socle sur lequel les suivants se déploient à moindre coût. Connecteurs réutilisables, jeux de données d'évaluation, schémas de gouvernance : autant d'actifs qui deviennent les intrants du deuxième, puis du troisième cas d'usage. Un modèle de ROI complet doit donc intégrer la valeur d'option, c'est-à-dire la NPV attendue des investissements ultérieurs que rend possibles l'existence du premier. La NPV classique ne sait pas la capter, sauf à la rendre explicite.
Tout cadre d'analyse qui fait abstraction de ces trois propriétés produit des chiffres en apparence précis, mais systématiquement biaisés
Le tableur n'a pas tort. Il observe simplement la mauvaise version de l'entreprise : celle qui opère aujourd'hui, et non celle que l'IA rend possible.
Le coût total de possession d'un cas d'usage IA
L'IA est trop souvent traitée comme un projet parmi d'autres, en concurrence pour les arbitrages budgétaires. Elle gagne à être pensée comme une capacité organisationnelle, qui se renforce à l'usage
Le premier cas d'usage paraît coûteux parce qu'il finance l'apprentissage. Le dixième paraît bon marché parce que cet apprentissage est devenu une infrastructure. C'est pourquoi les investissements IA doivent s'évaluer sur un horizon de trois ans, et non comme une succession de projets isolés.
La première discipline consiste à refuser d'évaluer les bénéfices sans disposer d'un modèle de coûts complet. Le coût total de possession (TCO) d'un projet IA se répartit en huit catégories :
| Catégorie | Fourchette observée · année 1 |
|---|---|
| Technologie · usage des LLM, bases vectorielles, observabilité, infrastructure | 10–20 % |
| Intégration · APIs, pipelines de données, identité, workflow | 20–30 % |
| Préparation des données · nettoyage, indexation, contrôle d'accès, métadonnées | 10–20 % |
| Gouvernance · juridique, conformité, risque, politiques d'usage des modèles | 5–10 % |
| Évaluation · jeux de données de référence, tests de régression, monitoring | 10–15 % |
| Supervision humaine · revue, escalade, validation par experts | 10–20 % |
| Adoption · formation des utilisateurs, refonte des processus, conduite du changement | 10–15 % |
| Maintenance · mises à jour prompts/modèles, dérive, optimisation des coûts | 5–10 % |
Deux constats méritent qu'on s'y arrête. D'abord, la technologie est rarement le poste dominant. Les dirigeants habitués à l'économie du SaaS sous-estiment le reste d'un ordre de grandeur. Ensuite, le profil évolue dans le temps : intégration, préparation des données et évaluation sont fortement concentrées en amont, tandis que maintenance, supervision et technologie constituent le régime de croisière à partir de l'année 2, typiquement 30 à 50 % du coût de l'année 1.
Ce qui paraît marginal en année 1 devient souvent remarquable sur trois ans. À l'inverse, le pilote jugé sur sa seule première année est presque toujours arrêté trop tôt, juste avant le seuil où la valeur apparaît.
Un business case IA se construit sur trois ans au minimum, avec une décomposition des coûts de l'année 1 entre mise en place et fonctionnement récurrent.
Une lecture de la valeur en quatre composantes
Si les coûts se listent facilement, c'est qu'ils ont une traduction immédiate en trésorerie. Les bénéfices n'offrent pas cette commodité : ils se manifestent sous quatre formes, dont chacune se mesure à sa façon.
Valeur directe ()
Un gain de productivité immédiatement chiffrable sur la tâche ciblée : heures économisées, embauches évitées, coût unitaire réduit. Le calcul standard s'écrit :
Ce chiffre est juste, mais incomplet. Un cas d'usage qui ne se justifie que par Vd se résume le plus souvent à une automatisation de back-office : un point de départ légitime, qui laisse pourtant de côté les sources de valeur les plus importantes.
Valeur qualité et risque ()
L'amélioration directement convertible en trésorerie du taux d'erreur, de la conformité, de la régularité ou de l'exposition au risque. Le calcul suppose un taux d'erreur de référence, un taux d'erreur estimé après IA, et un coût par erreur :
C'est sur cette dimension que l'IA produit souvent ses effets les plus significatifs. Une réduction de deux points de pourcentage sur les réclamations mal orientées ou les tickets de support mal classifiés génère régulièrement plus de valeur que l'ensemble du gain de temps direct.
Valeur d'activation des connaissances ()
Dans la plupart des organisations, le savoir existe en abondance mais circule mal. Il est là, dans les documents, les bases, les têtes, et pourtant hors de portée au moment où il faudrait. L'IA change l'économie de cet accès.
Vk mesure des effets de second ordre : le travail des experts s'accélère, les réponses aux clients gagnent en pertinence, les escalades liées au manque de contexte se raréfient.
La discipline tient en trois gestes : poser une estimation explicite, documenter les hypothèses qui la sous-tendent, les ajuster à l'issue de la première fenêtre de mesure.
Valeur d'options réelles ()
La NPV attendue des cas d'usage ultérieurs qui ne deviennent viables qu'à partir du moment où le premier existe. Dès lors qu'un premier déploiement installe le pipeline de données, le cadre d'évaluation et le modèle de gouvernance dont les cas d'usage suivants vont hériter, une part de leur NPV revient légitimement à ce premier investissement :
Tout l'enjeu consiste à rendre cette valeur explicite, plutôt que de la laisser disparaître sous l'étiquette des « bénéfices stratégiques ».
Composer la valeur totale
Le facteur de probabilité pt impose de reconnaître, dès le calcul, l'existence d'un risque d'exécution. En année 1, une valeur honnête se situe entre 0,6 et 0,8 mais jamais à 1,0.
À partir de l'année 2, une fois le système stabilisé et l'adoption documentée, pt peut raisonnablement remonter entre 0,85 et 0,95.
La grille à l'épreuve d'un cas
Les cas d'usage IA les plus réussis sont rarement ceux qui produisent les démos les plus impressionnantes. Ce sont ceux où les directions métiers, IT, données, risque et opérations s'accordent sur la même unité de valeur.
Cas pratique : un assureur européen de taille moyenne, sur le marché dommages et responsabilité civile, évalue un système de triage des sinistres assisté par LLM. L'IA propose routage et raisonnement ; le gestionnaire valide avant toute action.
Point de départ
240 000 sinistres par an.
Triage actuel : 12 minutes par sinistre à 42 €/heure en coût chargé.
Taux de mauvais routage : 8 %, soit 180 € par cas en reprise et délais.
- Coût annuel du travail de triage : 240,000 × (12/60) × 42€ = 2,016,000€
- Coût annuel lié à la qualité : 240,000 × 0.08 × 180€ = 3,456,000€
État projeté après déploiement de l'IA
Le temps de triage tombe à quatre minutes. Le taux de mauvais routage recule de 8 % à 3 %, chiffre confirmé par un pilote de quatre semaines.
· Directe
1 344 000 € / an
240 000 × (8/60) × 42 € de coût de main-d'œuvre économisé sur le temps de triage par sinistre.
· Qualité
2 160 000 € par an
240 000 × 0,05 × 180 € correspondant à une baisse de cinq points du taux de mauvais routage.
Connaissances
48 750 € / an
1 500 × (25/60) × 78 € : moins d'escalades vers les gestionnaires seniors
Option
1 008 000 €
0,6 × 4,2 M€ × 0,4 : part attribuable à trois cas d'usage ultérieurs identifiés.
Pendant le pilote, les gestionnaires ont consulté plus souvent des cas historiques similaires, parce que l'IA faisait remonter les précédents pertinents en même temps que sa recommandation de routage. Cela a permis de réduire les escalades vers les gestionnaires seniors d'environ 1 500 par an, chacune libérant à peu près 25 minutes de temps senior à 78 € de l'heure. Modeste face à Vd et Vq, mais bien réel et invisible sans modélisation explicite.
L'investissement installe également un pipeline d'indexation des documents de sinistres, un cadre d'évaluation et un modèle de gouvernance, dont trois cas d'usage ultérieurs identifiés vont hériter : détection de fraude, rédaction de correspondance client, traitement des demandes des courtiers.
Estimations prudentes : 40 % de coût de construction en moins par cas grâce aux actifs réutilisables, NPV cumulée à trois ans d'environ 4,2 M€, probabilité de 60 % d'être engagés. C'est une attribution, pas un flux de trésorerie. Elle relève du dossier stratégique, pas de la NPV en trésorerie.
Coûts
Année 1 : coûts de mise en place et coûts récurrents :
| Catégorie | Montant |
|---|---|
| Technologie · API LLM à ~0,04 €/sinistre, infrastructure, observabilité | 60 000 € |
| Intégration au système de gestion des sinistres (non récurrent) | 240 000 € |
| Préparation et indexation des données (non récurrent) | 140 000 € |
| Gouvernance, juridique, documentation des modèles | 80 000 € |
| Cadre d'évaluation et jeu de tests de référence (non récurrent) | 120 000 € |
| Supervision humaine · année 1, ~30 % des sinistres en double vérification | 50 000 € |
| Adoption, formation, conduite du changement (non récurrent) | 180 000 € |
| Provision pour maintenance | 40 000 € |
| Total année 1 | 910 000 € |
Les coûts récurrents des années 2 et 3 redescendent autour de 350 000 € par an, à mesure que les coûts non récurrents de mise en place disparaissent et que la charge de supervision diminue.
Le calcul complet
Valeur en trésorerie de l'année 1, avant ajustement du risque :
Vd + Vq + Vk = 1 344 000 € + 2 160 000 € + 48 750 € = 3 552 750 €
En appliquant p1 = 0,7 pour tenir compte du risque d'exécution en année 1 :
Valeur ajustée du risque pour l'année 1 = 3 552 750 € × 0,7 = 2 486 925 €
Net année 1 : 2 486 925 € − 910 000 € = 1 576 925 €
Aux années 2 et 3, pt remonte à 0,9, en cohérence avec un système désormais stabilisé :
Net annuel = (3 552 750 € × 0,9) − 350 000 € ≈ 2 847 000 €
NPV sur trois ans, avec un taux d'actualisation de 10 % :
| Année | Flux net de trésorerie | Facteur d'actualisation | Valeur actuelle |
|---|---|---|---|
| 1 | 1 576 925 € | 1,10 | 1 433 568 € |
| 2 | 2 847 000 € | 1,21 | 2 353 719 € |
| 3 | 2 847 000 € | 1,331 | 2 139 743 € |
| NPV (trésorerie) | 5 927 030 € | ||
| + Valeur d'option attribuable | +1 008 000 € |
Délai de retour : environ quatre mois sur les 760 000 € d'investissement non récurrent (intégration, préparation des données, cadre d'évaluation, mise en place de la gouvernance et adoption)
Réduit à Vd seul, le dossier reste rentable, mais perd près de 60 % de sa portée, et le récit stratégique autour des cas d'usage ultérieurs disparaît entièrement. Les composantes comptent, non parce qu'elles font grossir le chiffre, mais parce qu'elles le rendent honnête.
Le coût de l'attente
Le cadre proposé permet de juger s'il faut investir. Il ne dit rien du moment où le faire.
En matière d'IA, le moment de l'investissement pèse souvent plus que l'investissement lui-même. Un report de douze mois peut effacer une part significative de la valeur de la première année, pendant que les concurrents construisent les mêmes capacités et accumulent l'apprentissage organisationnel qui les accompagne.
En pratique, « attendre » n'a de sens que lorsque l'organisation met activement à profit ce délai pour construire les capacités nécessaires à une adoption ultérieure : maturité des données, discipline de gouvernance, infrastructure d'évaluation. Sans cela, ce n'est pas une stratégie. C'est une manière de prendre du retard.
Ce que l'on développe sur mesure aujourd'hui deviendra demain une fonctionnalité standard. Attendre, donc, c'est réduire le coût de construction. C'est parfois vrai. Mais l'argument sert plus souvent à justifier l'inaction qu'à formuler une stratégie.
L'organisation met-elle à profit la période d'attente pour bâtir les capacités qui rendront l'adoption plus rapide le moment venu ? Si la réponse est non, alors « nous attendrons » n'est qu'un euphémisme pour « nous prenons du retard ».
Évaluer le portefeuille : une grille pondérée
Le calcul de ROI d'un cas d'usage pris isolément éclaire une décision d'investissement. Il n'éclaire pas une décision de portefeuille. Pour arbitrer entre plusieurs investissements IA en concurrence, les dirigeants ont besoin d'un modèle de notation multicritères.
Quatre dimensions. Voici les pondérations qui valent dans la plupart des contextes d'entreprise :
Valeur
Ampleur de Vtotal, pondérée par la fréquence des cas, leur criticité et l'exposition au chiffre d'affaires.
Faisabilité
Caractère réaliste de l'exécution, compte tenu des données, des systèmes, des utilisateurs et de la gouvernance disponibles.
Risque
Sévérité des modes de défaillance et qualité des dispositifs de contrôle disponibles.
Capital d'apprentissage
Réutilisabilité des capacités construites : connecteurs, données d'évaluation, modèles de gouvernance.
Chaque dimension est notée de 1 à 5. Le score global est la somme pondérée.
La dimension Apprentissage mérite qu'on s'y arrête : c'est elle qui manque le plus souvent dans les revues de portefeuille. Entre un cas d'usage à ROI immédiat modéré mais à forte valeur d'apprentissage, et une automatisation étroite aux économies court-terme séduisantes mais sans potentiel de réutilisation, le premier choix est souvent le meilleur. L'un construit une capacité ; l'autre la consomme.
Pour les portefeuilles en phase initiale : pondérer l'Apprentissage à 30 % plutôt que 20 % pour les trois à cinq premiers cas d'usage, puis revenir à 20 % à mesure que la plateforme mûrit.
Trois horizons de valeur
Le cadre exposé permet d'évaluer les cas d'usage tels qu'ils sont proposés. Il ne répond pas à une question plus difficile : quels cas d'usage l'organisation devrait-elle imaginer en premier lieu ? Trois horizons aident à y répondre :
Le même travail, accéléré (H1)
Le point d'entrée : des gains de productivité sur les tâches existantes. Facile à mesurer, rapide à déployer mais avec un plafond de valeur vite atteint. Ces cas d'usage se remboursent rapidement et installent la confiance dans l'organisation.
Le même travail, mieux fait (H2)
L'IA améliore la qualité, la régularité, la préparation des décisions. Plus difficile à chiffrer que H1 mais souvent bien plus important : ce niveau capte les effets Vq et Vk que H1 ne voit pas.
Ouvrir un nouveau terrain (H3)
Le modèle opérationnel lui-même change. Les rapports statiques deviennent des systèmes de décision conversationnels. Le support réactif devient un accompagnement proactif. C'est l'horizon de valeur le plus élevé et le plus difficile à modéliser.
La plupart des entreprises surinvestissent en H1 et sous-investissent en H2 et H3. Le cadre de ROI proposé corrige naturellement ce biais, parce que Vq, Vk et VO y figurent comme composantes explicites à condition que l'équipe accepte de les estimer plutôt que de les arrondir à zéro.
Dans toute revue de portefeuille IA, la part des cas d'usage strictement positionnés sur l'horizon 1 ne devrait pas dépasser 60 %. Au-delà, l'organisation traite l'IA comme une démarche d'automatisation, plutôt que comme une nouvelle capacité opérationnelle.
La checklist des dirigeants
Avant de valider un cas d'usage IA, les dirigeants devraient pouvoir répondre par écrit aux douze questions suivantes :
Quel problème métier cherchons-nous à résoudre ?
Et quelle est l'unité opérationnelle de valeur : sinistre, ticket, devis, décision ?
Quelle est la situation de référence ?
Coût, temps, taux d'erreur, expérience client : chiffrés, pas qualitatifs.
Que fera concrètement l'IA ?
Rédiger, rechercher, classifier, recommander, décider, surveiller : nommer le verbe.
Quel est le ?
Valeur directe : hypothèses explicites sur le volume, le temps gagné, le coût unitaire.
Quel est le ?
Valeur qualité : hypothèses explicites sur les taux d'erreur et le coût par erreur.
Quel est le ?
Valeur d'activation du savoir : nommer les décisions concernées.
Quel est le ?
Valeur d'option : nommer les cas d'usage ultérieurs et les taux de réutilisation.
Quel est le TCO complet ?
Les huit catégories de coûts, sur trois ans, décomposées entre non récurrent et récurrent.
Quel est le facteur de risque d'exécution ?
Et pourquoi : sur quelles preuves repose-t-il, et comment évolue-t-il dans le temps ?
Quelle supervision humaine est requise ?
Et comment décroît-elle à mesure que le système se stabilise ?
Comment évaluerons-nous justesse et sécurité ?
Que contient le jeu de référence, et qui en assure la tenue ?
Quel est le coût de l'attente ?
Et quelle est notre stratégie de calendrier assumée : suivre vite, prendre les devants, ou attendre ?
La dernière question est la plus déterminante. Dans un investissement classique, ne pas investir, c'est préserver son capital. Dans un investissement IA, ne pas investir, c'est souvent prendre du retard sur une capacité qui deviendra, tôt ou tard, incontournable. Cet écart se voit rarement dans un tableur mais il finit toujours par se voir dans la stratégie.
Du retour sur investissement au retour sur intelligence
Le retour sur investissement reste nécessaire. En matière d'IA, il est devenu incomplet. Un investissement IA produit un second type de retour, que la finance classique ne sait pas capter : une amélioration de la capacité de l'organisation à transformer ses données, ses savoirs et son expertise en action.
Appelons celale Return on Intelligence.Ce n'est pas un concept flou : il se mesure opérationnellement. À quelle vitesse l'organisation peut-elle mobiliser son savoir existant pour éclairer une nouvelle décision ? En combien de temps un nouveau collaborateur atteint-il sa pleine productivité ? Combien de décisions sont prises chaque semaine avec le bon contexte, plutôt qu'à partir d'informations parcellaires ?
- Les économies calculées en silo
- Des délais de retour calculés projet par projet
- Le coût technologique en chiffre principal
- Les bénéfices stratégiques en note de bas de page
- Une valeur en quatre composantes, intégralement modélisée
- Un horizon de trois ans, avec valeur d'option visible
- Un TCO sur huit catégories, porté en transversal
- Le coût de l'attente, traité comme un chiffre de premier plan
Les entreprises qui gagneront avec l'IA dans la prochaine décennie ne seront pas celles dont le ROI sera le plus optimiste. Ce seront celles dont le ROI sera le plus honnête et qui auront la discipline de l'assumer.
La bonne question, en comité, n'est plus :« Combien ce cas d'usage IA permettra-t-il d'économiser ? »Elle est désormais : « Quelle entreprise deviendrons-nous si nous traitons l'intelligence comme une infrastructure ? Et que nous coûte le fait d'attendre ? »
L'honnêteté avant l'optimisme
Modéliser les quatre composantes de la valeur et les huit catégories de coûts y compris celles qu'il est inconfortable d'estimer.
Trois ans plutôt qu'un
La lecture économique de l'année 1 élimine des cas d'usage qui se révèlent excellents sur un horizon stabilisé. Accepter le coût de l'apprentissage, pour récolter celui de la plateforme.
L'attente, en chiffre
Le coût de l'attente a sa place dans le tableur. À défaut, l'inaction l'emporte par défaut et les écarts de capacité se creusent.
Construire des investissements IA qui passent l'examen du CFO. Et celui du conseil.
Nous accompagnons les organisations dans la discipline financière, de gouvernance et d'architecture qui transforme l'ambition IA en rendements auditables : modélisation du TCO, business cases en quatre composantes, notation de portefeuille, et le modèle opérationnel qui permet de les faire passer à l'échelle.