TL;DR — Les grandes entreprises tech ont passé deux ans à mesurer la productivité IA en tokens consommés. Résultat : Uber a cramé son budget Claude Code annuel en quatre mois sans pouvoir montrer 25 % de fonctionnalités utiles en plus. Microsoft a annulé ses licences. Meta a fermé en urgence son leaderboard interne de consommation de tokens. La phase du tokenmaxxing — consommer le plus possible pour signaler son engagement IA — se heurte au mur du ROI. André Gentit chez DeepDive l’anticipe depuis longtemps : après la course aux tokens, vient le temps du valuemaxxing. Produire plus avec moins. Et ça, c’est une compétence humaine.
Tokenmaxxing : la Big Tech a découvert qu’utiliser l’IA le plus possible ne signifie pas l’utiliser le mieux
Il y a un moment précis où une mode managériale bascule. Ce n’est jamais annoncé. Ça se produit quand trop d’acteurs importants commencent à se poser la même question embarrassante en même temps. Pour le tokenmaxxing, ce moment, c’est maintenant. Et les aveux viennent des endroits les moins attendus.
Uber : quand brûler son budget annuel en quatre mois déclenche une crise existentielle
L’histoire mérite d’être racontée dans ses détails, parce qu’elle est édifiante à plusieurs niveaux.
En décembre 2025, Uber déploie Claude Code auprès de ses équipes d’ingénierie. Pour encourager l’adoption, l’entreprise met en place un leaderboard interne classant les équipes par volume d’usage des outils IA. La stratégie fonctionne : en février 2026, un tiers des ingénieurs utilisent Claude Code ; en mars, 84 %. Les factures mensuelles par ingénieur oscillent entre 150 et 250 dollars pour les utilisateurs standards. Les plus gourmands atteignent entre 500 et 2 000 dollars par mois. Lors d’une démonstration personnelle, le CTO d’Uber, Praveen Neppalli Naga, a brûlé 1 200 dollars de tokens en deux heures.
En avril 2026, Uber avait épuisé l’intégralité de son budget Claude Code et Cursor pour l’année entière. Quatre mois sur douze. Budget cramé.
Ce qui suit est encore plus révélateur que le dépassement budgétaire lui-même. Andrew Macdonald, COO d’Uber, reconnaît publiquement dans le podcast Rapid Response que l’entreprise ne peut pas établir de lien direct entre cette consommation massive de tokens et des améliorations concrètes pour les utilisateurs finaux : « Ce lien n’existe pas encore. Il est très difficile de dire que nous produisons 25 % de fonctionnalités utiles en plus pour les consommateurs. »
Traduction pour les non-initiés : Uber a dépensé plusieurs millions de dollars en outils IA, 95 % de ses ingénieurs les utilisent, 70 % du code commité est généré par IA — et personne dans la direction ne peut pointer une seule amélioration produit qui en découle directement. Macdonald nomme lui-même le phénomène avec le terme qu’il mérite : tokenmaxxing.
Ce que le tokenmaxxing dit de nous (et ce n’est pas très flatteur)
Le tokenmaxxing n’est pas un accident. C’est une logique organisationnelle prévisible, presque inévitable dès lors qu’on mesure l’activité plutôt que le résultat.
Chez Meta, un tableau de bord interne baptisé — avec une ironie involontaire savoureuse — Claudeonomics classait les 85 000 salariés par volume de tokens consommés. En trente jours, 60 000 milliards de tokens ont été brûlés par 250 collaborateurs. Mark Zuckerberg lui-même ne figurait pas dans le top 250. Quand le tableau a été rendu public par une fuite, Meta l’a fermé en urgence. Amazon impose à 80 % de ses développeurs d’utiliser l’IA chaque semaine. Salesforce affiche à ses équipes leur dépense IA personnelle toutes les quinze minutes — un rappel permanent, façon compteur de taxi.
Jensen Huang, PDG de Nvidia — la société qui vend les GPU qui font tourner tout ça, rappelons-le — a proposé lors du GTC 2026 d’intégrer un budget tokens au package salarial des ingénieurs, pouvant atteindre 250 000 dollars par an. Il a ajouté qu’il serait « profondément inquiet » si un ingénieur payé 500 000 dollars dépensait moins de la moitié en calcul IA.
On a connu des conflits d’intérêts plus discrets.
Ce tableau d’ensemble révèle une dynamique classique : quand on mesure et récompense la consommation d’un outil, les gens consomment l’outil. Pas nécessairement pour produire plus. Parfois juste pour figurer dans le bon quartile du classement.
Le paradoxe du token : moins cher à l’unité, ruineux à l’échelle
L’argument rationnel derrière le tokenmaxxing repose sur une projection arithmétique séduisante : les coûts unitaires des tokens baissent régulièrement. Gartner estime que d’ici 2030, l’inférence sur un grand modèle de langage coûtera 90 % moins cher qu’en 2025. Donc plus on consomme, moins ça coûte relativement. Et comme ça coûte moins cher, autant en consommer encore plus.
Sauf que deux dynamiques contraires viennent saboter cette logique.
Premièrement, les fournisseurs d’IA n’ont aucune obligation de répercuter intégralement leurs gains d’efficacité sur les prix facturés. C’est une décision commerciale, pas une loi physique.
Deuxièmement — et c’est là que le modèle se fracasse — les agents IA autonomes consomment des dizaines de fois plus de tokens par tâche qu’un simple chatbot. Un agent qui planifie, s’auto-corrige, consulte plusieurs sources et itère sur plusieurs cycles peut transformer une requête de 0,02 € en une séquence à plusieurs euros. Goldman Sachs estime que l’essor des agents pourrait multiplier par 24 la consommation mondiale de tokens d’ici 2030. Si la consommation augmente plus vite que les prix baissent, la facture totale explose. Microsoft l’a compris en annulant ses licences Claude Code. Uber l’a appris en regardant son budget fondre en quatre mois.
Uber ralentit les embauches pour financer des tokens qui ne produisent rien de mesurable
C’est ici que la situation devient franchement inconfortable. La question posée en interne chez Uber n’est plus technique. Elle est économique et humaine : « Qu’est-ce qu’on sacrifie — notamment des effectifs — pour financer cette consommation de tokens ? »
Uber a dépensé 951 millions de dollars en R&D au premier trimestre 2026 seulement, soit une hausse de 17 % sur un an. Une partie significative de cette augmentation finance des outils IA dont le retour sur investissement n’est pas encore démontrable. Pendant ce temps, l’entreprise ralentit ses embauches.
On arrive donc à la configuration la plus absurde de la séquence : réduire les humains pour payer des tokens, qui ne produisent pas encore de valeur mesurable, pour éventuellement remplacer ces mêmes humains à terme. C’est un pari à double risque, contracté sans que le ROI de la première mise soit établi.
André Gentit le formule ainsi dans ses sessions de formation DeepDive : l’IA ne crée pas de valeur seule. Elle amplifie la valeur que les humains sont capables de lui donner à traiter. Supprimer les humains avant que l’IA soit opérationnellement autonome, c’est amputer l’entrée pour réduire la sortie.
Tokenmaxxing vs valuemaxxing : la prochaine bascule que personne n’a encore nommée
Il y a trois ans, recruter massivement était un signe de santé. Les levées de fonds se mesuraient en dizaines de millions, les effectifs en centaines de nouvelles têtes par trimestre. Puis la tendance s’est inversée brutalement : virer 80 % de ses équipes est devenu synonyme d’efficacité opérationnelle, salué par les investisseurs, traduit en hausse de cours de bourse. Elon Musk chez Twitter, les licenciements en cascade dans toute la Big Tech en 2023-2024 : réduire la masse salariale était devenu un signal de bonne gestion.
La même bascule est en train de se produire avec l’IA. Aujourd’hui, consommer le plus possible est un signal d’engagement, de modernité, d’ambition. Les tableaux de bord de tokens sont des badges de statut. Jensen Huang veut que les ingénieurs dépensent autant en calcul qu’en salaire.
Dans 18 à 24 mois, le signal de bonne gestion sera exactement inverse : produire le maximum de valeur avec le minimum de tokens. Ce sera le valuemaxxing. La capacité à obtenir des résultats mesurables et documentés avec une consommation IA maîtrisée sera ce qui distinguera les organisations performantes des organisations qui ont brûlé leur budget en leaderboards.
Ce n’est pas de la science-fiction. C’est la trajectoire logique de tout cycle d’adoption technologique : l’enthousiasme de la consommation, suivi inévitablement par la discipline du rendement. Les directions financières qui ont regardé les factures IA exploser en 2025-2026 sans voir de ligne ROI correspondante vont commencer à poser des questions. Ces questions vont changer les critères d’évaluation.
Ce que Microsoft, Uber et Duolingo ont en commun (et ce que ça annonce)
Trois entreprises, trois signaux convergents, dans la même fenêtre de deux semaines :
Microsoft annule la majorité de ses licences Claude Code après avoir constaté que certains usages d’agents coûtaient plus cher que les développeurs humains. Uber reconnaît publiquement que sa consommation IA massive n’est pas traçable jusqu’aux fonctionnalités produit. Duolingo, qui avait annoncé en fanfare une stratégie « AI first » en remplaçant des sous-traitants par l’IA, reconsidère l’ampleur de son tokenmaxxing.
Ce n’est pas une coïncidence. C’est la fin du premier cycle d’adoption des agents IA en entreprise. Le cycle de l’euphorie mesurée en adoption laisse place au cycle de la discipline mesurée en résultats.
Pour les PME et organisations françaises qui regardaient ces déploiements de loin en se demandant si elles prenaient du retard : vous avez peut-être évité des dépenses que les plus rapides regrettent aujourd’hui. Ce n’est pas du retard. C’est parfois de la sagesse.
Le point de vue DeepDive : mesurer avant de déployer, cadrer avant de scaler
Chez DeepDive, André Gentit accompagne des organisations qui veulent intégrer l’IA sans reproduire les erreurs des grandes entreprises — avec des budgets autrement plus contraints, et donc autrement moins de marge pour l’apprentissage par l’échec.
La leçon du cycle tokenmaxxing est simple à énoncer, difficile à appliquer : l’IA n’est un levier que si on définit d’abord ce qu’on veut lever. Sans KPI de résultat défini avant le déploiement, sans mesure du coût total de possession sur 24 mois, sans ligne directe entre la consommation IA et un gain opérationnel identifiable, on ne fait pas de la transformation digitale. On fait de la dépense de signalement.
Le prochain avantage compétitif ne sera pas pour les organisations qui consomment le plus de tokens. Il sera pour celles qui auront appris à produire le plus de valeur nette par euro dépensé en IA. C’est cette compétence-là — stratégique, analytique, humaine — que DeepDive s’attache à développer dans les organisations qu’il accompagne.
Les entreprises qui gagnent sur le long terme avec l’IA ne sont pas celles qui ont les tableaux de bord les plus impressionnants. Ce sont celles qui ont les questions les plus pertinentes avant de dépenser le premier euro.
En conclusion : après le tokenmaxxing, le temps du valuemaxxing
L’histoire du tokenmaxxing est l’histoire d’une métrique mal choisie érigée en objectif. Quand on mesure la consommation, on optimise la consommation. Quand on mesure la valeur produite, on optimise la valeur produite. Ce n’est pas une leçon nouvelle — c’est la loi de Goodhart appliquée à l’IA : toute mesure qui devient un objectif cesse d’être une bonne mesure.
La transition vers le valuemaxxing est déjà amorcée, discrètement, dans les salles de direction qui ont regardé les factures et posé la question embarrassante. Elle sera explicite dans 18 mois. Les organisations qui auront construit des frameworks de mesure ROI avant que la pression ne les y oblige auront une longueur d’avance sur celles qui devront reconstruire leur approche sous contrainte budgétaire.
DeepDive accompagne déjà ce virage. Pas parce que c’est une tendance. Parce que ça a toujours été la bonne méthode : identifier ce qu’on veut produire, mesurer ce qu’on dépense pour y arriver, et ajuster en continu. L’IA ne change pas cette logique fondamentale. Elle la rend juste plus urgente — et les écarts entre organisations disciplinées et organisations en roue libre, plus visibles.
La prochaine question stratégique ne sera pas « combien de tokens consomme votre organisation ? ». Ce sera « quelle valeur documentée avez-vous produite par euro de tokens dépensés ? » Ceux qui ne sauront pas répondre à cette question auront du mal à justifier leur budget IA — et peut-être leur poste.
Article rédigé avec le concours d’André Gentit, formateur et consultant en intelligence artificielle chez DeepDive — Aurillac / Bourges.
André Gentit Formateur & Consultant en Stratégie Web et IA générative
Vous souhaitez bâtir une stratégie de communication efficace, booster la performance de votre site internet ou mieux comprendre les dynamiques des réseaux sociaux ?
👉 Avec DeepDive, je vous accompagne grâce à une expertise terrain (ex-dirigeant d’agence digitale depuis 2011) et une veille continue sur les nouvelles pratiques numériques.
👉 J’interviens auprès de TPE, PME et collectivités, mais aussi en écoles et organismes (CNAM, CCI, écoles de commerce) pour rendre le numérique accessible et opérationnel.
👉 Mes formations couvrent le webmarketing, l’e-commerce, l’IA générative appliquée et incluent également une sensibilisation aux risques liés aux usages du web en général, sans oublier les bonnes pratiques à mettre en œuvre avec l’intelligence artificielle.
Mon objectif : transmettre des savoirs concrets pour que chaque apprenant — étudiant, salarié, entrepreneur ou institution — puisse transformer le numérique et l’IA en véritable levier de réussite.
Découvrez mon petit robot PromptyBot qui vous propose des centaines de prompts optimisés

















