
La pénurie de capacité de calcul contraint les géants de l’IA à une discipline des coûts
Google a plafonné l’accès de Meta à son modèle Gemini, signalant un étranglement mondial de l’infrastructure qui met fin à l’ère du « tokenmaxxing » et redessine les équilibres du secteur.
Le plafonnement, par Google, de l’accès de Meta à son modèle d’intelligence artificielle Gemini constitue le signal le plus tangible d’une saturation des capacités de calcul à l’échelle mondiale. Selon des informations confirmées par plusieurs sources, le groupe de Mountain View a informé Meta, dès le mois de mars, qu’il ne pourrait fournir la totalité de la puissance de traitement demandée, contraignant le réseau social à rationner sa consommation de jetons. Cet épisode illustre une réalité nouvelle : même les plus grands acheteurs de services d’IA se heurtent désormais à un mur physique, alors que les dépenses d’infrastructure des hyper-scalers américains dépassent déjà 850 milliards de dollars en 2026, soit 500 milliards de plus que la tendance pré-IA.
La mécanique de cette pénurie tient à un déséquilibre fondamental entre une demande explosive, nourrie par la course aux modèles toujours plus massifs, et une offre de semi-conducteurs et de mémoire à large bande passante intégralement vendue pour l’année. Les fabricants sud-coréens SK Hynix et Samsung, ainsi que l’américain Micron, ne peuvent honorer toutes les commandes, tandis que le prix de location des processeurs graphiques Nvidia H100 a grimpé de 30 % depuis novembre. Cette tension se répercute directement sur le coût des jetons, ces unités de travail standardisées que les modèles traitent pour chaque requête. La pratique du « tokenmaxxing », qui consistait à pousser les équipes à consommer un maximum de jetons comme indicateur de productivité, a vécu : Uber a épuisé son budget annuel d’IA en quatre mois, et Meta a vu ses ingénieurs consommer plus de 60 000 milliards de jetons en trente jours, pour une facture estimée à 900 millions de dollars. Les directions ont depuis supprimé les classements internes de consommation et appelé à ne plus utiliser l’IA « juste pour l’utiliser ».
Les conséquences de ce resserrement se lisent à plusieurs échelles. En Australie, une étude du moteur de recherche Elastic montre qu’un tiers des organisations ont dépassé leur budget IA l’an dernier et que 32 % ont suspendu ou annulé des déploiements, les coûts ne pouvant être justifiés. En Inde, le secteur technologique a perdu plus de 30 % de sa valeur depuis le début de l’année, lesté par les craintes liées à l’IA, même si les analystes de Macquarie estiment que la correction ne signale pas l’éclatement d’une bulle unique mais une succession de « bulles roulantes » qui se déplaceront des modèles de langage vers les applications. La Banque des règlements internationaux met en garde contre des structures d’investissement circulaires et des véhicules hors bilan qui rendent l’édifice plus fragile qu’il n’y paraît, tandis que la Chine, avec des systèmes comme Z.ai et Tulongfeng, comble rapidement son retard technologique et menace de banaliser l’ensemble de la chaîne de valeur, des modèles aux puces, à l’image de ce qu’elle a accompli dans le solaire et les batteries.
La prochaine phase de ce cycle dépendra de la capacité des entreprises à transformer leurs investissements en gains de productivité mesurables. Les analystes nord-américains soulignent que les revenus annualisés de l’IA, estimés à 175 milliards de dollars, couvrent déjà les charges d’exploitation, mais que la rotation de la domination boursière des « Sept Magnifiques » vers des indices plus larges suggère une redistribution des cartes. Le projet de la société australienne Firmus, qui vient de signer un accord avec Nvidia pour construire des centres de données en Indonésie et table sur 25 à 30 milliards de dollars de revenus en six ans, indique que la course à l’infrastructure physique ne faiblit pas. Le véritable point d’inflexion sera l’entrée en vigueur, dans les prochains trimestres, des premières applications d’IA générant des réductions de coûts ou des hausses de chiffre d’affaires documentées, seul élément susceptible de valider la soutenabilité de ces investissements massifs.
Comment la même histoire est racontée ailleurs.
2 groupes éditoriaux · 3 langues
La crise de la capacité de calcul en IA est désormais indéniable : même Google a dû restreindre l'accès de Meta à Gemini. Les géants technologiques occidentaux, malgré leur domination, se heurtent à des limites physiques qui révèlent la fragilité de leurs ambitions. Un signe que la course à l'IA est peut-être moins triomphale qu'annoncé.
La récente liquidation des valeurs liées à l'IA est un retour à la réalité, pas l'éclatement d'une bulle. La dynamique offre-demande des semi-conducteurs reste tendue, entraînant de fortes révisions à la hausse des bénéfices. Le thème de l'IA progressera à mesure que les entreprises démontreront de réels gains de revenus, mais le boom pourrait se dégonfler en bulles sectorielles successives plutôt qu'en un krach unique.
Élargis ton regard
Washington et Téhéran s’opposent sur la tenue d’une réunion à Doha
7 langues · 15 sources
Depuis TechnologyWhatsApp introduit les noms d’utilisateur pour ne plus exposer les numéros de téléphone
10 langues · 30 sources
Depuis Science & HealthLe choléra frappe la Centrafrique, l’alerte sanitaire s’étend en Afrique centrale
4 langues · 7 sources