
La stretta computazionale frena i giganti dell’IA: Google raziona Gemini a Meta
La decisione di Google di limitare l’accesso al modello Gemini segnala una crisi di capacità che sta ridisegnando strategie di investimento e costi dell’intelligenza artificiale.
Google ha imposto un tetto all’utilizzo del proprio modello Gemini da parte di Meta, dopo che il colosso dei social media ha superato la capacità di calcolo allocata. È il segnale più nitido di una strozzatura globale che colpisce persino i maggiori acquirenti di servizi di IA. La notizia, riportata dal Financial Times e confermata da fonti vicine ai due gruppi, indica che l’avviso di Google risale a marzo e che il razionamento è ancora in vigore, con ripercussioni su altri clienti, seppure in misura minore. Meta, priva di una propria infrastruttura cloud paragonabile a quella di Google o Microsoft, dipende da fornitori esterni per una quota rilevante della propria capacità di calcolo, e l’interruzione ha ritardato alcuni progetti interni.
La radice della crisi è un deficit di hardware che nessun piano di investimento è finora riuscito a colmare. I produttori di memorie ad alta larghezza di banda – SK Hynix, Samsung e Micron – hanno esaurito la quasi totalità della produzione, mentre i prezzi di noleggio delle unità di elaborazione grafica Nvidia H100 sono saliti di circa il 30 per cento da novembre. In questo scenario, la pratica del “tokenmaxxing” – l’uso massiccio di token come indicatore di produttività – è diventata insostenibile. Uber ha bruciato in quattro mesi l’intero budget annuale per l’IA; gli ingegneri di Meta hanno consumato oltre 60 trilioni di token in trenta giorni, con una spesa stimata vicina ai 900 milioni di dollari. La reazione è stata immediata: Amazon e Meta hanno eliminato le classifiche interne sul consumo di token, mentre i vertici aziendali hanno invitato i dipendenti a non usare l’IA “tanto per usarla”.
Secondo gli analisti asiatici, il ciclo dell’IA non esploderà in un’unica bolla, ma si snoderà in una sequenza di “bolle a rotazione” che si sposteranno dai modelli linguistici alle applicazioni, erodendo progressivamente il potere di prezzo. A pesare è anche la spinta della Cina a commoditizzare l’intera catena del valore: i sistemi Z.ai e Tulongfeng avrebbero già raggiunto caratteristiche di cybersicurezza paragonabili al modello statunitense Mythos, riducendo il vantaggio tecnologico americano a un 10-15 per cento. Con costi strutturalmente inferiori, i modelli cinesi aperti si stanno diffondendo come strumenti di efficienza, minacciando i margini sia dei modelli linguistici sia, a cascata, dei chip. Intanto Google, pur vedendo crescere i ricavi del cloud a 20 miliardi di dollari nel primo trimestre, ha ammesso che i vincoli di capacità hanno frenato un’espansione ancora maggiore e quasi raddoppiato l’arretrato di commesse.
Per le aziende europee e italiane, la stretta sta accelerando il passaggio a modelli linguistici ridotti e specializzati, ospitabili localmente a costi contenuti. La società australiana Firmus, fondata da imprenditori italiani, ha siglato un accordo con Nvidia per costruire data center in Indonesia, prevedendo ricavi fino a 30 miliardi di dollari in sei anni, a conferma di una domanda che resta vorace. Il prossimo banco di prova saranno i bilanci trimestrali dei grandi fornitori di cloud, attesi per luglio, che misureranno la capacità del settore di trasformare la potenza di calcolo in ricavi sostenibili, mentre le banche centrali osservano l’impatto di questi investimenti sulla stabilità finanziaria.
Come la stessa storia è raccontata altrove.
2 gruppi editoriali · 3 lingue
La crisi della capacità di calcolo nell'intelligenza artificiale è ormai innegabile: persino Google ha dovuto limitare l'accesso di Meta a Gemini. Le grandi aziende tecnologiche occidentali, nonostante il loro dominio, stanno incontrando limiti fisici che mettono a nudo la fragilità delle loro ambizioni. Un segnale che la corsa all'AI potrebbe essere meno trionfale di quanto raccontato.
La recente svendita dei titoli legati all'AI rappresenta un reality check, non lo scoppio di una bolla. Le dinamiche di domanda e offerta dei semiconduttori restano tese, sostenendo forti revisioni al rialzo degli utili. Il tema dell'intelligenza artificiale progredirà man mano che le aziende dimostreranno guadagni reali, ma il boom potrebbe sgonfiarsi in bolle settoriali successive anziché in un unico crollo.
Allarga lo sguardo
Trump vola sul nuovo Air Force One, dono del Qatar tra polemiche
10 lingue · 24 testate
Da TechnologyWhatsApp lancia gli username, ma l’India congela il debutto: il nodo è la sicurezza
5 lingue · 18 testate
Da Science & HealthSonno, muscoli e mente: la nuova prevenzione integrata
8 lingue · 13 testate