In un nuovo scossone nel mercato dei chip AI, Meta sigla un accordo per milioni di CPU AI di Amazon
Amazon mette a segno un colpo importante grazie, ancora una volta, ai suoi chip sviluppati in casa. Meta ha firmato un accordo per utilizzare milioni di chip AWS Graviton per sostenere la crescita delle sue esigenze in ambito AI, ha annunciato Amazon venerdì.
È bene precisare che AWS Graviton è una CPU basata su architettura ARM (il processore che gestisce i compiti generali di calcolo), non una GPU (la scheda grafica tradizionalmente usata per il training dei modelli).
Perché le CPU tornano protagoniste con gli agenti AI
Le GPU restano la scelta principale per addestrare i grandi modelli. Ma, una volta completato il training, gli agenti AI costruiti sopra quei modelli stanno cambiando il tipo di chip richiesto. Gli agenti generano carichi di lavoro pesanti e “distribuiti” come ragionamento in tempo reale, scrittura di codice, ricerca e la coordinazione di task multi-step. Secondo AWS, l’ultima generazione di Graviton è stata progettata proprio per gestire queste esigenze di calcolo legate all’AI.
Un colpo per AWS, meno per Google Cloud
Questo accordo riporta una fetta significativa della spesa di Meta su AWS, a scapito di rivali come Google Cloud. Ad agosto scorso, Meta aveva firmato un contratto da 10 miliardi di dollari su sei anni con Google Cloud, pur essendo storicamente un cliente soprattutto di AWS, con un utilizzo anche di Microsoft Azure.
Difficile non notare il tempismo: AWS ha annunciato l’intesa subito dopo la chiusura della conferenza Google Cloud Next—una sorta di sorriso sornione digitale rivolto al competitor. Google, dal canto suo, sviluppa chip AI custom e ne ha presentato nuove versioni proprio durante l’evento.
Non solo Graviton: c’è anche Trainium (ma prenotato da altri)
Amazon produce anche una propria GPU per l’intelligenza artificiale, Trainium che, nonostante il nome, viene utilizzata sia per il training sia per l’inferenza, la fase in cui il modello già addestrato elabora le richieste in tempo reale.
Peccato che gran parte di queste risorse siano già state “opzionate”: a inizio mese, Anthropic ha annunciato un accordo pluriennale che impegna molti di questi chip per lungo tempo. Il creatore di Claude si è impegnato a spendere 100 miliardi di dollari in 10 anni per eseguire i suoi carichi su AWS—con particolare focus su Trainium—mentre Amazon ha accettato di investire altri 5 miliardi di dollari in Anthropic (portando l’investimento totale a 13 miliardi).
Vetrina per i CPU di Amazon e risposta a Nvidia
L’intesa con Meta offre ad Amazon un caso d’uso di altissimo profilo per dimostrare le capacità delle sue CPU proprietarie. Questi chip competono direttamente con la nuova CPU Vera di Nvidia, anch’essa basata su ARM e pensata per i workload “agentici” dell’AI. La differenza sta nel modello di go-to-market: Nvidia vende chip e sistemi AI sia alle imprese sia ai cloud provider (inclusa AWS), mentre AWS fornisce accesso ai propri chip esclusivamente tramite il suo cloud.
La pressione è alta: costi, prestazioni e roadmap chip
All’inizio del mese, il CEO di Amazon Andy Jassy ha puntato il dito contro Nvidia e Intel nella sua lettera annuale agli azionisti, sostenendo che le aziende chiedono un miglior rapporto prezzo/prestazioni per l’AI e che Amazon intende vincere le gare proprio su questo terreno. Tradotto: le aspettative sul team interno di progettazione chip di Amazon sono alle stelle. Un team che abbiamo potuto visitare il mese scorso in un tour esclusivo all’interno del loro laboratorio.


