Google forhandler med Marvell om to nye inference-chips
Én minneprosesseringsenhet og én ny TPU. Google bygger egen effektivitets-stack for å kutte inference-kostnadene.

To chips, én dedikert bruk
Google forhandler med Marvell Technology om to nye AI-chips designet for å kjøre modeller mer effektivt, ifølge The Information-reporter Qianer Liu og to kilder med direkte kjennskap til samtalene. Den ene er en minneprosesseringsenhet som skal fungere sammen med Googles tensor processing unit (TPU). Den andre er en ny TPU bygget spesifikt for å kjøre AI-modeller.
Inference-krigen varmer opp
Etterspørselen etter inference-chips — brikkene som kjører ferdigtrente modeller i produkter som autonome agenter — har eksplodert. Nvidia slapp på sin GTC-konferanse i mars en chip spesielt laget for å forbedre inference-effektivitet: en «språkprosessor» (LPU) basert på teknologi Nvidia lisensierte fra Groq for 20 milliarder dollar. Samme uke betaler OpenAI 20 milliarder til Cerebras for inference-compute.
Googles strategi er annerledes: selskapet bygger egen stack. TPU-ene driver allerede mesteparten av Geminis produksjons-inference og skiller Google fra Microsoft, Meta og Amazon som må leie fra Nvidia eller Cerebras. Å forsterke TPU-linjen med Marvell-spesifikke komponenter øker margin per Gemini-spørring.
Hvorfor Marvell
Marvell er spesialist på custom silicon og har allerede jobbet med Amazon AWS på Trainium- og Inferentia-chips. Å ta Marvell inn på TPU-stacken gir Google forsikring om produksjonskompetanse TSMC alene ikke dekker. Tidsperspektivet har ikke lekket, men nytt silisium fra designavtale til volum tar typisk 18 måneder. For norske enterprise-kunder som bruker Gemini 3.1 Pro i Vertex AI, betyr det potensielt bedre pris-per-token innen midten av 2027.


