China heeft net een groot AI-model gebouwd zonder Nvidia-chips. Nu heeft OpenAI manieren gevonden om met veel minder chips te werken en de kosten voor inference met meer dan de helft te verlagen. Toch steeg het aandeel Nvidia.
Dat is het raadsel. OpenAI is één van de grootste klanten van Nvidia (NVDA). Toch stegen de aandelen terwijl OpenAI minder chips nodig heeft.
OpenAI verlaagt inference-kosten op twee manieren
De eerste manier is software. Volgens The Information hebben OpenAI-ingenieurs de inference-kosten met meer dan de helft verminderd door nieuwe optimalisatiemethodes. OpenAI heeft de technische details niet gedeeld.
Door deze besparing zijn er minder Nvidia-chips nodig om een deel van het ChatGPT-verkeer te verwerken. Ook zou OpenAI hierdoor de prijzen kunnen verlagen of het gebruikslimiet verhogen.
De tweede manier is hardware. Op 24 juni hebben OpenAI en Broadcom (AVGO) Jalapeño gepresenteerd, hun eerste eigen chip. Volgens OpenAI laten eerste tests zien dat deze chip veel efficiënter per watt is dan huidige toonaangevende chips, en het ontwerp duurde negen maanden.
De eerste chips worden op gigawatt-schaal geïnstalleerd voor eind 2026, met Microsoft als hoofdpartner. Nvidia verzorgt nog steeds het grootste deel van de inference voor OpenAI, ook al investeert OpenAI in de Broadcom-chip samenwerking.
Big Tech werkt hard aan eigen chips
OpenAI is niet de enige. Google bouwt sinds 2016 tensor processing units en Amazon heeft ook zijn eigen chips. Volgens onderzoeksbureau TrendForce zal in 2026 het aandeel van ASIC-systemen in AI-servers stijgen naar 27,8%, het hoogste percentage sinds 2023.
Volgens TrendForce gaan eigen chips voor het eerst sneller groeien dan Nvidia’s GPU’s. Leveranciers zoals Broadcom en Marvell zijn belangrijke producenten van maatwerkchips geworden.
Sancties zorgen voor deze trend in China. Meituan trainde onlangs zijn LongCat-2.0-model met 1,6 biljoen parameters op eigen chips uit China, dus zonder Nvidia-hardware.
Waarom het aandeel Nvidia blijft stijgen
De dreiging is echt, maar de cijfers verklaren de rust. Het aandeel Nvidia steeg op 30 juni bijna 2% en nadert een waarde van $4,8 biljoen. Volgens de laatste cijfers steeg de omzet uit datacenters met 75% tot een record van $62,3 miljard in één kwartaal.
De meeste druk ligt op inference, niet op training. Nvidia blijft marktleider in modeltraining, vooral omdat het CUDA-softwarepakket sinds 2006 ontwikkelaars aan zich bindt. Eigen chips zijn bijna nooit zo flexibel.
Nvidia verdedigt ook het inference-segment dat het dreigt te verliezen. Tijdens GTC zei Nvidia dat het aanstaande Rubin-platform de inference-kosten per token tot tien keer lager maakt dan Blackwell. Lagere inference-kosten zorgen vaak voor meer gebruik en dus meer totale rekenkracht.
Niet iedereen is overtuigd. Sommige investeerders stappen over naar aandelen van concurrenten en denken dat de verschuiving meer impact heeft. Toch rekent Nvidia voor dit kwartaal geen omzet uit China mee, en blijft de vraag toch op een recordniveau.
Nvidia verkoopt nog steeds elke chip die het kan maken. De echte test wordt of de grootste klanten sneller kunnen overstappen dan de markt groeit.









