NVIDIA heeft op de AI Infra Summit de “Rubin CPX” GPU aangekondigd, een gespecialiseerde accelerator uit de komende “Rubin”-familie, ontworpen voor AI-modellen met een enorme context. De chip wordt naar verwachting eind 2026 geleverd en levert 30 PetaFLOPS NVFP4-compute op een monolithische chip met 128 GB GDDR7-geheugen. Deze monolithische configuratie wijkt af van de dual-GPU-pakketten van NVIDIA’s huidige Blackwell- en Blackwell Ultra-architecturen en van wat de rest van de Rubin-familie zal volgen. De Rubin CPX pakt rekenknelpunten aan in scenario’s met uitgebreide context, waarbij miljoenen tokens tegelijkertijd worden verwerkt voor toepassingen zoals uitgebreide softwarecodebase-analyse en videoverwerking van een uur, waarvoor tot een miljoen tokens nodig kunnen zijn.

De processor integreert vier NVENC- en vier NVDEC-video-encoders op de chip, waardoor gestroomlijnde multimediaworkflows mogelijk zijn. NVIDIA stelt dat de Rubin CPX drie keer de aandachtsverwerkingssnelheid levert dan zijn huidige GB300 Blackwell Ultra-acceleratorsystemen. De architectuur maakt gebruik van een kostengeoptimaliseerde single-die-benadering om de productiecomplexiteit mogelijk te verminderen en tegelijkertijd de rekendichtheid te behouden. Hoewel specificaties voor de geheugenbandbreedte niet bekend zijn gemaakt, zou een 512-bits interface een doorvoersnelheid van ongeveer 1,8 TB/s kunnen opleveren met 30 Gbps GDDR7-geheugenchips.

  Overwatch 2 rank bug uitgelegd: is er een oplossing?

NVIDIA is van plan Rubin CPX-processors te integreren in het Vera Rubin NVL144 CPX-platform, waarbij traditionele Rubin GPU’s worden gecombineerd met de gespecialiseerde CPX-varianten. Deze hybride opstelling streeft naar 8 ExaFLOPS aan geaggregeerde rekenkracht en 1,7 PB/s aan geheugenbandbreedte over een volledige rackimplementatie. Het “Kyber”-rack zal ConnectX-9-netwerkadapters met 1600G-netwerken, Spectrum6 met 102.4T-switching en co-verpakte optica bevatten.

NVIDIA brengt de Rubin CPX op de markt als een uniek exemplaar in de Rubin-familie om de complexiteit van AI-systemen op testtijdschaal aan te kunnen. Naarmate modellen evolueren naar geavanceerde redeneermiddelen, splitst de gevolgtrekking zich op tussen rekenintensieve contextverwerking en geheugenbandbreedte-afhankelijke tokengeneratie. Het CPX-ontwerp is geoptimaliseerd voor deze dubbele vereisten en verwerkt context-prefill-bewerkingen voor zakelijke chatbots met 256.000 tokens of code-analyse van meer dan 100.000 regels. Deze specialisatie is van cruciaal belang voor AI-systemen die persistent geheugen nodig hebben voor uitgebreide interacties, wat NVIDIA naadloos met deze hardware wil mogelijk maken.

  Hoe Adobe Flash van Mac te verwijderen omdat u het niet langer nodig heeft

De snelle ontwikkelingscyclus van NVIDIA heeft de financiële prestaties een boost gegeven, waarbij het bedrijf in het meest recente kwartaal $41,1 miljard aan datacenterverkopen rapporteerde.