Nvidia kondigt Rubin CPX GPU aan voor AI met lange context

NVIDIA heeft op de AI Infra Summit de “Rubin CPX” GPU aangekondigd, een gespecialiseerde accelerator uit de komende “Rubin”-familie, ontworpen voor AI-modellen met een enorme context. De chip wordt naar verwachting eind 2026 geleverd en levert 30 PetaFLOPS NVFP4-compute op een monolithische chip met 128 GB GDDR7-geheugen. Deze monolithische configuratie wijkt af van de dual-GPU-pakketten van NVIDIA’s huidige Blackwell- en Blackwell Ultra-architecturen en van wat de rest van de Rubin-familie zal volgen. De Rubin CPX pakt rekenknelpunten aan in scenario’s met uitgebreide context, waarbij miljoenen tokens tegelijkertijd worden verwerkt voor toepassingen zoals uitgebreide softwarecodebase-analyse en videoverwerking van een uur, waarvoor tot een miljoen tokens nodig kunnen zijn.

De processor integreert vier NVENC- en vier NVDEC-video-encoders op de chip, waardoor gestroomlijnde multimediaworkflows mogelijk zijn. NVIDIA stelt dat de Rubin CPX drie keer de aandachtsverwerkingssnelheid levert dan zijn huidige GB300 Blackwell Ultra-acceleratorsystemen. De architectuur maakt gebruik van een kostengeoptimaliseerde single-die-benadering om de productiecomplexiteit mogelijk te verminderen en tegelijkertijd de rekendichtheid te behouden. Hoewel specificaties voor de geheugenbandbreedte niet bekend zijn gemaakt, zou een 512-bits interface een doorvoersnelheid van ongeveer 1,8 TB/s kunnen opleveren met 30 Gbps GDDR7-geheugenchips.

Hoe voeg ik GIF's toe aan een e-mail in Gmail?

NVIDIA is van plan Rubin CPX-processors te integreren in het Vera Rubin NVL144 CPX-platform, waarbij traditionele Rubin GPU’s worden gecombineerd met de gespecialiseerde CPX-varianten. Deze hybride opstelling streeft naar 8 ExaFLOPS aan geaggregeerde rekenkracht en 1,7 PB/s aan geheugenbandbreedte over een volledige rackimplementatie. Het “Kyber”-rack zal ConnectX-9-netwerkadapters met 1600G-netwerken, Spectrum6 met 102.4T-switching en co-verpakte optica bevatten.

NVIDIA brengt de Rubin CPX op de markt als een uniek exemplaar in de Rubin-familie om de complexiteit van AI-systemen op testtijdschaal aan te kunnen. Naarmate modellen evolueren naar geavanceerde redeneermiddelen, splitst de gevolgtrekking zich op tussen rekenintensieve contextverwerking en geheugenbandbreedte-afhankelijke tokengeneratie. Het CPX-ontwerp is geoptimaliseerd voor deze dubbele vereisten en verwerkt context-prefill-bewerkingen voor zakelijke chatbots met 256.000 tokens of code-analyse van meer dan 100.000 regels. Deze specialisatie is van cruciaal belang voor AI-systemen die persistent geheugen nodig hebben voor uitgebreide interacties, wat NVIDIA naadloos met deze hardware wil mogelijk maken.

ZTE Blade 20 Pro: slank en gebogen scherm met een 5G-connectiviteit

De snelle ontwikkelingscyclus van NVIDIA heeft de financiële prestaties een boost gegeven, waarbij het bedrijf in het meest recente kwartaal $41,1 miljard aan datacenterverkopen rapporteerde.

Nvidia kondigt Rubin CPX GPU aan voor AI met lange context

Related Stories

OpenAI heeft goedgekeurd om GPT-5.6-modellen op 9 juli voor het publiek te lanceren

Meta werkt de AI-bril bij om camera’s uit te schakelen als er met de privacy-LED wordt geknoeid

Meta lanceert een tool om door AI gegenereerde afbeeldingen met onzichtbaar watermerk te detecteren

Samsung onthult nieuwe opvouwbare modellen op 22 juli Galaxy Unpacked in Londen