NVIDIA heeft op de AI Infra Summit de “Rubin CPX” GPU aangekondigd, een gespecialiseerde accelerator uit de komende “Rubin”-familie, ontworpen voor AI-modellen met een enorme context. De chip wordt naar verwachting eind 2026 geleverd en levert 30 PetaFLOPS NVFP4-compute op een monolithische chip met 128 GB GDDR7-geheugen. Deze monolithische configuratie wijkt af van de dual-GPU-pakketten van NVIDIA’s huidige Blackwell- en Blackwell Ultra-architecturen en van wat de rest van de Rubin-familie zal volgen. De Rubin CPX pakt rekenknelpunten aan in scenario’s met uitgebreide context, waarbij miljoenen tokens tegelijkertijd worden verwerkt voor toepassingen zoals uitgebreide softwarecodebase-analyse en videoverwerking van een uur, waarvoor tot een miljoen tokens nodig kunnen zijn.

De processor integreert vier NVENC- en vier NVDEC-video-encoders op de chip, waardoor gestroomlijnde multimediaworkflows mogelijk zijn. NVIDIA stelt dat de Rubin CPX drie keer de aandachtsverwerkingssnelheid levert dan zijn huidige GB300 Blackwell Ultra-acceleratorsystemen. De architectuur maakt gebruik van een kostengeoptimaliseerde single-die-benadering om de productiecomplexiteit mogelijk te verminderen en tegelijkertijd de rekendichtheid te behouden. Hoewel specificaties voor de geheugenbandbreedte niet bekend zijn gemaakt, zou een 512-bits interface een doorvoersnelheid van ongeveer 1,8 TB/s kunnen opleveren met 30 Gbps GDDR7-geheugenchips.

  FaceTime-videogesprekken zijn ook mogelijk vanuit Windows en Android

NVIDIA is van plan Rubin CPX-processors te integreren in het Vera Rubin NVL144 CPX-platform, waarbij traditionele Rubin GPU’s worden gecombineerd met de gespecialiseerde CPX-varianten. Deze hybride opstelling streeft naar 8 ExaFLOPS aan geaggregeerde rekenkracht en 1,7 PB/s aan geheugenbandbreedte over een volledige rackimplementatie. Het “Kyber”-rack zal ConnectX-9-netwerkadapters met 1600G-netwerken, Spectrum6 met 102.4T-switching en co-verpakte optica bevatten.

NVIDIA brengt de Rubin CPX op de markt als een uniek exemplaar in de Rubin-familie om de complexiteit van AI-systemen op testtijdschaal aan te kunnen. Naarmate modellen evolueren naar geavanceerde redeneermiddelen, splitst de gevolgtrekking zich op tussen rekenintensieve contextverwerking en geheugenbandbreedte-afhankelijke tokengeneratie. Het CPX-ontwerp is geoptimaliseerd voor deze dubbele vereisten en verwerkt context-prefill-bewerkingen voor zakelijke chatbots met 256.000 tokens of code-analyse van meer dan 100.000 regels. Deze specialisatie is van cruciaal belang voor AI-systemen die persistent geheugen nodig hebben voor uitgebreide interacties, wat NVIDIA naadloos met deze hardware wil mogelijk maken.

  Anom, de smartphone die door de FBI wordt gebruikt om op criminelen te 'jagen'

De snelle ontwikkelingscyclus van NVIDIA heeft de financiële prestaties een boost gegeven, waarbij het bedrijf in het meest recente kwartaal $41,1 miljard aan datacenterverkopen rapporteerde.