GTC 2024 is met een knaller begonnen en NVIDIA heeft zijn volgende generatie AI-versnellers onthuld, de B200 En GB200 GPU’s, gebouwd op de baanbrekende Blackwell-architectuur.
Deze processors vertegenwoordigen een enorme stap in AI-computing, ontworpen om de steeds groeiende complexiteit van moderne workloads aan te pakken.
De B200 beschikt over een monolithisch ontwerp met een recordaantal transistors, terwijl de GB200 een multi-chipbenadering hanteert, waarbij de kracht van meerdere B200’s wordt gecombineerd met een Grace CPU voor ongeëvenaarde prestaties.
Samen bieden deze GPU’s een dramatische toename van de verwerkingskracht en geheugencapaciteit, waardoor de weg wordt vrijgemaakt voor vooruitgang op tal van gebieden die sterk afhankelijk zijn van kunstmatige intelligentie.
Het monolithische wonder NVIDIA B200
De NVIDIA B200 is een technisch meesterwerk, met maar liefst 208 miljard transistors. Deze opmerkelijke prestatie wordt mogelijk gemaakt door het chipletontwerp, waarbij twee massieve matrijzen naadloos zijn geïntegreerd.
De B200 is een rekenkrachtpatser en biedt een drievoudige toename van de uiterst nauwkeurige rekenprestaties van de FP64 in vergelijking met zijn op Hopper gebaseerde voorganger.
Misschien wel het meest opvallend is het vermogen van de B200 voor AI-afleidingstaken.
NVIDIA-claims deze GPU levert een verbluffende vijfvoudige verbetering ten opzichte van de H200. Deze prestatiesprong is aanzienlijk voor de inzet van grote taalmodellen (LLM’s) en andere AI-toepassingen die sterk afhankelijk zijn van gevolgtrekkingen.
Voor tech-magnaten onder ons: hier is elk technisch detail van de Nvidia B200:
Specificatie | Details |
Architectuur | Zwartwel |
Fabricageproces | TSMC N4P (aangepaste 4nm-klasse) |
Transistortelling | 208 miljard (over twee chiplets) |
Geheugentype | HBM3E |
Geheugencapaciteit | 192 GB (8 x 24 GB-stapels) |
Geheugenbandbreedte | 8 TB/sec |
NVLink-interface | 1,8 TB/s |
FP64-rekenprestaties | 3x verbetering ten opzichte van H100 |
Prestaties van AI-inferentie | 5x verbetering ten opzichte van H100 |
GB200 combineert Grace- en Blackwell-architecturen
De GB200 gaat nog een stap verder met het concept van een ‘superchip’ door de kracht van twee B200 GPU’s te combineren met een Grace CPU via een NVLink-chip-naar-chip-interconnect met ultralaag vermogen.
Deze configuratie levert nog indrukwekkendere prestaties en geheugencapaciteit, afgestemd op de meest veeleisende AI-workloads.
De GB200-functies omvatten:
- Enorme geheugencapaciteit: Ontworpen om te voldoen aan de geheugenvereisten van een AI-model met biljoen parameters
- Hogesnelheidsnetwerken: Ondersteuning voor NVIDIA Quantum-X800 InfiniBand en Spectrum-X800 Ethernet-platforms met ultrasnelle snelheden van 800 Gb/s
- Schaalbaarheid met meerdere knooppunten: De GB200 vormt de basis van de NVIDIA GB200 NVL72, een vloeistofgekoeld rack-scale systeem voor de hoogste niveaus van rekenintensiteit
Hier is een kort overzicht van de specificaties van de GB200:
Specificatie | Details |
Architectuur | Zwartwel |
Componenten | 2x B200 GPU’s + NVIDIA Grace CPU |
Onderling verbinden | 900 GB/s NVLink met ultralaag vermogen (chip-naar-chip) |
Geheugencapaciteit | 384 GB HBM3E |
Totale geheugenbandbreedte | 16 TB/sec |
Netwerkondersteuning | NVIDIA Quantum-X800 InfiniBand (800 Gb/s), Spectrum-X800 Ethernet (800 Gb/s) |
Systeem configuratie | GB200 NVL72 (vloeistofgekoeld, rack-scale) |
De potentiële impact van de B200 en GB200 strekt zich uit over tal van industrieën en toepassingen.
Hun krachtige versnelling is ideaal voor het trainen en inzetten van de enorme generatieve AI-modellen die de manier veranderen waarop we kunst, tekst, code en meer maken.
De B200/GB200 biedt verbeterde services op gebieden als natuurlijke taalverwerking en aanbevelingssystemen. Onderzoekers zullen ook precisie en snelheid krijgen op gebieden als de ontdekking van geneesmiddelen, klimaatmodellering en materiaalkunde.
Blackwell op schaal
NVIDIA heeft tegelijkertijd de DGX SuperPOD, speciaal gebouwd om de kracht van GB200 Grace Blackwell Superchips te benutten. Deze kant-en-klare oplossing biedt een geoptimaliseerd platform voor het schalen van generatieve AI-workloads met toonaangevende betrouwbaarheid.
De toekomst van AI-versnelling
De NVIDIA B200 en GB200 vertegenwoordigen een grote vooruitgang op het gebied van AI-computing en markeren een nieuw hoogtepunt in krachtige acceleratieoplossingen.
Deze baanbrekende GPU’s, met hun prestatie- en geheugenvoordelen, staan klaar om innovatie te stimuleren en de grenzen te verleggen van wat mogelijk is in tal van sectoren.
Uitgelicht beeldtegoed: pvproducties/Freepik.
Source: NVIDIA heeft zojuist zijn volgende generatie B200- en GB200 AI-chips gelanceerd