NVIDIA GPU-Vergleich

NVIDIA B300 vs B200 vs H200 vs RTX PRO 6000
GPU-Vergleich für KI & Rechenzentren (2026)

Aktuelle und letzte Generation auf einen Blick. Tabellen direkt unten.

 

Aktuelle Generation

Data-Center-GPUs für KI & HPC

Blackwell Ultra, Blackwell und Hopper für Training, Inferenz und großskaliges HPC. NVLink, MIG und Multi-Tenant via vGPU.

Aktuelle Data-Center-GPUs
SpecB300B200H200 SXMH200 PCIeRTX PRO 6000 SE
GPU-ArchitekturNVIDIA Blackwell UltraNVIDIA BlackwellNVIDIA HopperNVIDIA HopperNVIDIA Blackwell
SegmentData Center AI & HPCData Center AI & HPCData Center AI & HPCData Center AI & HPCData Center AI & Visual Computing
Form FactorSXM6SXM6SXM5PCIePCIe
GPU-Speicher288 GB HBM3e180 GB HBM3e141 GB HBM3e141 GB HBM3e96 GB GDDR7
Speicher-Bandbreitebis 8 TB/s7,7 TB/s4,8 TB/s4,8 TB/s1,6 TB/s
Max. TDP1.200 W / 1.400 W1.200 W / 1.000 W700 W600 W400 – 600 W
NVLinkJaJaJaJaNein
Multi-Instance GPU (MIG)JaJaJaJaJa
Media-Engines7× JPEG / 7× Video Decoder7× JPEG / 7× Video Decoder7× JPEG / 7× Video Decoder7× JPEG / 7× Video Decoder4× NVENC / 4× NVDEC
vGPUJaJaJaJaJa
NVIDIA AI EnterpriseJaJaJaJaJa
Preise & EduPreis ansehenEdu / StartupPreis ansehenEdu / StartupPreis ansehenEdu / StartupPreis ansehenEdu / StartupPreis ansehenEdu / Startup
 

Workstation & Server

RTX PRO Blackwell, die ganze Familie

Vom Einsteiger-Visualisierer bis zur 96-GB-Server-Karte. Identische Architektur, fein gestaffelt nach Speicher, Leistungsaufnahme und Kühlung.

NVIDIA RTX PRO Blackwell
SpecPRO 4000PRO 4500PRO 5000PRO 5000 72 GBPRO 6000 Max-QPRO 6000 SEPRO 6000 WS
ArchitekturBlackwellBlackwellBlackwellBlackwellBlackwellBlackwellBlackwell
CUDA Cores8.96010.49614.08014.08024.06424.06424.064
Tensor Cores (5. Gen)280328400400752752752
RT Cores (4. Gen)7082100100188188188
Peak FP3267 TFLOPS67 TFLOPS110 TFLOPS120 TFLOPS125 TFLOPS
AI TOPS2.1422.1423.5114.000
RT-Core-Leistung203 TFLOPS203 TFLOPS333 TFLOPS355 TFLOPS380 TFLOPS
Speicher24 GB GDDR732 GB GDDR748 GB GDDR772 GB GDDR796 GB GDDR796 GB GDDR796 GB GDDR7
Speicher-BandbreiteTBD896 GB/s1.344 GB/s1.344 GB/s1.792 GB/s1.597 GB/s1.792 GB/s
NVLinkNeinNeinNeinNeinNeinNeinNein
KühlungBlowerBlowerBlowerBlowerBlowerPassivDouble Flow Through
NVENC / NVDEC / JPEG2 / 2 / 12 / 2 / 13 / 3 / 33 / 3 / 34 / 4 / 44 / 4 / 44 / 4 / 4
MIG-Support2× 24 / 1× 482× 36 / 1× 724× 24 / 2× 48 / 1× 964× 24 / 2× 48 / 1× 964× 24 / 2× 48 / 1× 96
Display-Ausgänge4× DP 2.1b4× DP 2.1b4× DP 2.1b4× DP 2.1b4× DP 2.1b4× DP 2.1b4× DP 2.1b
Form Factor4.4″H × 9.5″L SS / 2.7″H × 6.6″L DS4.4″H × 10.5″L DS4.4″H × 10.5″L DS4.4″H × 10.5″L DS4.4″H × 10.5″L DS4.4″H × 10.5″L DS5.4″H × 12″L XHFL DS
Max. Leistungsaufnahme140 W200 W300 WTBA300 W400 – 600 W600 W
PCIe-BusPCIe Gen 5 ×16PCIe Gen 5 ×16PCIe Gen 5 ×16PCIe Gen 5 ×16PCIe Gen 5 ×16PCIe Gen 5 ×16PCIe Gen 5 ×16
Preise & EduPreis ansehenEdu / StartupPreis ansehenEdu / StartupPreis ansehenEdu / Startupauf AnfragePreis ansehenEdu / StartupPreis ansehenEdu / StartupPreis ansehenEdu / Startup

Entscheidungshilfe

Welche GPU passt zu deinem Vorhaben?

NVIDIA RTX PRO 6000 Workstation Edition

Das passt, wenn du am eigenen Arbeitsplatz arbeitest: CAD, Rendering, lokale LLM-Inferenz und kleinere Fine-Tunes.

Eckdaten
96 GB GDDR7 · PCIe Gen 5 · Aktive Kühlung, Tower
 

Last Generation

Data Center: Ampere-Familie

Für Bestandsplanung und Migration: A100, A30, A40, A10, A16 und A2 in der Übersicht.

Letzte Generation, Data Center (Ampere)
SpecA100 / A800A30A40A10A16A2
ArchitekturAmpereAmpereAmpereAmpereAmpereAmpere
Form FactorSXM4 / PCIePCIePCIePCIePCIePCIe (LP)
GPU-Speicher40 / 80 GB HBM2e24 GB HBM248 GB GDDR6 ECC24 GB GDDR64× 16 GB GDDR616 GB GDDR6
Speicher-Bandbreitebis 2.039 GB/s933 GB/s696 GB/s600 GB/s4× 200 GB/s200 GB/s
Max. TDP300 / 400 W165 W300 W150 W250 W40 – 60 W
Einsatz-ProfilTraining, HPCTraining, InferenceVisualisierung, InferenceInference, Cloud-GamingVDI, Knowledge WorkerEdge-Inference
NVLinkJaJaNeinNeinNeinNein
MIGJa (7×)Ja (4×)NeinNeinNeinNein
vGPUJaJaJaJaJaJa
 

Last Generation

RTX Desktop: Ada Lovelace & Ampere

Workstation-GPUs der vorherigen Generation, A400 / A1000 (Ampere) und RTX 2000 – 6000 Ada.

Letzte Generation, RTX Desktop (Ada Lovelace)
SpecRTX A400RTX A1000RTX 2000 AdaRTX 4000 AdaRTX 4500 AdaRTX 5000 AdaRTX 6000 Ada
ArchitekturAmpereAmpereAda LovelaceAda LovelaceAda LovelaceAda LovelaceAda Lovelace
CUDA Cores7682.3042.8166.1447.68012.80018.176
Tensor Cores24 (3. Gen)72 (3. Gen)88 (4. Gen)192 (4. Gen)240 (4. Gen)400 (4. Gen)568 (4. Gen)
RT Cores6 (2. Gen)18 (2. Gen)22 (3. Gen)48 (3. Gen)60 (3. Gen)100 (3. Gen)142 (3. Gen)
Speicher4 GB GDDR68 GB GDDR616 GB GDDR6 ECC20 GB GDDR6 ECC24 GB GDDR6 ECC32 GB GDDR6 ECC48 GB GDDR6 ECC
Speicher-Bandbreite128 GB/s192 GB/s224 GB/s360 GB/s432 GB/s576 GB/s960 GB/s
Display-Ausgänge4× mDP 1.4a4× mDP 1.4a4× mDP 1.44× DP 1.44× DP 1.44× DP 1.44× DP 1.4
Max. Leistungsaufnahme50 W50 W70 W130 W210 W250 W300 W
Form FactorLP, SSLP, SSLP, DSSS, DSFH, DSFH, DSFH, DS

PRAXIS-INSIGHT

400 W oder 600 W: was ändert sich im Alltag?

Bei der RTX PRO 6000 Server Edition lässt sich die TDP zwischen 400 W und 600 W konfigurieren. In der Praxis ist 400 W oft die wirtschaftlichere Wahl: weniger Wärmeeintrag im Rack, weniger Last auf der Klimatisierung, längere Lebenszeit der GPU.

Die Performance-Differenz zwischen 400 W und 600 W liegt typisch bei 10–15 %, relevant nur, wenn Compute-Time wirklich limitierend ist. Für gemischte Inference-/Training-Cluster ist 400 W meist genug.

FAQ, Entscheidungs-Fragen

Häufige Fragen zur GPU-Wahl

Aus DELTA-Beratungsgesprächen: die zehn Fragen, die in jedem zweiten Projekt aufkommen, mit ehrlichen Antworten.

Was ist der Unterschied zwischen B200 und B300?+

B300 ist die „Ultra“-Variante von Blackwell. Selbe Architektur-Generation, aber 60 % mehr Speicher (288 GB statt 180 GB HBM3e), 8 TB/s statt 7,7 TB/s Bandbreite, optional bis 1.400 W TDP. Sinnvoll für Modelle, die in 180 GB nicht mehr passen (≥70B-LLMs ohne Tensor-Parallelism). Für die meisten Trainings-Cluster reicht B200, bei Bedarf später skalierbar.

Soll ich jetzt B300 kaufen oder lieber auf Vera Rubin warten?+

Vera Rubin kommt ab H2 2026 als Vera-Rubin-NVL72-Rack-Plattform. B300 bleibt darüber hinaus ein bis zwei Jahre marktrelevant, NVIDIA fährt zwei Generationen parallel. Wenn der Bedarf jetzt besteht: B300. Wenn das Projekt erst Mitte 2026 startet UND ein NVL72-Rack-System relevant ist: Vera-Rubin-NVL72 abwarten lohnt sich. Wir beraten anhand von Workload und Budgetzeitraum.

Lohnt sich H200 oder direkt Blackwell?+

H200 ist weiterhin im Markt verfügbar, hat einen ausgereiften Software-Stack und liefert solide HPC-Performance (FP64-Workloads). Bei Neuanschaffung ab Q4 2025 ist B200 in den meisten Fällen die wirtschaftlichere Wahl, Blackwell hebt FP4-Inferenz-Performance pro Watt um Faktor 2,5. H200 nur, wenn schnelle Verfügbarkeit zählt oder FP64-Schwerpunkt vorliegt.

Reicht eine RTX PRO 6000 oder muss es eine DGX-Karte sein?+

Hängt vom Workload ab. Für Inferenz, Fine-Tuning kleinerer Modelle, klassisches HPC und Visualisierung ist die RTX PRO 6000 meist das beste Preis-Leistungs-Verhältnis und passt in Standard-Server. Für Training großer Modelle (≥30B Parameter) mit hoher GPU-zu-GPU-Bandbreite ist die DGX-/HGX-Klasse mit NVLink besser geeignet. Wir helfen bei der Sizing-Entscheidung anhand des konkreten Workloads.

Warum nicht einfach Consumer-Karten wie RTX 4090/5090 nehmen?+

Drei Gründe: (1) NVIDIAs Lizenzbedingungen schließen Consumer-Karten von Datacenter-Nutzung aus, produktiv riskant. (2) Kein ECC-Speicher: bei langen Trainings sind Bit-Flips möglich, die Modelle still korrumpieren. (3) Kein vGPU, kein NVIDIA AI Enterprise, keine Enterprise-Support-Verträge. Im Lab kurzzeitig OK, im Produktivbetrieb nicht.

Welche Karte passt in meinen vorhandenen Server?+

PCIe-Karten (H200 PCIe, RTX PRO 6000) passen in Standard-Server mit ausreichend Slot-Space, PCIe-Gen-5-Lanes und Stromzufuhr. SXM-Karten (B200, B300, H200 SXM) brauchen spezielle SXM-Baseboards, diese sind in HGX-/DGX-Servern verbaut, nicht in Standard-Servern nachrüstbar. Wenn unsicher: Server-Modell und Stromversorgung mitteilen, wir prüfen Kompatibilität vor dem Angebot.

Brauche ich Liquid-Cooling im Rechenzentrum?+

Bei SXM-Karten der Blackwell-Generation (B200, B300) ab etwa 1.000 W TDP: ja, Direct-Liquid-Cooling ist Pflicht. PCIe-Karten bis 600 W: Air-Cooling reicht in den meisten Server-Chassis mit ausreichendem Front-to-Back-Airflow. Bei Liquid-Bedarf planen wir Coolant Distribution Units und Anschluss an die Gebäudekühlung mit ein.

Welche Stromversorgung pro Karte und pro Rack?+

RTX PRO 6000 Server Edition: 400–600 W konfigurierbar. H200: 600–700 W. B200: 1.000–1.200 W. B300: 1.200–1.400 W. Bei Mehr-GPU-Servern entsprechend hochrechnen, plus Host-CPU und Storage. Wir liefern eine Power-Bilanz mit dem Angebot, Inklusive PDU-Empfehlung.

Sind Edu-, Forschungs- oder Startup-Preise möglich?+

Ja. Über NVIDIA Inception (Startups) und Education-Programme. DELTA reicht qualifizierte Kunden direkt ein. Konditionen abhängig von Volumen und Förderprogramm, Anfrage über das Kontaktformular oder direkt an Ihren DELTA-Ansprechpartner.

Wie schnell bekomme ich die Karten geliefert?+

NVIDIA-allocation-abhängig. Stand 2026-Q2: B300/B200 typisch 12–16 Wochen, RTX PRO 6000 etwa 4–8 Wochen, H200 noch ab Bestand. Edu- und Forschungs-Kontingente teilweise schneller. Wir teilen die aktuelle Allocation-Lage pro Anfrage mit, damit Projektzeitplan und Beschaffung zueinander passen.

Kann ich klein anfangen und später erweitern?+

Ja. Du startest mit einer NVIDIA RTX PRO 6000 Workstation oder Server Edition und skalierst, wenn der Bedarf wächst: mehr Karten im Server, später DGX-Knoten mit NVLink, bis zum NVL72-Rack. So bindest du dich nicht früh an eine teure Maximal-Ausbaustufe.

Brauche ich FP64 für meine Simulationen?+

Das hängt von der Workload ab. Wenn doppelte Genauigkeit Pflicht ist, etwa bei CFD, Molekulardynamik oder vielen numerischen Verfahren, ist die NVIDIA H200 die richtige Wahl, sie ist auf FP64 stark. Reines Machine Learning und Mixed-Precision-Training laufen dagegen schneller auf den Blackwell-Karten wie RTX PRO 6000 oder DGX B200/B300.

Sie sind sich unsicher, welche GPU?

Wir konfigurieren passend zu Workload, Bestandsumgebung und Beschaffungsweg. Inklusive Edu- und Startup-Konditionen sowie optionalem Test im DELTA Test-Centre Glinde.