Um Ihnen die Funktionen unseres Online-Shops uneingeschränkt anbieten zu können setzen wir Cookies ein. Weitere Informationen
NVIDIA GPU-Vergleich
NVIDIA B300 vs B200 vs H200 vs RTX PRO 6000
GPU-Vergleich für KI & Rechenzentren (2026)
Aktuelle und letzte Generation auf einen Blick. Tabellen direkt unten.
Aktuelle Generation
Data-Center-GPUs für KI & HPC
Blackwell Ultra, Blackwell und Hopper für Training, Inferenz und großskaliges HPC. NVLink, MIG und Multi-Tenant via vGPU.
| Spec | B300 | B200 | H200 SXM | H200 PCIe | RTX PRO 6000 SE |
|---|---|---|---|---|---|
| GPU-Architektur | NVIDIA Blackwell Ultra | NVIDIA Blackwell | NVIDIA Hopper | NVIDIA Hopper | NVIDIA Blackwell |
| Segment | Data Center AI & HPC | Data Center AI & HPC | Data Center AI & HPC | Data Center AI & HPC | Data Center AI & Visual Computing |
| Form Factor | SXM6 | SXM6 | SXM5 | PCIe | PCIe |
| GPU-Speicher | 288 GB HBM3e | 180 GB HBM3e | 141 GB HBM3e | 141 GB HBM3e | 96 GB GDDR7 |
| Speicher-Bandbreite | bis 8 TB/s | 7,7 TB/s | 4,8 TB/s | 4,8 TB/s | 1,6 TB/s |
| Max. TDP | 1.200 W / 1.400 W | 1.200 W / 1.000 W | 700 W | 600 W | 400 – 600 W |
| NVLink | Ja | Ja | Ja | Ja | Nein |
| Multi-Instance GPU (MIG) | Ja | Ja | Ja | Ja | Ja |
| Media-Engines | 7× JPEG / 7× Video Decoder | 7× JPEG / 7× Video Decoder | 7× JPEG / 7× Video Decoder | 7× JPEG / 7× Video Decoder | 4× NVENC / 4× NVDEC |
| vGPU | Ja | Ja | Ja | Ja | Ja |
| NVIDIA AI Enterprise | Ja | Ja | Ja | Ja | Ja |
| Preise & Edu | Preis ansehenEdu / Startup | Preis ansehenEdu / Startup | Preis ansehenEdu / Startup | Preis ansehenEdu / Startup | Preis ansehenEdu / Startup |
Workstation & Server
RTX PRO Blackwell, die ganze Familie
Vom Einsteiger-Visualisierer bis zur 96-GB-Server-Karte. Identische Architektur, fein gestaffelt nach Speicher, Leistungsaufnahme und Kühlung.
| Spec | PRO 4000 | PRO 4500 | PRO 5000 | PRO 5000 72 GB | PRO 6000 Max-Q | PRO 6000 SE | PRO 6000 WS |
|---|---|---|---|---|---|---|---|
| Architektur | Blackwell | Blackwell | Blackwell | Blackwell | Blackwell | Blackwell | Blackwell |
| CUDA Cores | 8.960 | 10.496 | 14.080 | 14.080 | 24.064 | 24.064 | 24.064 |
| Tensor Cores (5. Gen) | 280 | 328 | 400 | 400 | 752 | 752 | 752 |
| RT Cores (4. Gen) | 70 | 82 | 100 | 100 | 188 | 188 | 188 |
| Peak FP32 | — | — | 67 TFLOPS | 67 TFLOPS | 110 TFLOPS | 120 TFLOPS | 125 TFLOPS |
| AI TOPS | — | — | 2.142 | 2.142 | 3.511 | — | 4.000 |
| RT-Core-Leistung | — | — | 203 TFLOPS | 203 TFLOPS | 333 TFLOPS | 355 TFLOPS | 380 TFLOPS |
| Speicher | 24 GB GDDR7 | 32 GB GDDR7 | 48 GB GDDR7 | 72 GB GDDR7 | 96 GB GDDR7 | 96 GB GDDR7 | 96 GB GDDR7 |
| Speicher-Bandbreite | TBD | 896 GB/s | 1.344 GB/s | 1.344 GB/s | 1.792 GB/s | 1.597 GB/s | 1.792 GB/s |
| NVLink | Nein | Nein | Nein | Nein | Nein | Nein | Nein |
| Kühlung | Blower | Blower | Blower | Blower | Blower | Passiv | Double Flow Through |
| NVENC / NVDEC / JPEG | 2 / 2 / 1 | 2 / 2 / 1 | 3 / 3 / 3 | 3 / 3 / 3 | 4 / 4 / 4 | 4 / 4 / 4 | 4 / 4 / 4 |
| MIG-Support | — | — | 2× 24 / 1× 48 | 2× 36 / 1× 72 | 4× 24 / 2× 48 / 1× 96 | 4× 24 / 2× 48 / 1× 96 | 4× 24 / 2× 48 / 1× 96 |
| Display-Ausgänge | 4× DP 2.1b | 4× DP 2.1b | 4× DP 2.1b | 4× DP 2.1b | 4× DP 2.1b | 4× DP 2.1b | 4× DP 2.1b |
| Form Factor | 4.4″H × 9.5″L SS / 2.7″H × 6.6″L DS | 4.4″H × 10.5″L DS | 4.4″H × 10.5″L DS | 4.4″H × 10.5″L DS | 4.4″H × 10.5″L DS | 4.4″H × 10.5″L DS | 5.4″H × 12″L XHFL DS |
| Max. Leistungsaufnahme | 140 W | 200 W | 300 W | TBA | 300 W | 400 – 600 W | 600 W |
| PCIe-Bus | PCIe Gen 5 ×16 | PCIe Gen 5 ×16 | PCIe Gen 5 ×16 | PCIe Gen 5 ×16 | PCIe Gen 5 ×16 | PCIe Gen 5 ×16 | PCIe Gen 5 ×16 |
| Preise & Edu | Preis ansehenEdu / Startup | Preis ansehenEdu / Startup | Preis ansehenEdu / Startup | auf Anfrage | Preis ansehenEdu / Startup | Preis ansehenEdu / Startup | Preis ansehenEdu / Startup |
Entscheidungshilfe
Welche GPU passt zu deinem Vorhaben?
NVIDIA RTX PRO 6000 Workstation Edition
Das passt, wenn du am eigenen Arbeitsplatz arbeitest: CAD, Rendering, lokale LLM-Inferenz und kleinere Fine-Tunes.
NVIDIA RTX PRO 6000 Server Edition
Das passt, wenn du Inferenz im Server skalierst: Multi-User, RAG und Fine-Tuning bis 30B, ohne Liquid-Cooling.
NVIDIA DGX B200 & NVIDIA DGX B300
Das passt, wenn du eigene Modelle von 30B bis 70B trainierst oder fine-tunest, mit hohem GPU-zu-GPU-Datenaustausch.
NVIDIA Vera Rubin NVL8
Das passt, wenn du heute schon auf die nächste Plattform-Generation für Foundation-Model-Training planst.
NVIDIA DGX B300 NVL72
Das passt, wenn du Cluster- oder Rechenzentrums-Infrastruktur für 100B+-Modelle aufbaust, Hyperscaler-Grade.
NVIDIA H200
Das passt, wenn FP64-Genauigkeit oder besonders große Inferenz im Vordergrund steht.
Last Generation
Data Center: Ampere-Familie
Für Bestandsplanung und Migration: A100, A30, A40, A10, A16 und A2 in der Übersicht.
| Spec | A100 / A800 | A30 | A40 | A10 | A16 | A2 |
|---|---|---|---|---|---|---|
| Architektur | Ampere | Ampere | Ampere | Ampere | Ampere | Ampere |
| Form Factor | SXM4 / PCIe | PCIe | PCIe | PCIe | PCIe | PCIe (LP) |
| GPU-Speicher | 40 / 80 GB HBM2e | 24 GB HBM2 | 48 GB GDDR6 ECC | 24 GB GDDR6 | 4× 16 GB GDDR6 | 16 GB GDDR6 |
| Speicher-Bandbreite | bis 2.039 GB/s | 933 GB/s | 696 GB/s | 600 GB/s | 4× 200 GB/s | 200 GB/s |
| Max. TDP | 300 / 400 W | 165 W | 300 W | 150 W | 250 W | 40 – 60 W |
| Einsatz-Profil | Training, HPC | Training, Inference | Visualisierung, Inference | Inference, Cloud-Gaming | VDI, Knowledge Worker | Edge-Inference |
| NVLink | Ja | Ja | Nein | Nein | Nein | Nein |
| MIG | Ja (7×) | Ja (4×) | Nein | Nein | Nein | Nein |
| vGPU | Ja | Ja | Ja | Ja | Ja | Ja |
Last Generation
RTX Desktop: Ada Lovelace & Ampere
Workstation-GPUs der vorherigen Generation, A400 / A1000 (Ampere) und RTX 2000 – 6000 Ada.
| Spec | RTX A400 | RTX A1000 | RTX 2000 Ada | RTX 4000 Ada | RTX 4500 Ada | RTX 5000 Ada | RTX 6000 Ada |
|---|---|---|---|---|---|---|---|
| Architektur | Ampere | Ampere | Ada Lovelace | Ada Lovelace | Ada Lovelace | Ada Lovelace | Ada Lovelace |
| CUDA Cores | 768 | 2.304 | 2.816 | 6.144 | 7.680 | 12.800 | 18.176 |
| Tensor Cores | 24 (3. Gen) | 72 (3. Gen) | 88 (4. Gen) | 192 (4. Gen) | 240 (4. Gen) | 400 (4. Gen) | 568 (4. Gen) |
| RT Cores | 6 (2. Gen) | 18 (2. Gen) | 22 (3. Gen) | 48 (3. Gen) | 60 (3. Gen) | 100 (3. Gen) | 142 (3. Gen) |
| Speicher | 4 GB GDDR6 | 8 GB GDDR6 | 16 GB GDDR6 ECC | 20 GB GDDR6 ECC | 24 GB GDDR6 ECC | 32 GB GDDR6 ECC | 48 GB GDDR6 ECC |
| Speicher-Bandbreite | 128 GB/s | 192 GB/s | 224 GB/s | 360 GB/s | 432 GB/s | 576 GB/s | 960 GB/s |
| Display-Ausgänge | 4× mDP 1.4a | 4× mDP 1.4a | 4× mDP 1.4 | 4× DP 1.4 | 4× DP 1.4 | 4× DP 1.4 | 4× DP 1.4 |
| Max. Leistungsaufnahme | 50 W | 50 W | 70 W | 130 W | 210 W | 250 W | 300 W |
| Form Factor | LP, SS | LP, SS | LP, DS | SS, DS | FH, DS | FH, DS | FH, DS |
PRAXIS-INSIGHT
400 W oder 600 W: was ändert sich im Alltag?
Bei der RTX PRO 6000 Server Edition lässt sich die TDP zwischen 400 W und 600 W konfigurieren. In der Praxis ist 400 W oft die wirtschaftlichere Wahl: weniger Wärmeeintrag im Rack, weniger Last auf der Klimatisierung, längere Lebenszeit der GPU.
Die Performance-Differenz zwischen 400 W und 600 W liegt typisch bei 10–15 %, relevant nur, wenn Compute-Time wirklich limitierend ist. Für gemischte Inference-/Training-Cluster ist 400 W meist genug.
FAQ, Entscheidungs-Fragen
Häufige Fragen zur GPU-Wahl
Aus DELTA-Beratungsgesprächen: die zehn Fragen, die in jedem zweiten Projekt aufkommen, mit ehrlichen Antworten.
Was ist der Unterschied zwischen B200 und B300?+
B300 ist die „Ultra“-Variante von Blackwell. Selbe Architektur-Generation, aber 60 % mehr Speicher (288 GB statt 180 GB HBM3e), 8 TB/s statt 7,7 TB/s Bandbreite, optional bis 1.400 W TDP. Sinnvoll für Modelle, die in 180 GB nicht mehr passen (≥70B-LLMs ohne Tensor-Parallelism). Für die meisten Trainings-Cluster reicht B200, bei Bedarf später skalierbar.
Soll ich jetzt B300 kaufen oder lieber auf Vera Rubin warten?+
Vera Rubin kommt ab H2 2026 als Vera-Rubin-NVL72-Rack-Plattform. B300 bleibt darüber hinaus ein bis zwei Jahre marktrelevant, NVIDIA fährt zwei Generationen parallel. Wenn der Bedarf jetzt besteht: B300. Wenn das Projekt erst Mitte 2026 startet UND ein NVL72-Rack-System relevant ist: Vera-Rubin-NVL72 abwarten lohnt sich. Wir beraten anhand von Workload und Budgetzeitraum.
Lohnt sich H200 oder direkt Blackwell?+
H200 ist weiterhin im Markt verfügbar, hat einen ausgereiften Software-Stack und liefert solide HPC-Performance (FP64-Workloads). Bei Neuanschaffung ab Q4 2025 ist B200 in den meisten Fällen die wirtschaftlichere Wahl, Blackwell hebt FP4-Inferenz-Performance pro Watt um Faktor 2,5. H200 nur, wenn schnelle Verfügbarkeit zählt oder FP64-Schwerpunkt vorliegt.
Reicht eine RTX PRO 6000 oder muss es eine DGX-Karte sein?+
Hängt vom Workload ab. Für Inferenz, Fine-Tuning kleinerer Modelle, klassisches HPC und Visualisierung ist die RTX PRO 6000 meist das beste Preis-Leistungs-Verhältnis und passt in Standard-Server. Für Training großer Modelle (≥30B Parameter) mit hoher GPU-zu-GPU-Bandbreite ist die DGX-/HGX-Klasse mit NVLink besser geeignet. Wir helfen bei der Sizing-Entscheidung anhand des konkreten Workloads.
Warum nicht einfach Consumer-Karten wie RTX 4090/5090 nehmen?+
Drei Gründe: (1) NVIDIAs Lizenzbedingungen schließen Consumer-Karten von Datacenter-Nutzung aus, produktiv riskant. (2) Kein ECC-Speicher: bei langen Trainings sind Bit-Flips möglich, die Modelle still korrumpieren. (3) Kein vGPU, kein NVIDIA AI Enterprise, keine Enterprise-Support-Verträge. Im Lab kurzzeitig OK, im Produktivbetrieb nicht.
Welche Karte passt in meinen vorhandenen Server?+
PCIe-Karten (H200 PCIe, RTX PRO 6000) passen in Standard-Server mit ausreichend Slot-Space, PCIe-Gen-5-Lanes und Stromzufuhr. SXM-Karten (B200, B300, H200 SXM) brauchen spezielle SXM-Baseboards, diese sind in HGX-/DGX-Servern verbaut, nicht in Standard-Servern nachrüstbar. Wenn unsicher: Server-Modell und Stromversorgung mitteilen, wir prüfen Kompatibilität vor dem Angebot.
Brauche ich Liquid-Cooling im Rechenzentrum?+
Bei SXM-Karten der Blackwell-Generation (B200, B300) ab etwa 1.000 W TDP: ja, Direct-Liquid-Cooling ist Pflicht. PCIe-Karten bis 600 W: Air-Cooling reicht in den meisten Server-Chassis mit ausreichendem Front-to-Back-Airflow. Bei Liquid-Bedarf planen wir Coolant Distribution Units und Anschluss an die Gebäudekühlung mit ein.
Welche Stromversorgung pro Karte und pro Rack?+
RTX PRO 6000 Server Edition: 400–600 W konfigurierbar. H200: 600–700 W. B200: 1.000–1.200 W. B300: 1.200–1.400 W. Bei Mehr-GPU-Servern entsprechend hochrechnen, plus Host-CPU und Storage. Wir liefern eine Power-Bilanz mit dem Angebot, Inklusive PDU-Empfehlung.
Sind Edu-, Forschungs- oder Startup-Preise möglich?+
Ja. Über NVIDIA Inception (Startups) und Education-Programme. DELTA reicht qualifizierte Kunden direkt ein. Konditionen abhängig von Volumen und Förderprogramm, Anfrage über das Kontaktformular oder direkt an Ihren DELTA-Ansprechpartner.
Wie schnell bekomme ich die Karten geliefert?+
NVIDIA-allocation-abhängig. Stand 2026-Q2: B300/B200 typisch 12–16 Wochen, RTX PRO 6000 etwa 4–8 Wochen, H200 noch ab Bestand. Edu- und Forschungs-Kontingente teilweise schneller. Wir teilen die aktuelle Allocation-Lage pro Anfrage mit, damit Projektzeitplan und Beschaffung zueinander passen.
Kann ich klein anfangen und später erweitern?+
Ja. Du startest mit einer NVIDIA RTX PRO 6000 Workstation oder Server Edition und skalierst, wenn der Bedarf wächst: mehr Karten im Server, später DGX-Knoten mit NVLink, bis zum NVL72-Rack. So bindest du dich nicht früh an eine teure Maximal-Ausbaustufe.
Brauche ich FP64 für meine Simulationen?+
Das hängt von der Workload ab. Wenn doppelte Genauigkeit Pflicht ist, etwa bei CFD, Molekulardynamik oder vielen numerischen Verfahren, ist die NVIDIA H200 die richtige Wahl, sie ist auf FP64 stark. Reines Machine Learning und Mixed-Precision-Training laufen dagegen schneller auf den Blackwell-Karten wie RTX PRO 6000 oder DGX B200/B300.
Sie sind sich unsicher, welche GPU?
Wir konfigurieren passend zu Workload, Bestandsumgebung und Beschaffungsweg. Inklusive Edu- und Startup-Konditionen sowie optionalem Test im DELTA Test-Centre Glinde.