Xinnor

Moderne KI-Innovationen erfordern eine geeignete Infrastruktur, insbesondere hinsichtlich des Datendurchsatzes und der Speicherkapazitäten. Während GPUs schnellere Ergebnisse liefern, hinken herkömmliche Speicherlösungen oft hinterher, was zu einer ineffizienten Ressourcennutzung und längeren Projektlaufzeiten führt. Herkömmliche Unternehmensspeicher oder auf HPC ausgerichtete parallele Dateisysteme sind kostspielig und für KI-Einsätze schwierig zu verwalten. Leistungsstarke Speichersysteme können die Trainingszeit für KI-Modelle erheblich verkürzen. Verzögerungen beim Datenzugriff können sich auch auf die Genauigkeit von KI-Modellen auswirken, was die entscheidende Rolle der Speicherleistung unterstreicht.

InfiniBand mit xiRAID, um die volle Leistung der NVIDIA DGX zu nutzen


Xinnor hat sich mit DELTA Computer Products GmbH zusammengeschlossen, um eine Hochleistungslösung speziell für KI- und HPC-Aufgaben zu entwickeln.


Durch den Einsatz von hochleistungsfähigen NVMe-Laufwerken von Micron, effizientem Software-RAID von Xinnor und 400 Gbit InfiniBand-Controllern von NVIDIA gewährleistet das von Delta entwickelte System über NFSoRDMA-Schnittstellen sowohl für Lese- als auch für Schreibvorgänge ein hohes Leistungsniveau, das entscheidend ist, um die für KI-Projekte typischen Checkpoint-Zeiten zu verkürzen und mögliche Laufwerksausfälle zu bewältigen.
NFSoRDMA ermöglicht den parallelen Lese- und Schreibzugriff auf mehrere Knoten gleichzeitig.

Hardware der Testumgebung

Der von DELTA verwendete 2U Dual Socket Server, der mit 24x 7450 NVMe 15.36 TB von Micron ausgestattet ist, ermöglicht bis zu 368 TB SSD Speicher und bietet theoretische Zugriffsgeschwindigkeiten von bis zu 50 GB/s.
In dem Whitepaper wird erläutert, wie das Testsystem mit xiRAID konfiguriert wird, um die InfiniBand-Bandbreite auszunutzen und die bestmögliche Leistung der NVIDIA DGX H100-Systeme zu erzielen.

Außerdem werden die Möglichkeiten der xiRAID Software vorgestellt. xiRAID ist eine umfassende Software-RAID-Engine, die eine Reihe von Funktionen bietet, die auf eine Vielzahl von Speicheranforderungen zugeschnitten sind.

Test-Server

DELTA - D22z-M2-ZG

System: D22z-M2-ZG
CPU: 32 Kerne - 2x AMD EPYC 9124
RAM: 768 GB (24x 32GB DDR5-4800)
Boot Drive: 2x Micron 7450 Pro (960 GB)
Storage: 24x Micron 7450 Pro (15.36 TB)
Network: NVIDIA ConnectX-7 400 Gbit
Betriebssystem: Ubuntu 22.04.4 LTS (Jammy Jellfish)
RAID: xiRAID 4.0.3

 

Client 1

DGX H100

CPU: 112 Kerne - 2x Intel Xeon 8480C
GPU Memory: 640 GB
Boot Drive: 2x NVMe M.2 (1.9TB)
Storage: 8x NVMe U.2 (3.84 TB)
Network: NVIDIA ConnectX-7 400 Gbit
Betriebssystem: Ubuntu 22.04

 

Client 2

DGX H100

CPU: 112 Kerne - 2x Intel Xeon 8480C
GPU Memory: 640 GB
Boot Drive: 2x NVMe M.2 (1.9TB)
Storage: 8x NVMe U.2 (3.84 TB)
Network: NVIDIA ConnectX-7 400 Gbit
Betriebssystem: Ubuntu 22.04

 

xinnor-logo

Weitere Lösungsvorschläge

Technologie

Industrie

Haben Sie Fragen zu der Testumgebung oder Softwareprodukten von Xinnor, helfen oder geben wir Ihnen dazu gerne eine Auskunft.  Gerne können Sie auch den Live Chat Button rechts unten auf der Webseite nutzen.
Kontakt:   
Tel: +49 40 300672 - 0    |   Fax: +49 40 300672 - 11   |   E-Mail: info[at]delta.de