Flexibler Supercomputer beschleunigt die Forschung

06.09.2012

Flexibler Supercomputer beschleunigt die Forschung

TU Darmstadt unterzeichnet Kaufvertrag für neuen IBM Hochleistungsrechner

Die TU Darmstadt kauft einen neuen Hochleistungsrechner, der außergewöhnlich vielseitig ist. Am vergangenen Montag, 3. September, haben Professorin Petra Gehring, Vizepräsidentin der TU Darmstadt und Dr. Sven Löschenkohl, Bereichsleiter Öffentlicher Sektor der Firma IBM, den Kaufvertrag unterzeichnet.

Professorin Petra Gehring, Vizepräsidentin der TU Darmstadt und Dr. Sven Löschenkohl, Bereichsleiter Öffentlicher Sektor der Firma IBM nach der Unterzeichnung der Kaufvertrages für den neuen Hochleistungsrechner. Bild: Patrick Bal
Professorin Petra Gehring, Vizepräsidentin der TU Darmstadt und Dr. Sven Löschenkohl, IBM nach der Unterzeichnung des Kaufvertrages für den neuen Hochleistungsrechner. Bild: TU Darmstadt

Treibstoff sparende Autos entwickeln, elektronische Bauteile effizient kühlen, neue chemische Substanzen schaffen: Simulationen und Berechnungen am Computer sind in vielen Forschungsgebieten unverzichtbar. So vielfältig wie die Themen, so vielfältig sind die Anwendungs- und Simulationsprogramme, die die Wissenschaftler benötigen. Der neue Hochleistungsrechner der TU Darmstadt vereint daher unterschiedliche Rechnerarchitekturen, um die verschiedenen Programme mit ihren komplexen Algorithmen effizient zu nutzen.

Die Firma IBM baut den neuen Hochleistungsrechner in mehreren Phasen auf: Im Januar 2013 geht der erste Teil des Rechners mit rund 800 Rechenknoten in Betrieb. Bis Dezember 2014 wird der Rechnerkomplex ausgebaut. Bis der Hochleistungsrechner komplett ausgestattet ist, wird er rund 15 Millionen Euro kosten. Der Bund und das Land Hessen tragen diese Kosten jeweils zur Hälfte (Förderung nach Art. 91b GG).

Für jede Aufgabe die passende Architektur

Im neuen Hochleistungsrechner der TU Darmstadt wird es in der ersten Phase über 700 Rechenknoten für Anwendungen mit Message Passing Interface (MPI) geben, der heute gängigsten Art der Programm-Parallelisierung. Jeder der MPI-Rechenknoten ist mit zwei Prozessoren ausgestattet, die wiederum je acht Rechenkerne und 32 Gigabyte Hauptspeicher enthalten. Sie sind für einen großen Teil der typischen Simulations-Anwendungen gedacht, die viel Rechenleistung (viele hundert bis tausend Rechenkerne) benötigen.

Vier so genannte MEM-Rechenknoten werden für Aufgaben zur Verfügung stehen, die viel Hauptspeicher, auf Englisch Memory (MEM), benötigen und auf diesen schnell zugreifen müssen. Jeder der vier MEM-Rechenknoten besteht aus acht Prozessoren mit je acht Kernen und insgesamt 1024 Gigabyte Hauptspeicher. Typische Anwendungen sind beispielsweise Gittergeneratoren für große Simulationsmodelle oder Anwendungen, deren Lastprofil stark dynamisch und nicht vorhersehbar ist.

Darüber hinaus gibt es 64 ACC-Rechenknoten für Anwendungen, die die Architektur von Rechenbeschleunigern, sogenannten Akzeleratoren (ACC), nutzen. Jeder ACC-Rechenknoten enthält zwei Prozessoren und zwei Akzeleratoren, wobei es sich um zwei unterschiedliche Arten von Akzeleratoren handelt: Zum einen werden Hochleistungs-Grafikchips der Generation Kepler von NVIDIA eingesetzt, zum anderen ein neues Konzept in Form stark verdichteter Prozessoren mit sehr vielen Rechenkernen, basierend auf der Intel Xeon Phi-Architektur. Anwendungen aus der Biologie und der Chemie werden hiervon besonders profitieren.

768 Terabyte Festplattenspeicher mit einer Lese- und Schreibgeschwindigkeit von 20 Gigabyte pro Sekunde stehen den Wissenschaftlern für das schnelle Zwischenspeichern während der Berechnungen und Simulationen zur Verfügung. Für das längerfristige Ablegen wichtiger Daten und Programme sind 500 Terabyte Speicherplatz mit einer Lese- und Schreibgeschwindigkeit von bis zu 5 Gigabyte pro Sekunde vorhanden.

Innovative Wasserkühlung

Ein besonders schnelles Netzwerk mit Mellanox FDR-Infiniband-Technologie verbindet die Rechen- und Speicherkomponenten. Es ist über 50 Mal so schnell wie die übliche Rechnervernetzung und besonders für die effiziente Übertragung sehr vieler, sehr kleiner Nachrichten geeignet. Somit trägt es wesentlich zur Leistungsfähigkeit des Gesamtsystems bei. Wer viel rechnet, produziert viel Wärme. Das hoch effiziente IBM-Kühlsystem iDataplex mit wassergekühlten Rücktüren sorgt dafür, dass diese Wärme sinnvoll abgeleitet wird.

Die vielfältige Architektur unterstützt neben der effizienten Ausführung der Programme auf der für sie passenden Architektur auch die Entwicklung neuer Programme für Parallelrechner, weil ein Entwickler das für seine Algorithmik passende Programmiermodell nutzen und so seine Produktivität bei der Softwareentwicklung optimieren kann. Da die typische Lebensdauer, z.B. von komplexen Ingenieursanwendungen, mehrere Rechnergenerationen umfasst, ist dies besonders wichtig.

Die effiziente Nutzung der Hochleistungsrechner erfordert deshalb eine Verzahnung von Algorithmik, Softwaretechnik und Anwendungswissen, wie sie an der TU Darmstadt in der Graduiertenschule Computational Engineering vertreten ist. In einer Forschungskooperation zwischen der TU Darmstadt und IBM wird die Rechenleistung der Programme optimiert, die für die TU Darmstadt besonders wichtig sind.

zur Liste