Wertvolle Daten

Forschungsdatenmanagement an der TU Darmstadt

11.12.2019 von

Bei der universitären Forschung entstehen große Mengen an aufwändig erhobenen Daten. Mit einem professionellen Forschungsdatenmanagement sorgt die TU Darmstadt dafür, dass die gesammelten Daten langfristig gespeichert und für weitere Forschung nutzbar gemacht werden.

In den Forschungsinstituten an der TU entstehen ständig neue Daten – wie hier am Sonderforschungsbereich 1194 „Wechselseitige Beeinflussung von Transport- und Benetzungsvorgängen“.

Überall an der TU Darmstadt entstehen Daten. Besonders wertvolle Daten werden in der Forschung generiert – sie sind meist einmalig und mit viel Aufwand erhoben, verarbeitet, ausgewertet und aufbereitet. Die Bandbreite der Datentypen reicht von Texten und Bildern aller Art über audiovisuelle Daten bis zu numerischen Messdaten, Modellen und Simulationsdaten.

Auch Softwarecode fällt unter den Forschungsdatenbegriff. Die Fülle an methoden-, geräte- und disziplinspezifischen Dateiformaten ist kaum zu überschauen. Forschungsdaten spielen eine zunehmend wichtige Rolle für wissenschaftliche Veröffentlichungen.

Die Frage nach dem »richtigen« Umgang mit diesen Daten stellte sich schon immer, besonders drängend aber im digitalen Zeitalter. Die Anforderungen an wissenschaftliche Daten sind hoch, sie müssen genau, vollständig, unverfälscht und über lange Zeiträume sicher verfügbar sein, um die Nachvollziehbarkeit und Reproduzierbarkeit von Forschungsergebnissen auch langfristig sicherzustellen.

Hier setzt das Forschungsdatenmanagement an, das den gesamten Forschungszyklus von der Projektplanung über die Datenerfassung und -verarbeitung bis hin zur Archivierung und gegebenenfalls Veröffentlichung im Blick hat.

Datengetriebene Forschung

Mit der breiten Verfügbarkeit dieser hochqualitativen Daten entwickelt sich ein ganz neues Feld für alle Wissenschaftsdisziplinen. Als viertes Paradigma nach Empirie, Theorie und Simulation ist die datengetriebene Forschung, die data science, entstanden. Sie entwickelt Methoden, Prozesse, Algorithmen und Systeme zur Extraktion von Wissen aus Daten. Viele Forschungsbereiche an der TU Darmstadt sind inzwischen datengetrieben, zum Beispiel Künstliche Intelligenz, Maschinelles Lernen, Industrie 4.0 oder Digital Humanities.

Voraussetzung für gute datengetriebene Forschung ist, dass Daten referenzierbar, auffindbar und technisch zugänglich sein müssen und dass sie maschinenlesbar (interoperabel) sowie im rechtlichen und wissenschaftsethischen Sinne nachnutzbar sind. Diese vier Anforderungen werden in den FAIR data principles zusammengefasst: findable, accessible, interoperable and re-usable.

Ein wesentlicher Aspekt des Forschungsdatenmanagements ist die Beschreibung von Forschungsdaten durch Metadaten. Erst sie machen Datensätze suchbar, verständlich und nachvollziehbar und sichern Herkunft, Urheberschaft und Rechtsstatus der Daten ab. Gute Metadaten sind für Menschen und für Maschinen verständlich.

Liegen Kontextinformationen, also Metadaten, vor, steigt der mögliche Erkenntnisgewinn aus der datengetriebenen Forschung erheblich. Die TU Darmstadt hat diesen Bedarf erkannt und fördert seit mehreren Jahren die datengetriebene Forschung durch den Ausbau zentraler Services und Angebote in zweierlei Hinsicht. Zum einen soll die konkrete Umsetzung der FAIR-Prinzipien erleichtert und zum anderen der Forschungsalltag an der TU Darmstadt durch automatisierte und standardisierte Prozesse unterstützt werden. Die Professionalisierung des Forschungsdatenmanagements trägt sowohl beim Forschungsgegenstand selbst als auch im gesamten Forschungsprozess so zur Digitalisierung der Wissenschaft bei.

Seit 2018 werden die Forschungsdaten-Services durch das Team TUdata gebündelt. In TUdata treiben Kolleginnen und Kollegen aus der Universitäts- und Landesbibliothek, dem Hochschulrechenzentrum und dem Dezernat Forschung und Transfer gemeinsam mit Wissenschaftlerinnen und Wissenschaftlern aller Fachbereiche den Aufbau eines umfassenden Forschungsdatenmanagements an der TU Darmstadt voran. Diese Services werden in den kommenden Jahren aus Eigen- und Drittmitteln weiter stark ausgebaut. Die TU Darmstadt engagiert sich hierzu im hessischen Landesprojekt HeFDI (Hessische Forschungsdateninfrastrukturen) und auf nationaler Ebene beim Aufbau der Nationalen Forschungsdateninfrastruktur (NFDI). Im NFDI-Kontext ist sie in verschiedenen Konsortien vertreten und spielt gemeinsam mit der RWTH Aachen in dem Konsortium NFDI4Ing eine federführende Rolle.

Lesen Sie mehr zum Forschungsdatenmanagement an der TU in der aktuellen hoch³: