Eine exzellente Schnittstelle
Von den Erdsystemwissenschaften, über die Energieforschung bis hin zu Medizin: An der Helmholtz School for Data Science in Life, Earth and Energy (HDS-LEE) in Jülich kommen Promovierende aus unterschiedlichsten Forschungsbereichen zusammen.
Wie profitieren die PhDs von der Verschiedenheit der drei Fächer?
Tag für Tag arbeitet Laura Helleckes mit erstaunlichen, mikroskopisch kleinen Organismen. Sie können Kunststoff herstellen, Reinigungsmitteln Power geben oder auch Substanzen wie Glutamat für den Lebensmittelbereich oder Insulin als Pharmawirkstoff produzieren. Diese Powerminis sind häufig Bakterien wie Escherichia coli oder Corynebacterium glutamicum.
Helleckes will herausfinden: Bei welcher Temperatur gedeihen sie am besten? Welche Nährlösungen tun ihnen gut? Und was sind die optimalen Lebensbedingungen, damit die Mikroorganismen aus Zucker oder Ernteresten diese wertvollen Stoffe so schnell und gut wie möglich bauen können? Am biotechnologischen Institut IBG-1 des Forschungszentrums Jülich wertet sie für ihre Promotion Millionen von Daten zu diesen Fragen aus – als Data Scientist: „Es ist fantastisch, was Datenanalysen darüber verraten.“
„Die Natur liefert die Vorlage für viele Prozesse."
Gene steuern das Leben und ermöglichen es Bakterien bemerkenswerte Dinge herzustellen – das hat Laura Helleckes schon in der Jugend fasziniert: „Die Natur liefert die Vorlage für viele Prozesse. Wenn wir Menschen eine spezifische Substanz benötigen, müssen wir nur genau suchen – immer schon gibt es irgendeinen Organismus, der ihn oder ein sehr ähnliches Molekül ohnehin produziert.“
Wie großartig wäre es, wenn die Tricks der Natur genutzt werden könnten, um nachhaltig Produkte herzustellen – Bioplastik aus landwirtschaftlichen Abfällen zum Beispiel. Helleckes studierte Biotechnologie, heute steht sie selbst an vorderster Front bei der Erforschung der Fähigkeiten der Natur.
Über die HDS-LEE
HDS-LEE
Die internationale Graduiertenschule HDS-LEE bietet ein interdisziplinäres Umfeld für die Ausbildung der nächsten Generation von Datenwissenschaftlern in engem Kontakt mit fachspezifischem Wissen und Forschung.
Sie ist Teil des neu gegründeten JARA Center for Simulation and Data Sciences, das deutsche Kompetenzzentrum für Computer- und Dateninfrastrukturen, Nutzerunterstützung sowie methodische und disziplinäre Forschung in den Bereichen Simulation, Datenanalyse und High Performance Computing-Technologien. JARA ist eine einzigartige Kooperation zwischen dem Helmholtz-Forschungszentrum Jülich und der RWTH Aachen mit starker internationaler Sichtbarkeit.
Foto: Luftbild Forschungszentrum Jülich - Credit: Forschungszentrum Jülich
Kenntnisse in Biotechnologie und Datenwissenschaften
Konkret heißt das: Ihre Biotechnologie-Kollegen im Labor setzen die Versuche mit Mikroorganismen in Gang und wollen herausfinden, wie sie am besten den Stoffwechsel befeuern, mit dem sie den Zucker in den gesuchten Stoff umbauen. Helleckes überwacht digital den Ablauf:
„Ich baue einen digitalen Zwilling des Versuchs und simuliere am Rechner, was sich verändern würde, wenn wir an einer kleinen Stellschraube drehen. Die beste Variante testen die Forschenden im Labor.“
Runde um Runde: Daten sammeln, auswerten, durch die Simulation laufen lassen, testen, Ergebnisse auswerten, Vorschläge für neue Versuchsvarianten machen, mit den Kollegen im Labor diskutieren, und von vorn. Ohne die enge Kooperation mit den Biotechnologen und Prozesstechnikern im Labor läuft dabei nichts. „Dafür muss ich mich in Biotechnologie und Datenwissenschaften gleichermaßen auskennen – und das habe ich hier hervorragend gelernt.“ Und zwar an der Helmholtz School for Data Science in Life, Earth and Energy – kurz: HDS-LEE.
Ein Merkmal der HDS-LEE: So breit gefächert wie die Felder sind die Forschungsthemen der Promovierenden an der School. In den Erdsystemwissenschaften ergründen sie Wasserkreisläufe in Afrika; in den Energiewissenschaften untersuchen sie über längere Zeiträume Stromnetzschwankungen und in der Neurobiologie beschäftigen sie sich beispielweise mit den Hirnströmen bei Affen, um Denkprozesse besser zu verstehen.
Eine ideale Voraussetzung für Data Science
Doch warum tun sich so unterschiedliche Disziplinen wie Erd-, Lebens- und Energiewissenschaften für eine gemeinsame Graduiertenschule zusammen?
„Weil Datenwissenschaften eine methodische Disziplin sind, universell einsetzbar. Die inhaltliche Verschiedenheit der drei Fächer stört Datenwissenschaftler nicht und in den Lebens-, Erd- und Energiewissenschaften stellen sich methodisch sehr ähnliche Fragen“, erläutert School-Sprecher Wolfgang Wiechert.
Alle drei haben es gleichermaßen mit einer großen Zahl unterschiedlicher Daten aus verschiedenen Quellen zu tun, heterogene Daten heißen sie im Fachjargon. In allen diesen Bereichen ist zudem die Automatisierung und Digitalisierung von Laboren und Forschungsabläufen auf dem Vormarsch, eine ideale Voraussetzung für die Datenwissenschaften.
"Wir brauchen diese enge Verzahnung von Anwendungsdisziplinen und Data Science. Denn die Datenmengen, die wir auswerten müssen, um die Forschung optimal voranzubringen, sind längst viel zu groß und vielfältig, um sie ohne Data Science nutzen zu können."
Wolfgang Wiechert, School-Sprecher der HDS-LEE
Die Fachbereiche profitieren voneinander
Biotechnologen zum Beispiel charakterisieren Mikroorganismen mit Massenspektrometern, mikroskopischen Bilddaten oder Gensequenzierung. Erdwissenschaftler erforschen den Zustand des planetaren Systems unter anderem mit Satelliten, Messungen von Ballons in der Stratosphäre und Sensornetzen von mobilen Laboren.
Energieforschende bekommen Informationen über die Tragfähigkeit von Energienetzen erst durch Messungen für jede einzelne Energieform – von Solar über Wind bis Atom – aus verschiedenen Quellen. Und weil Daten und ihre Messquellen so unterschiedlich sind, arbeiten alle drei Disziplinen häufig mit Simulationen, die diese Vielfalt zu einem Gesamtbild zusammenführen.
Datenfusion nennt sich das, und sie ist, weil hochkomplex, besonders auf Machine Learning angewiesen. Wiechert erklärt: „Die Methoden sind daher stark übertragbar, die Fachbereiche profitieren voneinander.“ So können beispielsweise die Algorithmen zur Bilddatenanalyse bei Pflanzen auch auf mikroskopische Bilder von Mikroorganismen übertragen werden.
„Wir brauchen diese enge Verzahnung von Anwendungsdisziplinen und Data Science. Denn die Datenmengen, die wir auswerten müssen, um die Forschung optimal voran-zubringen, sind längst viel zu groß und vielfältig, um sie ohne Data Science nutzen zu können“, so Wiechert weiter.
Als die Helmholtz-Gemeinschaft vor fünf Jahren ihre Mitglieder zur Gründung von Graduierten-Schulen an der Schnittstelle von Fachwissenschaften und Data Science anregte, trommelte Wiechert daher gleich Kollegen aus verschiedenen Helmholtz-Zentren und Universitäten zusammen und fragte: Wäre das nichts für uns?
Eine Brücke zwischen Fachexperten und Datenprofis
Heute sind an der HDS-LEE neben dem Forschungszentrum Jülich, die RWTH Aachen, die Universität Köln, das Deutsche Zentrum für Luft- und Raumfahrt (DLR), das Max-Planck-Institut für Eisenforschung (MPIE) und seit 2022 auch das Uniklinikum Aachen beteiligt.
Gemeinsam wurde die School 2018 unter dem Dach der Helmholtz Information & Data Science Academy (HIDA) aufgebaut. Sie ist damit Teil eines Netzwerks von sechs Research Schools, die deutschlandweit mehr als 250 voll finanzierte Promovierende an der Schnittstelle von Data Science und den sechs Helmholtz-Forschungsbereichen ausbilden. Allein an der HDS-LEE durchlaufen aktuell 62 Doktoranden das Graduiertenprogramm.
Betreut werden die Promovierenden in ihrer dreijährigen Forschungszeit von je zwei Principal Investigators (PI). Das Besondere an der HDS-LEE: Viele PIs haben sowohl ein Standbein in den Datenwissenschaften als auch in einer Anwendungsdisziplin. „Diese Wissenschaftler sind die Brücke zwischen Experten und Datenprofis“, erläutert Wiechert.
Beim Austausch finden sich schnell Parallelen. Wenn man die Methoden abstrahiert, ist ganz viel übertragbar.
Laura Helleckes
ist Doktorandin an der HDS-LEE und Sprecherin der Promovierenden.
Eine lebendige und inspirierende Community
Wenn in der HDS-LEE neue Stellen ausgeschrieben werden, ist der Andrang groß. Beim Start der Graduiertenschule 2019 hatten sich etwa dreihundert Studierende auf die 24 Plätze der ersten Kohorte beworben, 2021 rangen schon 400 um die Plätze in der zweiten Kohorte. Sie bewerben sich direkt auf die konkreten Forschungsprojekte.
Neben den 45 regulären Doktoranden gibt es aktuell 17 „Associates“: PhDs, die bereits an einem der Partnerinstitute forschen, bezahlt aus anderen Mitteln, und „deren Thema sehr gut zum HDS-LEE Profil passt“, so Wiechert. „Sie sollen gleichfalls vom vielfältigen Begleitprogramm der School und dem großen Netzwerk in der Forschung profitieren.“
Laura Helleckes, Doktorandin am Institut von School-Sprecher Wiechert, ist eine der Associates und Sprecherin der Promovierenden. Sie genießt die lebendige und inspirierende Community. Mal trifft sie Doktoranden von der RWTH Aachen, mal aus Jülich oder Köln zum Lunch.
Alle zwei Wochen ist digitale Kaffeepause für alle und regelmäßig verabreden sich die „HDS-LEE Women“ zur Extrarunde. Einmal im Jahr fahren alle Promovierenden gemeinsam zu einem Retreat: Teambuilding und Forschungsdiskussionen inklusive. In Postersessions stellen sie sich gegenseitig ihre Projekte vor. „Beim Austausch finden sich schnell Parallelen“, sagt Helleckes. „Wenn man die Methoden abstrahiert, ist ganz viel übertragbar.“
Besonders schätzt Helleckes das Studienbegleitprogramm der HDS-LEE. In Vorlesungen und Kursen gibt es einen guten Einblick in das datenwissenschaftliche Methodenwerk von Deep Learning über Zeitreihenanalysen bis zu wahrscheinlichkeitsbasierter Modellierung. In „Hands-on-Sessions“ erproben die Doktoranden spielerisch, wie sich die Methoden konkret anwenden lassen.
Daneben organisiert School-Koordinatorin Ramona Kloß ein Set von Soft-Skill-Kursen zu Themen wie Zeitmanagement, interdisziplinärer Kommunikation oder wissenschaftlichem Schreiben. Kloß dazu: „Wir stellen viele Workshops auf Wunsch der Promovierenden zusammen und unterstützen sie, eigene Veranstaltungen auf die Beine zu stellen.“
Mit Forschung die Welt verändern
Natürlich entwickelt sich die HDS-LEE stets weiter. Kooperationen mit Projektpartnern werden ausgebaut, externe Mittel eingeworben. Zum Beispiel für das Projekt Data-PLANT, gefördert von der Deutschen Forschungsgemeinschaft als Teil der Nationalen Forschungsdaten Infrastruktur. In den nächsten fünf Jahren soll eine umfangreiche Dateninfrastruktur für die moderne Pflanzenforschung aufgebaut werden, unterstützt von Promotionsprojekten an der HDS-LEE.
Auch die Zusammenarbeit mit der Industrie ist an der HDS-LEE seit jeher eng. Konzerne wie BASF, Bayer oder die Energieabteilungen von Siemens klopfen regelmäßig an. HDS-LEE-Doktoranden können schon während der Promotion eine Auszeit für ein Praktikum nehmen.
Und, Laura Helleckes – lieber Industrie oder Wissenschaft? Helleckes lacht. „Beides geht, ich bin Forscherin mit Leib und Seele – gern an der Uni, vielleicht aber auch in einem Unternehmen.“
Es sei beflügelnd, mit Forschung dazu beizutragen, dass Produktionsprozesse für die Erzeugung wichtiger Stoffe effizienter werden und die Umstellung von fossilen auf nachhaltige Rohstoffe so schnell wie möglich gelingt. „Das ist ja das Fantastische an der Forschung: Neue Wege und Ideen zu entwickeln, die uns Menschen weiterbringen.“
Ihr Berufsziel? „Vielleicht irgendwann einmal selbst Professorin werden – an der Schnittstelle von Biotechnologie und Data Science.“