Datathon für die Klimaforschung
Die Herausforderungen des Klimawandels sind groß - auch für die Forschung. Beim HIDA Datathon for Grand Challenges on Climate Change konnten Teilnehmer aus aller Welt beweisen, wie man mit Data Science Lösungen für Fragen des Klimawandels findet.
Nicht nur Ausdauer, sondern auch Geschwindigkeit führen einen Marathon-Läufer am Ende erfolgreich ins Ziel. Auch beim HIDA Datathon for Grand Challenges on Climate Change, der am 5. und 6. November als virtuelles Event stattfand, waren beide Eigenschaften gefragt – gepaart mit einer Leidenschaft für datenwissenschaftliche Methoden und dem Interesse und der Bereitschaft, diese Kenntnisse in aktuelle Forschungsfragen einzubringen. Drängende Fragen zu den Herausforderungen des Klimawandels, die ihrerseits kaum Aufschub dulden und an denen Forscherinnen und Forscher an verschiedenen Helmholtz-Zentren derzeit arbeiten. Insgesamt standen fünf sogenannte Challenges den Teilnehmerinnen und Teilnehmern zur Auswahl:
- Automatisches Abbilden des lokalen Stadtklimas aus Satellitendaten: Zhu Xiaoxiang und ihr Team vom DLR fordern dazu auf, maschinelle Lernmodelle zu entwickeln, die aus Satellitenbildern zuverlässige lokale Klimazonenkarten für Stadt-Klimatologen erstellen.
- Den Fluss von Fischlarven in sich erwärmenden Ozeanen mit einer interaktiven Visualisierung zeigen: Helfen Sie Willi Rath und dem Ocean Dynamics Team am GEOMAR, vom Menschen verursachte Veränderungen am Beginn der Nahrungskette zu erforschen.
- Mit kosmischer Strahlung Wasser finden: Martin Schrön sammelt mit einem Neutronendetektor, der auf einem Auto installiert ist, Daten zur Bodenfeuchte; er und sein Team am UFZ fordern Sie heraus, ein sich selbst verbesserndes Computermodell zu entwickeln, das zuverlässig Landschaftsmerkmale in einer Reihe von Bildern erkennt, die auf Fahrten durch Deutschland gesammelt wurden.
- Finden Sie den Fehler in 50 Millionen Datenpunkten: Helfen Sie Lennart Schmidt vom Team um Corinna Rebman am UFZ, eine clevere Methode zu finden, fehlerhafte Datenpunkte bei Bodenfeuchte-Messungen im deutschen Waldgebiet Hohes Holz automatisch zu markieren.
- Entwicklung zuverlässiger Prognosen für Dürren: Arbeiten Sie mit Simulationen, die sich über mehrere tausend Jahre erstrecken, und helfen Sie Eduardo Zorita und seinem Team vom Helmholtz-Zentrum Geesthacht, ein Modell zu entwickeln, das zuverlässig Regen und Schnee für die folgende Herbst- und Wintersaison vorhersagt.
Unterstützt wurden die Challenge-Teilnehmerinnen und -Teilnehmer durch HIDA-Partner: Das Jülich Supercomputing Center und das Steinbuch Center for Computing des KIT stellten als Technologiepartner HPC-Systeme und Rechenzeit sowie Betreuung durch jeweils eine Mitarbeiterin oder einen Mitarbeiter zur Verfügung. Externe Partner des Events waren Deloitte und NVIDIA. Mitarbeiterinnen und Mitarbeiter der Unternehmen unterstützten neben sieben erfahrenen Data Scientists der Zentren die Teilnehmenden bei der Bearbeitung der Fragestellungen als Mentoren.
94 Teilnehmerinnen und Teilnehmer waren aktiv am Aufspüren von Lösungen beteiligt – eine beträchtliche Anzahl für ein aufgrund von Corona-Beschränkungen rein virtuell ausgetragenes Event. Von insgesamt 13 Teams, die sich Laufe des ersten Vormittags zusammenfanden, wurden am Ende zehn Lösungsvideos in der erforderten Zeit eingereicht. Das erforderte viel Kommunikation und Abstimmung: Allein über den eigens von HIDA eingerichteten Slack-Kanal wurden während der gesamten zwei Tage über 5000 Nachrichten ausgetauscht. Data Scientists aus Helmholtz Zentren waren in den Challenges besonders stark vertreten: Knapp die Hälfte der Datenwissenschaftlerinnen und Datenwissenschaftler kamen von zwölf verschiedenen Helmholtz-Institutionen. Auch internationale Gäste bereicherten die Teams: Teilnehmerinnen und Teilnehmer aus insgesamt sieben Ländern nahmen an der intensiven Arbeit mit den Datensätzen teil.
„Ich bin überzeugt, dass einige der Vorschläge als ein Schritt vorwärts bei der Nutzung der Datenwissenschaft im Kontext der Klimaforschung angesehen werden können.“
Hanna Meyer, Professorin für Fernerkundung und Jury-Mitglied
„Ich war wirklich beeindruckt von der Qualität der erzielten Lösungen, vor allem, wenn man die kurze Zeit berücksichtigt, die den Teilnehmern für die Herausforderungen zur Verfügung stand“, sagt Hanna Meyer, Professorin für Fernerkundung und Räumliche Modellierung an der Westfälischen Wilhelms-Universität Münster und Jury-Mitglied über die eingereichten Beiträge. „Ich bin überzeugt, dass einige der Vorschläge als ein Schritt vorwärts bei der Nutzung der Datenwissenschaft im Kontext der Klimaforschung angesehen werden können.“
Am Ende konnten fünf Teams mit ihrer Darstellung die Jury überzeugen. Juror Marcel Dickow vom Umweltbundesamt war vor allem imponiert von der Fähigkeit der Teilnehmerinnen und Teilnehmer, über die Spezifika der jeweiligen Herausforderungen zu reflektieren: „Ich denke, das ist etwas, was wir brauchen: Dass die Teilnehmer nicht nur Lösungen finden können, sondern auch in der Lage sind, das Problem zu verstehen und ihre Lösungen an das Problem anzupassen."
Dass diese Reflexionsfähigkeit tatsächlich zur Lösung der jeweiligen Forschungsfragen beitragen soll, ist ein erklärtes Ziel des Datathons. Challenge-Geber Eduardo Zorita ist zuversichtlich, was die Ergebnisse angeht, die in seiner Challenge zur Vorhersage von Dürren gefunden wurden: „Alle drei Teams haben innerhalb des engen Zeitrahmens hervorragende Arbeit geleistet und verschiedene Optionen geprüft. Eine dieser auf Random Forest basierenden Lösungen zeigte vielversprechende Ergebnisse. Diese werden nun weiterverfolgt und sehr wahrscheinlich in unser laufendes Haicu-Pilotprojekt aufgenommen.“ Und auch Martin Schrön ist über die guten Ergebnisse überrascht: „Es hat unserer Idee einen richtigen Push gegeben.“ Er plant, die beiden Gewinnergruppen einzuladen, um mit ihnen über eine mögliche Automatisierung des Scripts zu sprechen.
Im folgenden Video erklären die fünf Challenge-Geber, in welchen Anwendungsbereichen ihre jeweiligen Challenges liegen und was für spezifische Probleme es dabei zu lösen galt:
Die Lösungen der Teams
Im folgenden Video präsentieren sich alle Teams mit ihren Lösungen. Die Präsentation der Gewinner-Teams sind an folgenden Stellen zu finden:
- Team Heidelbären (30:34)
- Team Moisture Magic (36:50)
- Team Neutrons_net (41:40)
- Team dlr_lcz42_uncertainty (50:15)
- Team Weatherpeople (56:10)