COVID-19-Verläufe prognostizieren

Wie lässt sich bereits relativ früh erkennen, ob ein COVID-19-Patient womöglich einen schweren Verlauf entwickelt? Data Scientists versuchten bei der HIDA International Virtual COVID-Data Challenge darauf eine Antwort zu finden.

Überfüllte Notaufnahmen, überlastetes Klinikpersonal, eine nicht ausreichende Intensivversorgung – vielen sind die Nachrichten, die während der ersten Corona-Welle etwa aus norditalienischen Krankenhäuser zu uns drangen, noch deutlich in Erinnerung. Zu wissen, wer von den eingelieferten Patientinnen und Patienten die begrenzten Behandlungsressourcen am dringlichsten benötigt, würde die Arbeit der Ärztinnen und Ärzte in so einer Belastungssituation erheblich erleichtern. Wie aber ließe sich bereits zu einem relativ frühen Zeitpunkt nach der Aufnahme in ein Krankenhaus erkennen, ob ein Covid19-Patient womöglich einen schweren Verlauf entwickelt?

Die von HIDA organisierte International Virtual COVID-Data Challenge stellte diese Frage einem internationalen Publikum junger Data Scientists: 63 Nachwuchswissenschaftler aus 15 Ländern traten an, um einen Algorithmus zu verbessern, der anhand von Röntgenbildern den wahrscheinlichen Krankheitsverlauf für Covid-Patienten prognostiziert. Eine herausfordernde Teamarbeit wartete auf die Teilnehmerinnen und Teilnehmer, die vom 28. bis 29. April 2021 über fünf Zeitzonen hinweg zusammen an Lösungen arbeiteten.

Leichter oder schwerer Krankheitsverlauf?

Die Aufgaben basierten auf Daten, die in sechs verschiedenen Krankenhäusern in Norditalien während des ersten Ausbruchs von COVID-19 im März 2020 gesammelt wurden. Der Krankheitsverlauf der Patientinnen und Patienten, von denen die Daten erhoben wurden, ist rückblickend entweder als schwer (wenn der Patient mechanisch beatmet werden musste oder verstarb) oder als leicht (alle anderen Verläufe) eingestuft worden.

Zu dem Zeitpunkt, als das Schicksal der eingelieferten Kranken noch offen war, nämlich während der Triage, wurde an den Patientinnen und Patienten neben Röntgenaufnahmen der Lunge eine Reihe von klinischen Tests durchgeführt, die mehrere Parameter generierten. Von diesen wurden 16 als relevant für den späteren Krankheitsverlauf angesehen und in den Challenge-Datensatz aufgenommen.

Für die Datenwissenschaftlerinnen und Datenwissenschaftler, die sich dieser hochaktuellen Forschungsfrage stellten, bestand die Herausforderung in der Lösung von zwei Aufgaben, die die Jury unabhängig voneinander bewertet hat. Während es in einem ersten Schritt darum ging, fehlende klinische Daten dieser Testreihen mit statistischen Verfahren zu vervollständigen, bestand die zweite Aufgabe darin, die Probandinnen und Probanden aufgrund dieser Datenlage gemäß des Schweregrads ihrer Krankheit in „milde“ und „schwere“ Verläufe zu klassifizieren. – Eine wichtige Erkenntnis, die den Kliniken in so besonderen Überlastungssituationen wie der vom Frühjahr 2020 in Italien künftig helfen könnte, Patienten angemessen und mit Rücksicht auf die vorhandenen Krankenhaus-Kapazitäten zu behandeln.

Internationale Zusammenarbeit – vor und hinter den Rechnern

Bei dieser HIDA-Challenge war nicht nur die Zusammensetzung der Teams international, diese wurden während der zwei intensiven Arbeitstage durch die internationale Zusammenarbeit vieler Partner in Deutschland, Italien und Israel unterstützt: Die Inkubator-Plattformen Helmholtz AI, Helmholtz Federated IT Systems (HIFIS) und Helmholtz Imaging Platform (HIP) sowie die ELLIS Standorte Genua und München waren verantwortlich für die Inhalte der Challenge und des Rahmenprogramms und den technischen Support. Erfahrene Data Scientists der Israel Data Science Initiative berieten Teams in der Lösungsfindung. Das KIT sowie NVIDIA Israel stellten wiederum Computing Ressourcen zur Verfügung und boten Unterstützung bei deren Nutzung. Die italienischen Partner Centro Diagnostico Italiano und BRACCO Imaging lieferten nicht nur die entsprechenden Daten und Röntgenaufnahmen, sondern stifteten auch die Preise.

Zwei Gewinnerteams, kitmetrics and friends (als Gewinner der ersten Teilaufgabe) und nem-Team (als Sieger der zweiten Teilaufgabe), konnten die Jury überzeugen und somit zur verbesserten Anwendbarkeit des Algorithmus in der klinischen Forschung beitragen. Welchen Weg die beiden Teams für ihre Lösungen gewählt haben, kann man hier noch einmal sehen. Wir gratulieren den Sieger-Teams und allen Teilnehmerinnen und Teilnehmern, die sich dieser herausfordernden Aufgabe gestellt haben!

Alternativ-Text

Newsletter bestellen