Warum Raucher, Männer und Ältere oft schwerer an COVID-19 erkranken

Forscher am Helmholtz Zentrum München haben mit Hilfe von Einzelzellanalytik eine mögliche molekulare Erklärung gefunden, warum einige Menschen ein höheres Risiko haben, schwer an COVID-19 zu erkranken. Institutsleiter Fabian Theis gibt Einblicke.

Es war schwer, ein Interview mit Ihnen zu arrangieren.  Hat Corona Ihren Alltag verändert?

Auf jeden Fall, teils weil wir – wie mittlerweile überall – am Institut für Computational Biology seit rund vier Wochen komplett virtuell arbeiten. Wir sind 150 Leute, die in 15 verschiedenen Arbeitsgruppen zu Data Science und Biologischen Systemen forschen. In diesen Wochen haben wir da schon mal Seminare, in denen 100 Leute virtuell miteinander diskutieren, das klappt erstaunlich gut. Zusätzlich zu dem hohen Arbeitsaufwand forschen wir seit kurzem mit Hochdruck in diversen Covid-19-Projekten. Wie bei uns gibt es weltweit viele Wissenschaftler, die wegen der akuten Relevanz dieser Forschung derzeit kaum schlafen. 

 

Welchen Beitrag leistet Ihre Forschung zur Bekämpfung des Corona-Virus?

Epidemiologische Untersuchungen der vergangenen Wochen zeigen: Das Coronavirus SARS-CoV-2 trifft nicht alle Menschen gleich – es gibt eine große Heterogenität der Infektion in der Bevölkerung. Warum aber sind Männer anfälliger als Frauen, warum erkranken mehr Raucher, aber fast keine Kinder? Wir gehen diesem Phänomen sozusagen auf den molekularbiologischen Grund. Unsere aktuellen Arbeiten im Rahmen des "Human Cell Atlas Lung Biological Network" zu Covid-19 konnten bei der Expression einzelner Gene, die für die Infektion relevant sind, molekulare Unterschiede zwischen den Gruppen beschreiben. Es liegt nahe, dass diese Unterschiede den Krankheitsverlauf und die Infektionswahrscheinlichkeit beeinflussen, denn sie decken sich mit klinischen Beobachtungen. Es ist allerdings nicht einfach, diesen Zusammenhang zu testen, da man Gene in Menschen nicht einfach hochregulieren kann, um zu sehen, was passiert. 

 Was genau haben Sie festgestellt?

Bisher konnten Studien folgendes belegen: Um in die menschlichen Zellen zu gelangen, dockt SARS-CoV-2 an den sogenannten ACE2-Rezeptoren an. Unterstützt wird der Andockungsprozess durch Proteasen wie zum Beispiel TMPRSS2. Die ACE2-Rezeptoren haben normaler Weise die Funktion, ein Hormon so umzubauen, das es die Spannung von Blutgefäßen reguliert. Bei einer Infektion können aber auch Gewebeschäden oder Lungenödeme hervorgerufen werden. Basierend auf diesen Ergebnissen haben wir die Datensätze verschiedener Menschen angeschaut. Und konnten in zwei jüngst publizierten Arbeiten zunächst zeigen, in welchen menschlichen Zellen der ACE2-Rezeptor und seine assoziierte TMPRSS2-Protease überhaupt exprimiert werden. Dazu zählen vor allem bestimmte Zelltypen in den Lungenbläschen.

 

Inwieweit sind diese Ergebnisse für die Pandemie relevant?

Sie sind die Basis einer wichtigen aktuellen Studie, das Manuskript wird nächste Woche auf einem PrePrint-Server publiziert. In der Studie haben wir mit Hilfe der Daten zellspezifisch analysiert, inwiefern die Faktoren Alter, Geschlecht und die Tatsache, ob jemand Raucher oder Nichtraucher ist, Einfluss auf die Expression dieser Rezeptoren und die Proteasen haben. Wir haben dafür geschaut, welche Gewebe ACE2 und die Protease zugleich exprimieren – und in welchen Zellen somit das Risiko für eine Infektion höher ist als in anderen. Die Ergebnisse sind: Der ACE2-Rezeptor wird beispielsweise in Atemwegsepithelzellen im Alter, bei Männern und Rauchern stärker exprimiert. Zusätzlich sehen wir, dass in bestimmten Zelltypen auch die Proteasen, die zur Infektion einer Zelle benötigt werden, im Alter und in Männern höher exprimiert werden. Diese Ergebnisse stimmen mit klinischen Beobachtungen an Covid-19 Patienten überein. Sie könnten daher die molekulare Basis unterschiedlicher Krankheitsverläufe zwischen Altersgruppen, Geschlechtern, und Rauchern erklären: Die Heterogenität der Corona-Infektion in der Bevölkerung basiert – neben Einflüssen wie einem unterschiedlich starken Immunsystem, Körpergewicht und Vorerkrankungen - wahrscheinlich darauf, dass die Genaktivität bei den Betroffenen für diese beiden Proteine erhöht ist. Dadurch kann SARS-CoV-2 leichter in die Zellen eindringen, es kommt eher zu einer Infektion.  

Wie lassen sich diese Ergebnisse im Kampf gegen das Corona-Virus nutzen?

Das Coronavirus verbreitet sich immer weiter. Es verbreitet sich aber nicht einheitlich. Man wusste schon vor unserer Studie, dass das Corona-Virus durch dem ACE2 Rezeptor und der Protease TMPRSS2 in die Zellen gelangt. Man wusste aber nicht wieso diese Verbreitung nicht einheitlich geschieht. Wir haben eine mögliche molekulare Erklärung für diese ungleichmäßige Verbreitung gefunden, nur anhand des schon bekannten Mechanismus. Wir zeigen, dass nur die Expression von dem Rezeptor und zwei Proteasen die unterschiedliche Verteilung erklären können. Das gibt uns weitere Hinweise, dass diese Gene interessante therapeutische Ansatzpunkte sind, da sie auch in der Vorhersage des Krankheitsverlaufs eine wichtige Rolle zu spielen scheinen.

  

Welche Datensätze haben Sie konkret verwendet?

Wir arbeiten seit Jahren im Rahmen des sogenannten menschlichen Lungenatlas. Der Lungenatlas ist Teil des Human Cell Atlas (HCA), einem internationalen Konsortium. Das HCA hat zum Ziel, eine Art Google Maps des menschlichen Körpers zu erstellen. Dazu sammeln die Arbeitsgruppen Datensätze verschiedenster Probanden. Das Konsortium will jede Zelle charakterisieren, räumlich lokalisieren und verstehen, wie sie mit anderen Zellen interagiert. Sind irgendwann alle Zellen und Geweben zu allen Zeitpunkten kartiert, kann das zig komplexe Fragen zur menschlichen Gesundheit wie auch zur Diagnose, Überwachung und Behandlung von Krankheiten klären. Es existieren bereits riesige Datensätze aus allen Organen und Geweben von gesunden und kranken Probanden. Allein der menschliche Lungenatlas verfügt über den derzeit größten existierenden Datensatz von gesunden Lungenzellen, er umfasst Zellen von 164 Spendern. Wir können damit Millionen von Gensequenzen untersuchen, vom Säugling bis hin zum 80-Jährigen.

 

Welche Informationen liefern Daten Gesunder bei einer Corona-Infektion?

Um die Mechanismen von Gesundheit und Krankheit zu identifizieren, erstellen wir Profile über den molekularen Zustand aller Lungenzellen. Dabei bringen uns schon die Daten weniger Gesunder Millionen neue Informationen – auch für die Entstehung von Krankheiten. Stellen Sie sich vor: Nur ein Transkriptom – das ist die Gesamtheit der Gene, die zu einem bestimmten Zeitpunkt in einer Zelle transkribierten werden ­- beschreibt etwa 25.000 aktivierte Gene. Es ist also schon eine große Herausforderung, in den Lungenzellen von nur fünf Probanden ein Muster oder eine Abweichung zu finden. Bis sich das SARS-CoV-2 verbreitete, haben wir mit solch „kleinen Datensätzen“ aus dem Lungenatlas gearbeitet. Durch die Pandemie ergab sich eine neue Dringlichkeit: Um schnell aussagekräftige Ergebnisse zum Beispiel zur Heterogenität zu erhalten, haben alle 18 Arbeitsgruppen des Lungenatlas ihre Datensätze von insgesamt 250 Probanden geteilt. So ist der größte Datensatz von Lungenzellen entstanden, den es wohl derzeit weltweit gibt. Die Analyse dieser Masse an Daten ergab Hinweise, dass die Gene von Männern, Rauchern und älteren Menschen eine höhere Aktivität für den Rezeptor und die Protease zeigen – und die Betroffenen folglich wahrscheinlicher erkranken, wenn sie mit dem Virus in Kontakt kommen.  

  

Welche Data Science Methoden helfen bei der Analyse?

Die Basis der Data Science ist die Einzelzellanalytik. Der Begriff steht für diverse Methoden, die umfassende und präzise Daten über den molekularen Charakter und die Funktionsweise einzelner Zellen liefern. Diese Verfahren ermöglichen es beispielsweise, die Aktivität von Genen in den einzelnen Lungenzellen per Gensequenzierer auszulesen und den Veränderungen in den Proteinen zuzuordnen. Die Einzelzellanalytik hat die Molekularbiologie revolutioniert. Sie erlaubt es, komplexe biologische Prozesse, Vorgänge und Entwicklungen zellgenau zu erfassen. Und das für tausende bis zu Millionen einzelner Zellen gleichzeitig. Data Science ermöglicht uns weiterhin einerseits die detaillierte statistische Beschreibung von hochdimensionalen Zuständen, die Zellen einnehmen können. Andererseits können wir berechnen, wie sich diese Zellzustände zum Beispiel durch ein Virus oder die Zugabe eines Medikaments ändert.

  

Ihre Arbeit reicht jedoch weit über die Einzelzellanalytik hinaus.

Tatsächlich ist die Datensequenzierung natürlich nur der Anfang. Denn zum einen lässt sich die immense Masse an Daten für den Menschen nicht mehr auswerten. Zum anderen arbeiten wir mit Millionen unterschiedlichen Zellen, von verschiedenen Zelltypen und verschiedenen Laboren. Das ergibt eine riesige Varianz. Wir brauchen also zunächst eine einheitliche Definition: Was genau ist eine Zelle aus dem oberen Atemtrakt, was eine Zelle aus dem unteren Atemtrakt? Zudem galt es dann, die Daten in einen Zusammenhang zu bringen, sie sinnvoll miteinander zu verbinden. Dabei halfen Verfahren wie Machine Learning und künstliche Intelligenz. Durch die Entwicklung von Algorithmen können wir Strukturen der Daten und die darin verborgene biologische Steuerung erkennen.

  

Welche Bilanz der letzten Wochen ziehen Sie?

Angesichts der immensen Herausforderungen der Pandemie an die Wissenschaft erfreut mich die innovative Zusammenarbeit: Es sind weltweit die besten Leute an Bord. Im Lungenatlas haben zum Beispiel bisher alle Gruppen für sich gearbeitet, nun teilen wir Daten, selbst unter konkurrierenden Gruppen, wir stellen eigene Interessen zurück, haben ein gemeinsames Ziel: die Pandemie verstehen und in den Griff bekommen. Ich hätte nie gedacht, dass sich eine so positive Gruppendynamik entwickelt und es einen so schnellen Austausch geben würde. Das ist zweifelsfrei ein positives Ergebnis der Corona-Krise.

 

Interview: Beate Wagner

Aktuelle Forschung, Zahlen und Fakten zu SARS-CoV-2

Alternativ-Text

Newsletter bestellen