Der kybernetische Regelkreis im Kampf gegen COVID-19
Stuttgart – Fitnessstudio ja, Party nein. Grundschüler bleiben zuhause, Abschlussklassen dürfen wieder in die Schule. Welcher Weg der Lockerung optimal ist, um die Ansteckungsgefahr mit COVID-19 trotz zurückgewonnener Freiheiten so weit wie möglich zu reduzieren, ist derzeit ein viel diskutiertes Thema. Dabei steht auch die Frage im Raum, wann und in welchem Maße das öffentliche Leben erneut heruntergefahren werden müsste, sollte die Anzahl der Neuinfektionen wieder rapide ansteigen. Es wird – teils hitzig – debattiert, wie streng Social Distancing Maßnahmen sein müssen, um die Neuinfektionsrate klein zu halten und um das Gesundheitssystem nicht zu überlasten, gleichzeitig aber auch die Auswirkungen auf Wirtschaft und Gesellschaft möglichst gering zu halten.
Regierungen und Behörden müssen fortlaufend das Pro und Contra zwischen Schutzmaßnahmen und Lockerungen abwägen. Unterstützung liefern dabei wissenschaftliche Modelle, die als Grundlage zur Berechnung und Analyse dienen. Die zentrale Frage: Wie wirken sich verschiedene Maßnahmen auf ein angestrebtes Ziel in der Zukunft aus? Die berechneten Strategien sind oft statisch: Von einem gewünschten Ziel in der Zukunft (z.B. darf die Zahl der in allen deutschen Krankenhäusern wegen COVID-19 zu versorgenden Intensivpatienten einen bestimmten Wert nicht überschreiten) wird berechnet, welche Maßnahmen heute notwendig sind (Mindestabstand von 1,5 Metern, Schutzmasken im öffentlichen Raum etc.), um dieses Ziel zu erreichen. Doch sind dann die beschlossenen Maßnahmen wirklich die richtigen, damit wenige Tage später keine Katastrophe eintritt? Unsicherheit begleitet den Kampf gegen die Pandemie.
Entscheidungsfindung unter Unsicherheit
Eine dynamische Strategie, die auf Feedback basiert und mit einem Modell in die Zukunft blickt, wurde nun an der Universität Stuttgart am Institut für Systemtheorie und Regelungstechnik entwickelt. Die Forschenden, die sich üblicherweise mit Algorithmen für autonom fahrende Autos beschäftigen, haben nun an einer Methode gearbeitet, die das Problem lösen kann: Wie man heute Entscheidungen über Dinge trifft, deren Ergebnis man nicht exakt kennt.
Ihr prädiktiver Algorithmus hat zum Ziel, die Zahl der Intensivpatienten in Deutschland über einen Zeitraum von zwei Jahren zu minimieren, ohne übermäßige soziale und wirtschaftliche Kosten zu verursachen. Ihr Rat an alle, die Modelle zur Entscheidungsfindung einsetzen: dynamische Lockerungsmaßnahmen, die man jede Woche ändern kann, statt statische, die – einmal festgesetzt – nicht wieder angepasst werden. Gerade wenn die Datenlage unsicher ist, zum Beispiel die Messungen zu den Infektionsraten in einer Gesellschaft sehr ungenau sind, tarierten dynamische Strategien diesen Nachteil aus.
Die Wissenschaftler*innen, die meisten davon Doktorand*innen der International Max Planck Research School for Intelligent Systems (IMPRS-IS), der Nachwuchsschmiede innerhalb des Forschungskonsortiums Cyber Valley, forschen im Bereich der Systemtheorie und Regelungstechnik. „Unsere Expertise ist es, Entscheidungen zu treffen, obwohl wir nicht alle Informationen haben, um ein bestimmtes Ziel zu erreichen – so wie zum Beispiel ein autonom fahrendes Auto nicht weiß, was auf seinem Weg liegt von A nach B. Die Entscheidungsfindung unter Unsicherheit, das ist unser Spezialgebiet. Hier gehören wir weltweit zur Forschungsspitze“, erklärt Prof. Frank Allgöwer, der das Institut für Systemtheorie und Regelungstechnik der Universität Stuttgart leitet und Mitglied der IMPRS-IS-Fakultät ist.
Alle Forschungsprojekte des Instituts basieren auf dem kybernetischen Regelkreis: dem Dreiklang aus Wahrnehmen, Lernen und Handeln. Über gemessene Daten nimmt der Regler seine Umwelt wahr, basierend auf diesen Daten entscheidet er über die nächste Aktion und setzt diese dann in Handlungen um, um so ein gewünschtes Ziel zu erreichen. Man nennt derartige Feedback-optimierte Strategien „modellprädiktive Regelung“.
In einer Publikation mit dem Titel „Robust and optimal predictive control of the COVID-19 outbreak“ konnten Allgöwer und sein Team zeigen, dass ihr Regelungsansatz bessere Ergebnisse liefert als jedes statische, weil es beispielsweise aktuelle Fallzahlen als Variable miteinbezieht. Wie autonome Fahrzeuge, die aus dem, was sie in ihrer Umgebung wahrnehmen, ständig Rückschlüsse ziehen und aufgrund dessen ihre aktuelle Fahrweise anpassen, so basiert auch diese Corona-Maßnahmen-Strategie auf dem kybernetischen Regelkreis.
Jede Woche neu berechnet: Sind die Schutzmaßnahmen zielführend?
„Mit dieser Methode, die auf Feedback setzt, kann ständig die Lockerungsstrategie adaptiert werden. Lockerungsmaßnahmen werden also nicht heute festgesetzt, um in Zukunft ein bestimmtes Ergebnis zu bekommen, sondern die Lockerungsmaßnahmen werden im Verlauf der Zeit angepasst. Man muss fortlaufend messen, was in der Gesellschaft passiert und diese Informationen für aktuelle Vorhersagen nutzen, um Maßnahmen zu bewerten. So kommt unser Regler zu einer robusten und optimalen Entscheidungsfindung: Es werden weniger rigide Schutzmaßnahmen notwendig, ohne die Bevölkerung stärker zu gefährden.“ Eine statische Strategie sei nämlich nie ganz korrekt und vor allem für längerfristige Vorhersagen ungeeignet. Daher benötige man Methoden, um adaptiv die optimale Einflussnahme – trotz großer Unsicherheiten – bestimmen zu können, so Allgöwer weiter.
Das Modell basiert auf Differentialgleichungen – komplizierte Formeln, die mathematisch abbilden, wie sich dynamische Systeme weiterentwickeln und so einen Blick in die Zukunft erlauben. Um bei dem Vergleich mit Autos zu bleiben: das Lenkrad, die Bremse und das Gaspedal sind variable Einflussgrößen, denn wann das Auto wo ankommt hängt davon ab, wie das Lenkrad, das Gaspedal und die Bremse bedient werden. Andere Einflussgrößen sind nicht veränderbar – so wie der Straßenverlauf, Fußgänger auf der Fahrbahn oder Ampeln. Das Modell basiert auf acht Variablen (siehe Abbildung 1), die miteinander interagieren. In dieses Modell fließen Parameter ein, die teils nicht beeinflussbar sind – zum Beispiel wie sich das Virus verhält. Andere Parameter wie das Abstandhalten wiederum sind beeinflussbar. „Wir bestimmen, wie man solche variablen Parameter berechnen muss, damit das optimal zwischen den Kosten für die Gesellschaft und den COVID-19 Fallzahlen abwägt.“
Abbildung 1: Das mathematische Modell, das die Forscher zur Prädiktion und Simulation nutzen, basiert auf acht Variablen, die den Verlauf der COVID-19 Epidemie in Deutschland beschreiben sollen (inspiriert von Giordano et al., 2020).
Mithilfe des stetigen Kreislaufes aus Wahrnehmen, Lernen und Handeln ergeben sich interessante Erkenntnisse, die eine Antwort auf die Frage liefern könnten, inwieweit gegenwärtige infektionsschützende Maßnahmen gelockert werden könnten und sollten. „Die Ergebnisse decken sich im Wesentlichen mit den Empfehlungen, welche in einem Strategiepapier der Fraunhofer-Gesellschaft, Helmholtz-Gemeinschaft, Leibniz-Gemeinschaft und Max-Planck-Gesellschaft vor ca. einer Woche veröffentlicht wurden. Dort wurde die Notwendigkeit für adaptive Entscheidungen angemahnt. Unsere Ergebnisse untermauern diese Forderung und liefern genau dazu einen wissenschaftlich fundierten Ansatz zur Bestimmung der Schärfe der Maßnahmen“, so Allgöwer.
Abbildung 2: Diese Abbildung zeigt, dass eine nominell optimale Regelungsstrategie (Feedback-nominal) im Fall von ungenauen Schätzungen der Fallzahlen durch eine zu starke Lockerung der Maßnahmen (Lockdown) zu einer zweiten Welle führt und eine erneute Verschärfung der Lockdown-Maßnahmen erforderlich macht, während eine robuste Regelungsstrategie (Feedback-robust), welche die Unsicherheit in den Schätzungen der Fallzahlen berücksichtigt, eine langsamere Lockerung der Lockdown-Maßnahmen vorsieht.
Durch das in der Strategie implementierte Feedback, das heißt der Adaption der Maßnahmen an die aktuellen Fallzahlen, kann die Ausbreitung des Virus auch dann gut kontrolliert werden, wenn das Modell nicht exakt ist. Erste Ergebnisse zeigen, dass eine solche Regelung unter Unsicherheiten deutlich bessere Ergebnisse liefert als konventionelle Strategien. Zudem kann sie verhindern, dass zeitweise wieder eine Verschärfung der Maßnahmen durch stark steigende Fallzahlen notwendig wird. „Mit der resultierenden optimierten Strategie lässt sich die Zahl künftiger Todesfälle durch Covid-19 halbieren, obwohl insgesamt keine strengeren Maßnahmen notwendig sind und auch keine erhöhten Kosten für die Öffentlichkeit und die Wirtschaft entstehen“, so die Hoffnung von Forschungsleiter Frank Allgöwer.