Wahrscheinlichkeiten mit Bayesschen Netzen
Verwendet wird dabei das Covid-19 Bayesian Modelling for Outbreak Detection (BSTI). Das Bayesian Model for Outbreak Detection gibt es schon länger, es wird beispielsweise international für Influenza-Prognosen genutzt. Die Covid-Variante "basiert auf einer Version, die wir mit dem RKI in Januar publiziert haben", sagte Gordon Pipa Golem.de. Ziel sei es zum einen, die Verlässlichkeit bei der Vorhersage explizit zu machen, und zum anderen, den Interaktionskernel zu schätzen.
Das BSTI-Modell unterscheidet sich von anderen Methoden durch zwei wesentliche Merkmale. "Zum einen liefert die neue Methode einen Vorhersagehorizont, der es ermöglicht, die Verlässlichkeit der Prognosen zu beurteilen. Weiterhin wird der Einfluss vom örtlich benachbarten Infektionsgeschehen mit einbezogen. Das erlaubt uns, auch die Dynamik der Ausbreitung zu bewerten", sagte der Forscher.
Interaktion mit einem Zahlenwert bewerten
Ein Interaktionskernel beschreibt den Grad der Auswirkung, die eine niedrige oder auch eine hohe Infektionszahl auf eine benachbarte Region hat. Die Osnabrücker Neuroinformatiker haben mit diesem Konstrukt zusammen mit dem RKI schon 2019 gute Erfahrungen gemacht - genutzt wurden Interaktionskernel etwa bei der Beschreibung des Verlaufs von Borreliose, Campylobacter-Bakterien und dem Rotavirus.
Auf die Frage, wie die Struktur des Netzwerks aussieht und wie sie erstellt wurde, antwortete Pipa: "Wir nutzen kein explizites Netzwerk, die Nachbarschaftsbeziehungen werden durch Zufallsziehungen abgeschätzt. Das heißt, wir arbeiten in einem wirklich euklidischen Raum und nicht in einer Netzwerkstruktur."
Aufbau der Wahrscheinlichkeiten
Was die Wahrscheinlichkeitstabellen betrifft, werde ein klassischer Ansatz genutzt, wie oft in der Epidemiologie. "Die Verteilung ist negativ binomial. Der Vier-Wochen-Trend wird als linear plus quadratische Komponente pro Landkreis geschätzt. Es werden 1.000 Modelle pro Landkreis berechnet, welche als Bayesian Model im Ganzen zu den Verteilungen führen", beschreibt er die Zusammenhänge. Die Herangehensweise ist damit ein Bayesscher Monte-Carlo-Ansatz.
Ein Bayessches Netz ist ein Entscheidungsnetzwerk in Form eines gerichteten azyklischen Graphen, dessen Kanten konditionale Abhängigkeiten beschreiben und dessen Knoten aus Zufallswerten bestehen, für die Markov-Chain-Monte-Carlo-Verfahren verwendet werden.
Gegenseitige Beeinflussung
Da sich die Landkreise in der Entwicklung von Covid-19-Infektionen gegenseitig beeinflussen, stellt sich auch die Frage nach den Landkreisen, die an den Außengrenzen Deutschlands gelegen sind. Viren machen vor Grenzen nicht halt, trotzdem muss es bei Modellberechnungen eine Behandlung der Landkreise am Rand geben. "An der Grenze haben wir uns entschlossen, keine Daten zu samplen. Das bedeutet, dass Daten bei der Berechnung, die zufällig gezogen werden und außerhalb der Landesgrenzen liegen, nicht berücksichtigt werden", sagte Pipa. Gleichzeitig würden auch die Informationen zu den Infektionszahlen aus den Nachbarländern nicht verwendet. "Alternativen wie zyklische Randbedingungen haben wir bewusst nicht genutzt, weil dies zu größeren Fehlern führen kann." Die Daten aus dem Ausland lägen zudem nicht für alle Nachbarn vor.
Wie genau ist das Vorhersagesystem?
Wie bei jeder Prognose stellt sich auch bei dem Projekt des Jülicher Forschungszentrums die Frage, wie gut eigentlich vorhergesagt wird. Zu der Auswertung, in der die Ergebnisse mit der Realität abgeglichen werden, sagte Gordon Pipa: "Wir monitoren seit einigen Wochen die Ergebnisse der Methode und haben bisher nur wenige Ausreißer entdecken können, die nicht mit den Konfidenzintervallen kompatibel sind. Und ja, trotzdem ändern und verbessern wir die Methode weiter, um auf solche seltenen Fälle zu reagieren."
Das Modell selbst sei ja nicht neu, sondern bereits publiziert. Allerdings sei die Anwendung auf Covid-19 neu und bringe aufgrund der schnellen Dynamik einige Besonderheiten wie den sehr wahrscheinlich stark lokalen Interaktionskernel mit sich, erklärte Pipa.
Es ist faszinierend, wie genau die Vorhersagekorridore sind - basieren sie doch auf einer doppelten Vorhersage unter Verwendung von Zufallszahlen. Aber indem massiv viele Simulationen durchgeführt werden, verliert gerade die Monte-Carlo-Simulation einen großen Teil ihrer Fehleranfälligkeit. Und weil viele Landkreise sehr oft durchgerechnet werden müssen, um eine vernünftige Prognosenwahrscheinlichkeit zu erhalten, braucht es eben eine Menge Rechenpower.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Covid-19: So funktioniert die Corona-Vorhersage am FZ Jülich |
- 1
- 2
a.) man nutzt eine Technik die für den Einsatzzweck nicht entwickelt und gedacht ist...
Naja, bei Covid kann man schon ein paar Sachen vorhersagen. Zum Beispiel werden die...
Glauben Sie, diese Geschichte ist wahr? Oder hat Ihnen das FZ Jülich einen Bären aufgebunden?
Es reicht offiziell auch ein Topflappen. Hmm, warum ist dieses Virus noch da? Mit dem...