Wahrscheinlichkeiten mit Bayesschen Netzen

Verwendet wird dabei das Covid-19 Bayesian Modelling for Outbreak Detection (BSTI). Das Bayesian Model for Outbreak Detection gibt es schon länger, es wird beispielsweise international für Influenza-Prognosen genutzt. Die Covid-Variante "basiert auf einer Version, die wir mit dem RKI in Januar publiziert haben", sagte Gordon Pipa Golem.de. Ziel sei es zum einen, die Verlässlichkeit bei der Vorhersage explizit zu machen, und zum anderen, den Interaktionskernel zu schätzen.

Das BSTI-Modell unterscheidet sich von anderen Methoden durch zwei wesentliche Merkmale. "Zum einen liefert die neue Methode einen Vorhersagehorizont, der es ermöglicht, die Verlässlichkeit der Prognosen zu beurteilen. Weiterhin wird der Einfluss vom örtlich benachbarten Infektionsgeschehen mit einbezogen. Das erlaubt uns, auch die Dynamik der Ausbreitung zu bewerten", sagte der Forscher.

Interaktion mit einem Zahlenwert bewerten

Ein Interaktionskernel beschreibt den Grad der Auswirkung, die eine niedrige oder auch eine hohe Infektionszahl auf eine benachbarte Region hat. Die Osnabrücker Neuroinformatiker haben mit diesem Konstrukt zusammen mit dem RKI schon 2019 gute Erfahrungen gemacht - genutzt wurden Interaktionskernel etwa bei der Beschreibung des Verlaufs von Borreliose, Campylobacter-Bakterien und dem Rotavirus.

Auf die Frage, wie die Struktur des Netzwerks aussieht und wie sie erstellt wurde, antwortete Pipa: "Wir nutzen kein explizites Netzwerk, die Nachbarschaftsbeziehungen werden durch Zufallsziehungen abgeschätzt. Das heißt, wir arbeiten in einem wirklich euklidischen Raum und nicht in einer Netzwerkstruktur."

Aufbau der Wahrscheinlichkeiten

Was die Wahrscheinlichkeitstabellen betrifft, werde ein klassischer Ansatz genutzt, wie oft in der Epidemiologie. "Die Verteilung ist negativ binomial. Der Vier-Wochen-Trend wird als linear plus quadratische Komponente pro Landkreis geschätzt. Es werden 1.000 Modelle pro Landkreis berechnet, welche als Bayesian Model im Ganzen zu den Verteilungen führen", beschreibt er die Zusammenhänge. Die Herangehensweise ist damit ein Bayesscher Monte-Carlo-Ansatz.

Ein Bayessches Netz ist ein Entscheidungsnetzwerk in Form eines gerichteten azyklischen Graphen, dessen Kanten konditionale Abhängigkeiten beschreiben und dessen Knoten aus Zufallswerten bestehen, für die Markov-Chain-Monte-Carlo-Verfahren verwendet werden.

Gegenseitige Beeinflussung

Da sich die Landkreise in der Entwicklung von Covid-19-Infektionen gegenseitig beeinflussen, stellt sich auch die Frage nach den Landkreisen, die an den Außengrenzen Deutschlands gelegen sind. Viren machen vor Grenzen nicht halt, trotzdem muss es bei Modellberechnungen eine Behandlung der Landkreise am Rand geben. "An der Grenze haben wir uns entschlossen, keine Daten zu samplen. Das bedeutet, dass Daten bei der Berechnung, die zufällig gezogen werden und außerhalb der Landesgrenzen liegen, nicht berücksichtigt werden", sagte Pipa. Gleichzeitig würden auch die Informationen zu den Infektionszahlen aus den Nachbarländern nicht verwendet. "Alternativen wie zyklische Randbedingungen haben wir bewusst nicht genutzt, weil dies zu größeren Fehlern führen kann." Die Daten aus dem Ausland lägen zudem nicht für alle Nachbarn vor.

Wie genau ist das Vorhersagesystem?

Wie bei jeder Prognose stellt sich auch bei dem Projekt des Jülicher Forschungszentrums die Frage, wie gut eigentlich vorhergesagt wird. Zu der Auswertung, in der die Ergebnisse mit der Realität abgeglichen werden, sagte Gordon Pipa: "Wir monitoren seit einigen Wochen die Ergebnisse der Methode und haben bisher nur wenige Ausreißer entdecken können, die nicht mit den Konfidenzintervallen kompatibel sind. Und ja, trotzdem ändern und verbessern wir die Methode weiter, um auf solche seltenen Fälle zu reagieren."

Das Modell selbst sei ja nicht neu, sondern bereits publiziert. Allerdings sei die Anwendung auf Covid-19 neu und bringe aufgrund der schnellen Dynamik einige Besonderheiten wie den sehr wahrscheinlich stark lokalen Interaktionskernel mit sich, erklärte Pipa.

Es ist faszinierend, wie genau die Vorhersagekorridore sind - basieren sie doch auf einer doppelten Vorhersage unter Verwendung von Zufallszahlen. Aber indem massiv viele Simulationen durchgeführt werden, verliert gerade die Monte-Carlo-Simulation einen großen Teil ihrer Fehleranfälligkeit. Und weil viele Landkreise sehr oft durchgerechnet werden müssen, um eine vernünftige Prognosenwahrscheinlichkeit zu erhalten, braucht es eben eine Menge Rechenpower.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 Covid-19: So funktioniert die Corona-Vorhersage am FZ Jülich
  1.  
  2. 1
  3. 2


schnedan 29. Nov 2020

a.) man nutzt eine Technik die für den Einsatzzweck nicht entwickelt und gedacht ist...

subjord 26. Nov 2020

Naja, bei Covid kann man schon ein paar Sachen vorhersagen. Zum Beispiel werden die...

thomas-anderson 23. Nov 2020

Glauben Sie, diese Geschichte ist wahr? Oder hat Ihnen das FZ Jülich einen Bären aufgebunden?

Pantsu 21. Nov 2020

Es reicht offiziell auch ein Topflappen. Hmm, warum ist dieses Virus noch da? Mit dem...



Aktuell auf der Startseite von Golem.de
Automobil
Keine zwei Minuten, um einen Tesla Model 3 zu hacken

Bei der Hacking-Konferenz Pwn2Own 2023 hat ein Forschungsteam keine zwei Minuten benötigt, um ein Tesla Model 3 zu hacken. Das brachte dem Team jede Menge Geld und einen neuen Tesla ein.

Automobil: Keine zwei Minuten, um einen Tesla Model 3 zu hacken
Artikel
  1. Fiktive Szenarien und Stereotype: AfD nutzt KI-Fotos für propagandistische Zwecke
    Fiktive Szenarien und Stereotype
    AfD nutzt KI-Fotos für propagandistische Zwecke

    Politiker der Alternative für Deutschland (AfD) nutzen realistische KI-Bilder, um Stimmung zu machen. Die Bilder sind kaum von echten Fotos zu unterscheiden.

  2. Java 20, GPT-4, Typescript, Docker: Neue Java-Version und AI everwhere
    Java 20, GPT-4, Typescript, Docker
    Neue Java-Version und AI everwhere

    Dev-Update Oracle hat Java 20 veröffentlicht. Enthalten sind sieben JEPs aus drei Projekten. Dev-News gab es diesen Monat auch in Sachen Typescript, Docker und KI in Entwicklungsumgebungen.
    Von Dirk Koller

  3. Socket: ChatGPT findet Malware in NPM- und Python-Paketen
    Socket
    ChatGPT findet Malware in NPM- und Python-Paketen

    Der Anbieter eines Sicherheitsscanners, Socket, nutzt den Chatbot von OpenAI auch zur Untersuchung von Paketen.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • Crucial SSD 1TB/2TB bis -43% • RAM im Preisrutsch • RTX 4090 erstmals unter 1.700€ • MindStar: iPhone 14 Pro Max 1TB 1.599€ • SSDs & Festplatten bis -60% • AOC 34" UWQHD 279€ • 3 Spiele kaufen, 2 zahlen [Werbung]
    •  /