Coronavirus: Forscher auf Kopfgeldjagd
Ein Kopfgeld auf das Coronavirus ist auf der Onlinecommunity Kaggle , die zu Google gehört, ausgesetzt worden. Datenwissenschaftler und KI-Enthusiasten sollen dem Virus an den Kragen gehen.
Insgesamt sind 10.000 US-Dollar für die beste Beantwortung von zehn verschiedenen Forschungsfragen(öffnet im neuen Fenster) ausgeschrieben. Grundlage dafür ist ein unter anderem vom Weißen Haus zusammengestellter Datensatz, der aus über 45.000 wissenschaftlichen Artikeln zum Thema SARS-CoV-2 und COVID-19 besteht. Anhand dieses Datensatzes sollen die Datenwissenschaftler unter anderem beantworten, was bisher über die Übertragung, die Inkubationszeit oder auch die Risikofaktoren überhaupt bekannt ist. Es gibt bereits über 500 Einreichungen. Die erste Runde des Wettbewerbs geht noch bis zum 16. April.
Neuronale Netzwerke sollen COVID-19 diagnostizieren
Aber auch an anderer Stelle wird versucht, künstliche Intelligenz im Kampf gegen Corona zu nutzen. In einer offenen Datenbank (öffnet im neuen Fenster) tragen KI-Forscher von der University of Montreal, CT- und Röntgenaufnahmen der Lungen von an COVID-19 Erkrankten(öffnet im neuen Fenster) zusammen. Ihr Ziel ist es, mit diesen Daten künstliche neuronale Netzwerke zu trainieren, die mittels Mustererkennung die Erkrankung diagnostizieren können. In anderen Bereichen der Medizin ist dies bereits erfolgreich erprobt . Und auch in im Fall von COVID-19 zeigen sich KI-Forscher der University of California San Diego (öffnet im neuen Fenster) (UCSD) und der University of Birmingham (öffnet im neuen Fenster) verhalten zuversichtlich.
Sowohl in San Diego als auch in Birmingham wird dabei auf künstliche neuronale Netzwerke gesetzt, genauer: auf sogenannte Convolutional Neural Networks (CNNs). Dabei handelt es sich um ein Konzept des maschinellen Lernens, das auf der Imitation biologischer neuronaler Netzwerke beruht. Ähnlich wie auch in einem Gehirn bestehen CNNs klassischerweise aus mehreren Lagen miteinander vernetzter künstlicher Neuronen, welche die Daten verarbeiten.
Birmingham vermeldet mit seinem Decompose, Transfer, and Compose (DeTraC) genannten Modell Diagnosegenauigkeiten von über 90 Prozent. Den Forschern aus San Diego zufolge, die ebenfalls eine sehr hohe Genauigkeit erreichen, gibt es aber einen Haken bei der Sache: Die für das Training des CNN zur Verfügung stehende Menge an CT- und Röntgenaufnahmen sei noch zu klein. Das könne zu sogenannter Überanpassung führen, einem gefürchteten Effekt beim maschinellen Lernen. Dabei funktioniert das Modell sehr gut mit dem Trainingsdatensatz, verliert allerdings stark an Genauigkeit bei der viel größeren Bandbreite an Daten im realen Einsatz. Der grundsätzliche Ansatz ist vielversprechend . Wichtig für die weitere Forschung ist jedoch laut den Forschern aus San Diego dass eine größere Anzahl an Bilddaten verfügbar ist.
Die Forscher aus Montreal wollen dazu beitragen. Sie beabsichtigen den Aufbau einer offenen und für alle Wissenschaftler frei zugänglichen Datenbank aber auch deshalb, weil Berichten zufolge entsprechende Software kommerzieller Unternehmen in China bereits zum Einsatz kommt(öffnet im neuen Fenster) .
Eine zuverlässige COVID-19-Diagnose anhand von bildgebenden Verfahren wäre auf jeden Fall ein großer Fortschritt. Das bisher übliche Verfahren auf Grundlage der Polymerase-Kettenreaktion benötigt ein voll ausgestattetes Labor; Röntgengeräte und andere bildgebende Verfahren hingegen sind in jedem Krankenhaus vorhanden.
Künstliche Intelligenz trifft Prognosen über den Verlauf der Corona-Pandemie
Insbesondere in China nutzen Datenwissenschaftler und Epidemiologen künstliche Intelligenz auch, um voraussagen zu können, wie sich die Pandemie weiter entwickeln wird(öffnet im neuen Fenster) . Ein großes Forschungskonsortium bedient sich dabei eines Susceptible-Exposed-Infectious-Removed (SEIR)-Modells(öffnet im neuen Fenster) , einer Erweiterung des epidemiologischen Standardwerkzeugs, des Susceptible-Infected-Removed (SIR)-Modells.
Dabei unterscheidet man im Modell alle Personen in Anfällige (S), dem Virus schon Ausgesetzte, die aber noch nicht infektiös sind (E), infektiöse Infizierte (I) und den immunen Erholten bzw. Verstorbenen (R). Anhand dieser und weiterer Variablen wie verstrichener Zeit, Eigenarten des Virus wie der Infektiosität und demografischen Daten lässt sich dann anhand von Differentialgleichungen die grundsätzliche Dynamik einer Epidemie berechnen. Durch die Änderung der Variablen können viele verschiedene Eventualitäten im Umgang mit der Pandemie simuliert werden.
Die chinesischen Forscher haben dafür ihre KI auch mit Daten der ersten SARS-Pandemie aus dem Jahre 2003 trainiert. So fanden sie unter anderem heraus, dass eine auch nur um fünf Tage verzögerte Einführung von weitreichenden Ausgangssperren in Wuhan eine Vergrößerung der Epidemie in Festlandchina um das Dreifache zur Folge gehabt hätte. Die Prognosen ihrer KI sehen sie vom weiteren Verlauf der Pandemie als bestätigt an.
Als limitierenden Faktor ihrer Arbeit betrachten sie vor allem dass ihr Modell Änderungen an der Diagnosekapazität nicht berücksichtigen könne. Die Forscher können letzten Endes nur mit den Zahlen arbeiten, die durch Testverfahren erhoben werden können. Wie gut das Modell arbeitet, hängt also auch hier sehr stark davon ab, wie gut und wie flächendeckend diagnostiziert wird.
Die bisherigen Forschungsergebnisse von KI-Forschern und Datenwissenschaftlern erscheinen vielversprechend. Künstliche Intelligenz und die Analyse großer Datenmengen allein werden jedoch den großen Durchbruch im Kampf gegen das Virus nicht bringen. Zumindest noch nicht. In Zukunft dürfte künstliche Intelligenz bei der Bekämpfung und Vorbeugung von Pandemien jedoch ziemlich sicher eine große Rolle spielen.
- Anzeige Hier geht es zu Künstliche Intelligenz: Wissensverarbeitung bei Amazon Wenn Sie auf diesen Link klicken und darüber einkaufen, erhält Golem eine kleine Provision. Dies ändert nichts am Preis der Artikel.



