Pulitzer-Preis: Wie ein Programmierer den Journalistenpreis gewann

Die Nachricht vom Gewinn des Pulitzer-Preises kam für Christo Buschek gleich doppelt überraschend. Erstens, weil wohl niemand wirklich damit rechnet, diese hohe Auszeichnung für journalistische, literarische und musikalische Beiträge zu bekommen. Und zweitens, weil Christo Buschek weder Literat noch Musiker noch Journalist ist, sondern Programmierer. "Ganz ehrlich: Ich hatte nicht einmal mitbekommen, dass wir nominiert waren" , sagt Buschek im Gespräch mit Golem.de.
Dass ein Programmierer den renommiertesten Journalismus-Preis der Welt erhält, ist ungewöhnlich - auch wenn er ihn nicht alleine gewonnen hat. Buschek ist Teil eines Dreierteams, das eine herausragende Recherche auf die Beine stellte, deren Ergebnis eine Artikelserie bei Buzz Feed News(öffnet im neuen Fenster) war.
Es ging um potenzielle Standorte von Camps, in denen die chinesische Staatsführung Angehörige der uigurischen Minderheit zur Umerziehung interniert. Buschek ersann eine Möglichkeit, diese Standorte zu identifizieren und seine beiden Kolleginnen, die Journalistin Megha Rajagopalan und die Architektin Alison Killing, bei der Auswertung zu unterstützen. Allein Buscheks Nennung als Mitautor der Texte, schließlich aber auch die Auszeichnung selbst zeigt, wie wertvoll Computer und maßgeschneiderte Software für aufwändige Recherchearbeiten sein können.
Erst Doom, dann Datensammeln
Buschek ist der erste Österreicher überhaupt, der einen Pulitzer-Preis erhält. Es gab feierliche Empfänge in Wien und in Buscheks Heimstatt Graz. Das österreichische leadersnet.at(öffnet im neuen Fenster) fasste Buscheks Verdienste so zusammen: "Besonders bemerkenswert ist, dass der Preisträger nicht als Journalist, sondern als Softwareprogrammierer tätig ist. Mit datenbezogenen Recherchen unterstützt er Menschenrechtsorganisationen und Investigativjournalisten."
Interesse an Computern hatte der 1980 geborene Buschek schon früh - zunächst vor allem an Computerspielen: "Ich habe gern und viel gespielt, und damals war es so, dass man vieles selber machen musste. Also habe ich mir selbst das Programmieren beigebracht." Als prägende Spiele nennt er die Adventures von Lucas Arts, Wing Commander und "das originale Doom" , fügt aber sofort hinzu, dass er heute nicht mehr spiele. Gut, bis auf "Mario auf der Switch, und mit Zelda hatte ich mal angefangen, aber in dem Spiel bin ich einfach nicht gut."
Ohnehin war Buschek nie einseitig nur am Daddeln und Programmieren interessiert. "Ich war ich immer politisch aktiv und interessiert." Manchmal vermischte sich beides, "digitale Sicherheit, Datensammeln, Auswirkungen auf die Gesellschaft, das waren Themen, an denen ich gearbeitet habe." Ein Weg, der ihn letztlich zum Preisträger machte.
Die Entstehung der ausgezeichneten Artikelserie
Die Basis für den Pulitzer-Preis wurde von der China-Korrespondentin Megha Rajagopalan gelegt. Sie berichtete unter anderem für die Nachrichtenagentur Reuters und für Buzzfeed aus dem Land. Nachdem sie sich eines Tages im uigurischen Autonomie-Gebiet Xinjiang Komplexe angeschaut hatte, die offiziell "Zentrum zur beruflichen Qualifizierung und Ausbildung" heißen und "religiösen Extremismus" verhindern sollen, wurde ihr Journalistenvisum nicht mehr verlängert.
Als Reaktion auf diese Verhinderung von Berichterstattung sprach Rajagopalan zunächst mit der britischen Architektin Alison Killing, die auch Spezialistin für räumliche Analyse von Geodaten zu sozialen Zwecken ist. Die wiederum holte Buschek mit ins Boot - um zu überlegen, wie "man weiter recherchieren könnte, ohne vor Ort zu sein" , beschreibt der in Berlin arbeitende Programmierer die Anfänge des Projekts.
Bei diesen Recherchen fielen ihnen Zensurkacheln auf Baidu Maps - einer mit Google Maps vergleichbaren Anwendung für den chinesischen Markt - auf, mit denen die chinesische Regierung sämtliche Gegenden abdecken lässt, die sie lieber nicht aus dem All fotografiert im Internet einsehbar haben möchte. Sie fragten sich: Könnte es sein, dass einige der Zensurkacheln mit den Camps, in denen Uiguren interniert werden, korrelieren? Kann man vielleicht die gesamte Provinz von außen daraufhin überprüfen?
Die technische Lösung
Buschek sah schnell, dass zum Auffinden der mit Zensurkacheln abgedeckten Gebiete technische Hilfsmittel der richtige Ansatz sind. "Ich wollte das automatisieren" , sagt er. Dazu sei es wichtig herauszufinden, wie Zensur technisch ablaufe und ob sich dadurch vielleicht Ansatzpunkte ergeben.
Auf die Analyse folgte eine erste Antwort: "Die Kacheln wurden zusätzlich hineingerendert, sie stammten wohl aus einer anderen Datenbasis als das eigentliche Kartenmaterial." Deshalb waren sie auch so sehr als Fremdkörper zu erkennen und unterschieden sich damit von Gebieten, zu denen keine Satellitenbilder gefunden werden konnten oder wo auch einfach nur das Laden nicht klappte.



.png)
Auf dieser Basis schrieb Buschek ein Programm, das einen scrollenden User simulierte. So erfasste er nach und nach die ganze Region, nämlich das zu China gehörende und an Kasachstan grenzende Xinjiang, und katalogisierte die Zensurflecken.
Die chinesische Staatsführung sollte keinesfalls vorzeitig Verdacht schöpfen. Dabei sei es wichtig gewesen, erklärt er, "dass nicht zu mechanisch gescrollt wird, es gibt nämlich Methoden, das zu erkennen." Etwas unrhythmisch, ab und zu innehalten, manchmal an eine Stelle zurückgehen, "das ist noch nicht wie menschliches Verhalten" , gibt der Programmierer zu, "aber es kommt ihm schon näher." Für die Datenerfassung reichte dieses Vorgehen, um nicht zu systematisch zu wirken.
24 Server scrollen zwei Monate lang herum
Es dauerte lange, die Region zu erfassen. "Ich habe anderthalb Monate implementiert, dann haben 24 Server zwei Monate lang herumgescrollt" erinnert sich Buschek. Xinjiang, offiziell lautet die chinesische Bezeichnung Uigurisches Autonomes Gebiet Xinjiang (von der Unabhängigkeitsbewegung Ostturkestan genannt), ist von der Fläche her die größte der 33 Verwaltungseinheiten der Volksrepublik China. Mit knapp 1,7 Millionen Quadratkilometern ist die Region mehr als 4,5-mal so groß wie Deutschland - und die Zensurflecken tauchten erst bei Zoomstufen auf, in denen Infrastrukturdetails erkennbar wären.
Neben der großen Fläche stieß Buschek aber noch auf ein weiteres Problem: "Baidu legt keine Priorität auf Aufrufe aus dem Ausland. Viele Anfragen schlugen deshalb immer wieder fehl und mussten wiederholt werden." Erst durch Caching von Resource-Dateien, wie zum Beispiel solchen mit Javascript, gelang es ihm, das Programm halbwegs effektiv laufen zu lassen.
Zumal das Programm ja nicht nur ein paar Geodaten speichern, sondern auch dokumentieren muss, was wann wie gefunden wurde. Generell gelte, dass man sich "nicht darauf verlassen kann, dass Daten online bleiben" , sagt Buschek. Screenshots zu machen, sei deshalb wichtig gewesen.
Nach der Suche deaktivierte Buschek den Crawler: "Wir brauchten ihn nicht mehr und es verursacht ja auch Kosten, sowas dann grundlos weiterlaufen zu lassen." Als er ihn jedoch ein halbes Jahr später aus Neugier wieder einmal starten wollte, hatten sich die Zensurtechniken schon wieder so weit geändert, dass er nicht mehr funktionierte.
Über den Grund dieser Änderungen könne man nur spekulieren, sagt Buschek. "Es gab aber auch keinen Anlass, Zeit aufzuwenden und die Software wieder zum Laufen zu bringen." Buschek bezeichnet solche Art von Software als Einmalsoftware, weil sie ihren Zweck erfüllt hat und dann nicht mehr gebraucht wird.
Ein riesiger Haufen an Daten
Die erste Datensammlung war riesengroß. Viel zu groß, um sich alles manuell anzuschauen - Buscheks Crawler hatte mehr als fünf Millionen zensierte Flecken gefunden. Deshalb entstand die Idee, die Zensurkacheln mit Rechnerhilfe weiter zu kategorisieren: Lager brauchen eine gewisse Infrastruktur um sie herum: "In erster Linie schaut man nach Straßen und Verkehrsanbindung für die Versorgung, aber natürlich auch für den An- und Abtransport von Inhaftierten und Mitarbeitern."
Mit Hilfe von Daten aus Openstreetmap, Google Maps, Google Earth und anderen wurden Gebiete markiert, die über eine gewisse Infrastruktur verfügen - Straßen, Städte, Ballungszentren. Die daraus gewonnenen Geodaten wurden dann mit denen der Zensurkacheln abgeglichen. "Übrig blieben 50.000 Stellen" , immer noch viel, aber es war machbar, diese "manuell anzuschauen" .
Manuell anschauen bedeutete, die in China abgedeckten Stellen mit unzensierten Satellitenbildern aus Google Earth, aus dem Sentinel Hub der Europäischen Raumfahrtagentur ESA und von Planet Labs zu vergleichen - letztere leiteten sogar einen Satelliten um, um das Projekt mit aktuellen Aufnahmen zu unterstützen.
Die manuelle Auswertung der Kandidaten
Um die manuelle Auswertung machbar zu gestalten, waren wieder Buscheks Programmierkenntnisse gefragt. Er entwickelte ein Werkzeug, mit dem sich die Satellitenfotos der fraglichen Stellen anschauen ließen.
Gleichzeitig war es möglich, die Stellen mit Tags zu versehen, also zu markieren, was genau darauf sicher identifiziert werden konnte. Zum Beispiel waren das hohe, dicke Mauern, Stacheldrahtbefestigungen, Wachtürme, ob sich Parkplätze nur außerhalb befanden und vieles mehr. Mit diesen Tags ließ sich dann einsortieren, ob es sich potenziell um ein befestigtes Lager handeln konnte oder nicht.
Gefunden wurde eine größere Menge an Lagern als gedacht. "Wir wussten, dass es Camps gibt, es waren 20, 30 bekannt - aber es gab Indizien, dass es bis zu 1.200 geben könnte" , erzählt Buschek. Die unterteilen sich noch einmal in drei Arten von Locations: Die, bei denen sich das Team sicher war, dass es sich um Camps handelte, weil entweder jemand vor Ort war oder Leute, die dort interniert waren, dies verifizierten.
Die zweite Kategorie lautet: "Wir glauben, dass es sich um ein Camp handelt, haben aber keine Beweise dafür." Als Drittes blieben jene übrig, wo es keine gesicherten Belege gab, sich aber trotzdem möglicherweise noch Beweise finden lassen würden.
Weil Buschek keinen "aktiven Research" macht, wie er sagt, war er entsprechend weniger mit Augenzeugenberichten und Bildern von Gräueln konfrontiert als andere Projektbeteiligte. "Man will natürlich nicht komplett abstrahieren" , sagt er, "jeder findet seinen Weg, mit Gesehenem fertig zu werden - meiner ist, mir Auszeiten zu nehmen, zu verreisen, für eine ausgeglichene Bilanz zwischen dem eigenen Leben und dem, was man durch die Arbeit miterlebt, zu finden."
Wieso nicht mehr Technikunterstützung mit Pattern Recognition?
Bei dem Prozess wurde keine automatische Pattern Recognition benutzt. Das hatte auch technische Gründe, zum Beispiel, weil es sehr aufwendig wäre, etwa ein Machine-Learning-System für die Aufgabe zu trainieren. Das würde nicht nur hohe Kosten verursachen, weil eine große Infrastruktur benötigt wird, sondern auch ethische Probleme aufwerfen - nämlich nicht genau zu wissen, ob man dem Computer dabei auch trauen kann.
"Wenn bei Netflix einmal eine Empfehlung herauskommt, die absolut falsch ist, ist das für den betroffenen Kunden natürlich ärgerlich, aber kein Problem - in unserem Fall wäre es dagegen eine Katastrophe." Immer eine menschliche Komponente im Prozess zu haben, ist Buschek wichtig, vor allem, wenn es um Menschenrechte geht. "Manchmal ist nicht ganz klar, wo der Unterschied zwischen Spionage und Agieren mit ethischem Hintergrund liegt" , sagt er. "Daten müssen in einen Kontext gesetzt werden."
Plötzlich Pulitzer-Preisträger
Er versuche, es mit seinen Werkzeugen anderen zu ermöglichen, Daten zu recherchieren, sagt Buschek über seine generelle Intention. Im Fall der Buzz-Feed-News-Recherche hat das besonders gut funktioniert. Buschek, Rajagopalan und Killing erhielten die Auszeichnung in der Kategorie Internationale Berichterstattung "für eine Reihe klarer und fesselnder Geschichten, die Satellitenbilder und architektonisches Fachwissen sowie Interviews mit zwei Dutzend ehemaligen Gefangenen nutzen, um eine riesige neue Infrastruktur zu identifizieren, die von der chinesischen Regierung für die Masseninhaftierung von Muslimen gebaut wurde" . So begründete die Stiftung die Verleihung des Preises auf ihrer Webseite(öffnet im neuen Fenster) .
Wie Buschek davon erfuhr, war ganz unspektakulär. "Ich habe eine Textnachricht einer Kollegin bekommen" , sagt er. Die Auszeichnung sei eine Überraschung gewesen, aber eine gute - und eine mit einem ungeahnten Nebeneffekt: Manchmal sei es doch etwas schwieriger gewesen zu vermitteln, was er mache, sagt der Pulitzer-Preisträger, "nun ist es einfacher zu verstehen."
Nicht das erste Projekt in Sachen Menschenrechte
Wie wird es für den Pulitzerpreisträger nun beruflich weitergehen? Wird er mit Angeboten aus dem In- und Ausland überhäuft? "Es werden sich andere Möglichkeiten auftun" , ist sich Buschek sicher, "ich sehe diesen Preis als Vertrauenskapital. Das heißt, es wird vielleicht leichter, Finanzierungen aufzutreiben."
Ein wichtiges Thema für Buschek war und ist die Auseinandersetzung mit dem Holocaust. "In meiner Schulzeit kamen Zeitzeugen in unsere Klasse und berichteten, was sie erlebt hatten. Das waren furchtbare Geschichten, die sie erzählten, aber es war gleichzeitig so wichtig. Denn nur, wenn wir daraus lernen, können wir auch rechtzeitig erkennen, wenn so etwas wieder zu entstehen droht."
Ein anderes Thema ist Syrien. Buschek wirkte hier an einer Software zur Dokumentation von Menschenrechtsverletzungen mit. "Ich finde das eine wichtige Ressource, auch wenn es eines Tages darum gehen wird, den Krieg aufzuarbeiten" , sagt er.



.png)
Öffentlich zugänglich sind die Daten daraus bisher nicht, "auch um die Menschen zu schützen, die beispielsweise schildern, was ihnen widerfahren ist." Zugriff haben nur Organisationen wie die Vereinten Nationen. Aus Sicherheitsgründen sind die Daten auch nicht in einer Cloud gespeichert, "sondern auf Servern, zu denen nur wir Zugang haben" , betont Buschek. Und die stehen in Europa.
Menschenrechtsverletzungen aufzeigen geht auch ohne Studium
Jungen Menschen, die sich für solche Projekte interessieren, rät Buschek einfach, möglichst viele Kontakte zu Menschen aufzubauen, die mit diesen Themen zu tun haben. "Einen offiziellen Weg gibt es nicht," vieles sei einfach Zufall oder ergebe sich eben durch Kontakte.
Eine unübliche Biografie sei wohl eher ein Plus, sagt Buschek und lacht; er selbst hat eher keinen klassischen Berufsweg eingeschlagen. Er habe weder Informatik studiert noch eine entsprechende Ausbildung gemacht. "Nach dem Abitur, das in Österreich Matura heißt, bin ich viel gereist, habe viel ausprobiert" , sagt Buschek, "und dann bin ich in das hineingerutscht, was ich heute tue."
Sommerschulen seien eine gute Gelegenheit, Einstiege zu finden, "generell wird im Journalismus ja mittlerweile umgedacht, Technologien werden aktiv gefördert - auch wenn man in den USA schon weiter ist." Und ganz wichtig, gerade wenn man von der technischen Seite komme: "Es geht nie um die Technik, es geht immer zuerst um die Menschen, das sollte man nie vergessen, auch wenn man tief in der Technik drinsteckt."
Er selbst arbeite zwar nicht wie seine Journalistenkollegen "inhaltlich, dazu habe ich die Qualitäten nicht. Aber ich möchte die Skills, die ich habe, dazu nutzen, anderen Menschen zu helfen."



