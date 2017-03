Als wir Anfang des Jahres 2016 unser Projekt zur Messung der Bürotemperatur konzipierten, verfolgten wir damit als Redaktion mehrere Ziele: Wir wollten unsere Leser zur Beschäftigung mit Elektronik animieren und uns dabei ganz praktisch mit Datenjournalismus auseinandersetzen. Das Thema Bürotemperatur schien uns dafür ideal, denn es betrifft viele unserer Leser, und ein wenig Statistik kann wohl in mancher Bürodebatte äußerst nützlich sein. Wir glauben, alle Ziele erreicht zu haben. In unserer Auswertung wollen wir nicht nur auf die reinen Temperaturwerte und Statistiken eingehen, sondern auch auf die vielen, zum Teil unerwarteten Herausforderungen, die dabei auftraten.

Ein erster Überblick

Für unsere Auswertung haben wir die Werte vom 19. April bis zum 31. August 2016 zugrunde gelegt. In dieser Zeit erhielten wir fast 4,4 Millionen Messwerte.

Wir ließen unseren Lesern die Wahl, inwieweit sie Informationen zu ihrem Messstandort preisgaben. So wissen wir, dass in neun verschiedenen Ländern gemessen wurde, für uns vollkommen überraschend nicht nur in Europa, sondern auch in Kanada und Indien. Bereitwillig wurde auch die Stadt angegeben, so finden sich 215 verschiedene Städtenamen in der Datenbank. Noch mehr Vielfalt gibt es bei den Postleitzahlen, wir finden 309 verschiedene Werte. 245 Leser gaben Breiten- und Längengrad an. Diese Werte sind aber mit Vorsicht zu betrachten, wie wir später herausfanden. Über einen zufallsgenerierten Token konnten Leser ihre Messstation anonym, zu Statistikzwecken aber eindeutig identifizieren lassen. 406 Tokens wurden verwendet. Praktisch alle Leser, die eine Ortsinformation übermittelten, nutzten auch einen Token.

Sieben Nutzer oder mehr?

Die Frage, wie viele Nutzer überhaupt teilnahmen, ist auf den ersten wie auch den zweiten Blick schwer zu beantworten. Hinter den Messwerten ohne Token können 10 wie auch 1.000 Messstationen stecken. Wir greifen zu einem ersten Trick, um uns der Zahl zu nähern. Wir ermitteln, wie oft Nutzer mit Token Messwerte ablieferten und bestimmen den Median-Wert. Ein typischer Token-Nutzer übermittelte 2.166 Messwerte. Wir haben knapp 15.000 Messwerte ohne Token. Nach dieser Logik verstecken sich hinter den vollständig anonymen Messwerten also gerade einmal um die sieben Nutzer. Insgesamt bleibt es also bei schätzungsweise rund 400 Teilnehmern. Wie halten aber die Zahl von 2.166 Messwerten bei Nicht-Token-Nutzern für deutlich zu hoch. Wir haben noch eine andere Idee, der wir uns später zuwenden.

Zur Einordnung: Als wir mit dem Projekt begannen, wünschten uns Kollegen mit mehr Erfahrung im Datenjournalismus und bei Nutzerbefragungen viel Glück - sie nannten schon 100 ernsthafte Teilnehmer ein optimistisches Ziel. Unsere Anforderungen an die Elektronik- und Programmierkenntnisse sowie unsere vermeintlich kleine Zielgruppe schienen ihnen eine zu große Hürde.

Raspberry Pi als Elektronikplattform weit vorn

Werfen wir zunächst noch einen Blick auf leichter zu ermittelnde Statistikdaten. Wir baten auch um die Angabe der verwendeten Elektronikplattform. Dabei liegen die Bastelcomputer wie der Raspberry Pi weit vorn, mit ihnen wurde die Hälfte der Messwerte ermittelt. Mikro-Controller-Boards wie Arduinos und Funkmodule wie der ESP8266 kommen zusammen nicht einmal auf ein Viertel. Interessanterweise spiegelt diese Verteilung auch das Leserinteresse an den zugehörigen Anleitungsartikeln wider.





































Für die Analyse haben wir dann aber keinen Raspberry Pi eingesetzt, auch wenn die genutzten Programme auch darauf laufen. Auf einem Laptop mit einem Intel i7 ist es doch angenehmer, mit größeren Datenmengen zu arbeiten.