Abo
  • Services:
Anzeige
Ösi-Tux mit Thermometer
Ösi-Tux mit Thermometer (Bild: Alexander Merz/Golem.de)

Geoencoding hilft uns weiter

Dazu schreiben wir ein Python-Skript. Es ermittelt alle Datensätze in der Datenbank, in denen entweder eine Stadt oder eine Postleitzahl oder beides angegeben ist. Mit diesen Daten rufen wir das Python-Package geocoder auf. Es liefert uns die zugehörigen geografischen Angaben, zumindest meistens. Leider ist auch nicht jede Angabe eindeutig. Deshalb müssen wir zwangsläufig jeden Eintrag manuell gegenprüfen, wobei wir noch einige Zahlendreher und Vertipper in Postleitzahlen entdecken. Schließlich gelingt es uns. Alle Datensätze mit Ortsangaben haben nun auch eine Breiten- und Längengradangabe, insgesamt sind es 326 verschiedene Ortsangaben.

Anzeige

Eine große Überraschung

Mit den so korrigierten Datensätzen erzeugen wir in QGIS erneut eine Übersichtskarte der Messstationen - und sind verblüfft: Das Verteilungsmuster kommt uns bekannt vor. Tatsächlich gleicht es der vom Institut für deutsche Wirtschaft herausgegebenen Karte der IT-Arbeitsplätze in Deutschland.

  • Mengenverteilung der eingesetzten Elektronikplattform (Bild: Alexander Merz/Golem.de)
  • Wo überall gemessen wurde in Deutschland, Österreich, Schweiz, Luxemburg und Italien (Bild: Alexander Merz/Golem.de)
  • Karte der IT-Arbeitsplätze in Deutschland (Bild: Institut für deutsche Wirtschaft)
  • Häufigkeitsverteilung der Messwerte (Bild: Alexander Merz/Golem.de)
  • Median und Durchschnitt der Temperaturwerte im Tagesverlauf (Bild: Alexander Merz/Golem.de)
  • Durchschnittstemperaturen im Ländervergleich (Bild: Alexander Merz/Golem.de)
  • Mediantemperaturen im Ländervergleich (Bild: Alexander Merz/Golem.de)
  • Durchschnittstemperaturen im Bundesländervergleich (Bild: Alexander Merz/Golem.de)
  • Mediantemperaturen im Bundesländer-Vergleich (Bild: Alexander Merz/Golem.de)
  • Durchschnittliche Temperarturentwicklung (Bild: Alexander Merz/Golem.de)
  • Temperarturentwicklung im Median (Bild: Alexander Merz/Golem.de)
  • Entwicklung der Lufttemperatur und der Bürotemperatur (Bild: Alexander Merz/Golem.de)
  • Verhältnis zwischen den Messwerten mit Token und ohne Token (Bild: Alexander Merz/Golem.de)
  • Geräte der Nicht-Token-Nutzer (Bild: Alexander Merz/Golem.de)
  • Geräte der Token-Nutzer (Bild: Alexander Merz/Golem.de)
  • Anzahl der neu genutzten Tokens pro Tag (Bild: Alexander Merz/Golem.de)
  • Messdauer von Tokennutzern (Bild: Alexander Merz/Golem.de)
  • Von R generierte Graphik der Nicht-Token-Nutzern, weitgehend im Roh-Zustand (Bild: Alexander Merz/Golem.de)
Wo überall gemessen wurde in Deutschland, Österreich, Schweiz, Luxemburg und Italien (Bild: Alexander Merz/Golem.de)

Zumindest für die IT-Büros scheint die Teilnehmerverteilung des Temperaturmessprojekts repräsentativ zu sein.

Wenn zu viel getestet wird

Bevor wir mit den Temperaturwerten beginnen, werfen wir einen Blick auf die Menge der Testwerte. Nutzer konnten ihren übermittelten Datensatz mit einem Debug-Flag versehen. Der Wert sollte dann nicht in die Auswertung eingehen. Doch unsere Datenbank liefert uns eine überraschende Aussage: Ein Viertel der Werte ist mit einem Debug-Flag versehen. Darunter befinden sich auch viele Datensätze von Token-Nutzern - deren übrige Angaben aber korrekt aussehen. Wir schauen uns deren Werte an, sie sehen trotz des Debug-Flags valide aus. Deshalb entscheiden wir uns, auch Datensätze mit dem Debug-Flag in die Auswertung mitaufzunehmen. Wir können schließlich auch bei den vermeintlich regulären Sendungen nicht von fehlerfreien Messungen ausgehen.

Hoffentlich valide Temperaturdaten

Eine Häufigkeitsanalyse liefert uns einen ersten Eindruck von den Temperaturwerten. Insgesamt gibt es 5.493 unterschiedliche Messwerte. Die Anzahl mag verblüffen, aber da wir keine konkrete Vorgabe zur Genauigkeit der übermittelten Werte gemacht haben, ist das erklärlich. Wir erzeugen eine Grafik mit den Häufigkeiten pro Wert. Dabei betrachten wir die Werte mit Debug-Flag und ohne getrennt. Im Graphen zeigt sich, dass sich die Verteilung ähnelt.

  • Mengenverteilung der eingesetzten Elektronikplattform (Bild: Alexander Merz/Golem.de)
  • Wo überall gemessen wurde in Deutschland, Österreich, Schweiz, Luxemburg und Italien (Bild: Alexander Merz/Golem.de)
  • Karte der IT-Arbeitsplätze in Deutschland (Bild: Institut für deutsche Wirtschaft)
  • Häufigkeitsverteilung der Messwerte (Bild: Alexander Merz/Golem.de)
  • Median und Durchschnitt der Temperaturwerte im Tagesverlauf (Bild: Alexander Merz/Golem.de)
  • Durchschnittstemperaturen im Ländervergleich (Bild: Alexander Merz/Golem.de)
  • Mediantemperaturen im Ländervergleich (Bild: Alexander Merz/Golem.de)
  • Durchschnittstemperaturen im Bundesländervergleich (Bild: Alexander Merz/Golem.de)
  • Mediantemperaturen im Bundesländer-Vergleich (Bild: Alexander Merz/Golem.de)
  • Durchschnittliche Temperarturentwicklung (Bild: Alexander Merz/Golem.de)
  • Temperarturentwicklung im Median (Bild: Alexander Merz/Golem.de)
  • Entwicklung der Lufttemperatur und der Bürotemperatur (Bild: Alexander Merz/Golem.de)
  • Verhältnis zwischen den Messwerten mit Token und ohne Token (Bild: Alexander Merz/Golem.de)
  • Geräte der Nicht-Token-Nutzer (Bild: Alexander Merz/Golem.de)
  • Geräte der Token-Nutzer (Bild: Alexander Merz/Golem.de)
  • Anzahl der neu genutzten Tokens pro Tag (Bild: Alexander Merz/Golem.de)
  • Messdauer von Tokennutzern (Bild: Alexander Merz/Golem.de)
  • Von R generierte Graphik der Nicht-Token-Nutzern, weitgehend im Roh-Zustand (Bild: Alexander Merz/Golem.de)
Häufigkeitsverteilung der Messwerte (Bild: Alexander Merz/Golem.de)

Die Werte 0 und 99 treten vergleichsweise häufig auf. Auch wir hatten zu Beginn unseres Projekts häufig solche Werte, während wir mit den verschiedenen Elektronikplattformen experimentierten. Sie entstanden durch fehlerhaft ausgelesene Sensoren oder Fehler bei der Aufbereitung der Daten für die Übermittlung per URL.

Auffällig ist auch die Häufung im Bereich um die 40 °C. Ein Blick in die Datenbank zeigt, dass es sich anscheinend tatsächlich um die korrekten Werte eines einzelnen Teilnehmers handelt, auch wenn sie als Debug-Werte gekennzeichnet sind.

Aufgrund der Häufigkeitsverteilung wird deutlich, dass wir uns für eine sinnvolle Betrachtung auf einen Wertebereich von 10 bis 45 °C Grad beschränken können. Das sind immer noch gut 4,1 Millionen Messwerte.

Am wärmsten ist es nicht mittags

Aus dieser Menge errechnen wir einen Mittelwert über den ganzen Tag von 24,8 °C. Unterscheiden wir nach der Tageszeit: Tagsüber, von 7 bis 19 Uhr, beträgt der Median 24,9 °C, der Durchschnitt 25 °C. Nachts liegt der Temperatur-Mittelwert bei 24,7 °C. Gliedern wir die Werte nach den Stunden des Tages auf, ist das Minimum gegen 7 und 8 Uhr früh erkennbar. Das Maximum wird gegen 17 Uhr erreicht. Dabei beträgt allerdings die Differenz zwischen Minimum- und Maximum-Temperatur gerade einmal rund 1,4 °C.

Interessant wird es im Ländervergleich.

 Die Programmiersprache für StatistikfansDer European Office Contest 

eye home zur Startseite
H4ndy 15. Mär 2017

Seit Golem.de nur noch über SSL läuft, funktioniert mein kleiner ESP leider nicht mehr...

Themenstart

Eheran 09. Mär 2017

Weil das Luftfeuchte, also verdampftes Wasser, ist. So wie man bei kochendem Wasser...

Themenstart

am (golem.de) 09. Mär 2017

Da danken wir doch ganz besonders!

Themenstart

am (golem.de) 09. Mär 2017

Vielen Dank und der Fehelr ist gefixt!

Themenstart

am (golem.de) 09. Mär 2017

Vielen Dank für das Lob! Wegen Skript siehe hier: https://forum.golem.de/kommentare...

Themenstart

Kommentieren



Anzeige

Stellenmarkt
  1. Robert Bosch GmbH, Abstatt
  2. Hermle Maschinenbau GmbH, Ottobrunn bei München
  3. Dataport, Hamburg
  4. Rechenzentrum Region Stuttgart GmbH, Stuttgart


Anzeige
Blu-ray-Angebote
  1. (u. a. Hobbit Trilogie Blu-ray 43,89€ und Batman Dark Knight Trilogy Blu-ray 17,99€)
  2. 24,99€ (Vorbesteller-Preisgarantie)
  3. 29,99€ (Vorbesteller-Preisgarantie)

Folgen Sie uns
       


  1. Privacy Phone

    John McAfee stellt fragwürdiges Smartphone vor

  2. Hacon

    Siemens übernimmt Software-Anbieter aus Hannover

  3. Quartalszahlen

    Intel bestätigt Skylake-Xeons für Sommer 2017

  4. Sony

    20 Millionen Playstation im Geschäftsjahr verkauft

  5. Razer Lancehead

    Symmetrische 16.000-dpi-Maus läuft ohne Cloud-Zwang

  6. TV

    SD-Abschaltung kommt auch bei Satellitenfernsehen

  7. ZBook G4

    HP stellt Grafiker-Workstations für unterwegs vor

  8. Messenger Lite

    Facebook bringt abgespeckte Messenger-App nach Deutschland

  9. Intel

    Edison-Module und Arduino-Board werden eingestellt

  10. Linux-Distribution

    Debian 9 verzichtet auf Secure-Boot-Unterstützung



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Elektromobilität: Wie kommt der Strom in die Tiefgarage?
Elektromobilität
Wie kommt der Strom in die Tiefgarage?
  1. e.GO Life Elektroauto aus Deutschland für 15.900 Euro
  2. Elektroauto VW testet E-Trucks
  3. Elektroauto Opel Ampera-E kostet inklusive Prämie ab 34.950 Euro

In eigener Sache: Die Quanten kommen!
In eigener Sache
Die Quanten kommen!
  1. In eigener Sache Golem.de führt kostenpflichtige Links ein
  2. In eigener Sache Golem.de sucht Marketing Manager (w/m)
  3. In eigener Sache Golem.de geht auf Jobmessen

Snap Spectacles im Test: Das Brillen-Spektakel für Snapchat-Fans
Snap Spectacles im Test
Das Brillen-Spektakel für Snapchat-Fans
  1. Kamera Facebook macht schicke Bilder und löscht sie dann wieder
  2. Snap Spectacles Snap verkauft Sonnenbrille mit Kamera für 130 US-Dollar
  3. Soziales Netzwerk Snapchat geht an die Börse - und Google profitiert

  1. Re: an alle Debian Mitarbeiter ...

    /usr/ | 01:46

  2. Re: Nach Abschaltung kostenfrei?

    cepe | 01:38

  3. Re: Freizeit

    MINTiKi | 01:27

  4. Bin nach Jahren wieder bei Logitech

    Eron | 01:22

  5. Re: Objektiv oder Subjektiv

    plutoniumsulfat | 01:18


  1. 18:05

  2. 17:30

  3. 17:08

  4. 16:51

  5. 16:31

  6. 16:10

  7. 16:00

  8. 15:26


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel