Abo
  • Services:
Anzeige
Ösi-Tux mit Thermometer
Ösi-Tux mit Thermometer (Bild: Alexander Merz/Golem.de)

Geoencoding hilft uns weiter

Dazu schreiben wir ein Python-Skript. Es ermittelt alle Datensätze in der Datenbank, in denen entweder eine Stadt oder eine Postleitzahl oder beides angegeben ist. Mit diesen Daten rufen wir das Python-Package geocoder auf. Es liefert uns die zugehörigen geografischen Angaben, zumindest meistens. Leider ist auch nicht jede Angabe eindeutig. Deshalb müssen wir zwangsläufig jeden Eintrag manuell gegenprüfen, wobei wir noch einige Zahlendreher und Vertipper in Postleitzahlen entdecken. Schließlich gelingt es uns. Alle Datensätze mit Ortsangaben haben nun auch eine Breiten- und Längengradangabe, insgesamt sind es 326 verschiedene Ortsangaben.

Anzeige

Eine große Überraschung

Mit den so korrigierten Datensätzen erzeugen wir in QGIS erneut eine Übersichtskarte der Messstationen - und sind verblüfft: Das Verteilungsmuster kommt uns bekannt vor. Tatsächlich gleicht es der vom Institut für deutsche Wirtschaft herausgegebenen Karte der IT-Arbeitsplätze in Deutschland.

  • Mengenverteilung der eingesetzten Elektronikplattform (Bild: Alexander Merz/Golem.de)
  • Wo überall gemessen wurde in Deutschland, Österreich, Schweiz, Luxemburg und Italien (Bild: Alexander Merz/Golem.de)
  • Karte der IT-Arbeitsplätze in Deutschland (Bild: Institut für deutsche Wirtschaft)
  • Häufigkeitsverteilung der Messwerte (Bild: Alexander Merz/Golem.de)
  • Median und Durchschnitt der Temperaturwerte im Tagesverlauf (Bild: Alexander Merz/Golem.de)
  • Durchschnittstemperaturen im Ländervergleich (Bild: Alexander Merz/Golem.de)
  • Mediantemperaturen im Ländervergleich (Bild: Alexander Merz/Golem.de)
  • Durchschnittstemperaturen im Bundesländervergleich (Bild: Alexander Merz/Golem.de)
  • Mediantemperaturen im Bundesländer-Vergleich (Bild: Alexander Merz/Golem.de)
  • Durchschnittliche Temperarturentwicklung (Bild: Alexander Merz/Golem.de)
  • Temperarturentwicklung im Median (Bild: Alexander Merz/Golem.de)
  • Entwicklung der Lufttemperatur und der Bürotemperatur (Bild: Alexander Merz/Golem.de)
  • Verhältnis zwischen den Messwerten mit Token und ohne Token (Bild: Alexander Merz/Golem.de)
  • Geräte der Nicht-Token-Nutzer (Bild: Alexander Merz/Golem.de)
  • Geräte der Token-Nutzer (Bild: Alexander Merz/Golem.de)
  • Anzahl der neu genutzten Tokens pro Tag (Bild: Alexander Merz/Golem.de)
  • Messdauer von Tokennutzern (Bild: Alexander Merz/Golem.de)
  • Von R generierte Graphik der Nicht-Token-Nutzern, weitgehend im Roh-Zustand (Bild: Alexander Merz/Golem.de)
Wo überall gemessen wurde in Deutschland, Österreich, Schweiz, Luxemburg und Italien (Bild: Alexander Merz/Golem.de)

Zumindest für die IT-Büros scheint die Teilnehmerverteilung des Temperaturmessprojekts repräsentativ zu sein.

Wenn zu viel getestet wird

Bevor wir mit den Temperaturwerten beginnen, werfen wir einen Blick auf die Menge der Testwerte. Nutzer konnten ihren übermittelten Datensatz mit einem Debug-Flag versehen. Der Wert sollte dann nicht in die Auswertung eingehen. Doch unsere Datenbank liefert uns eine überraschende Aussage: Ein Viertel der Werte ist mit einem Debug-Flag versehen. Darunter befinden sich auch viele Datensätze von Token-Nutzern - deren übrige Angaben aber korrekt aussehen. Wir schauen uns deren Werte an, sie sehen trotz des Debug-Flags valide aus. Deshalb entscheiden wir uns, auch Datensätze mit dem Debug-Flag in die Auswertung mitaufzunehmen. Wir können schließlich auch bei den vermeintlich regulären Sendungen nicht von fehlerfreien Messungen ausgehen.

Hoffentlich valide Temperaturdaten

Eine Häufigkeitsanalyse liefert uns einen ersten Eindruck von den Temperaturwerten. Insgesamt gibt es 5.493 unterschiedliche Messwerte. Die Anzahl mag verblüffen, aber da wir keine konkrete Vorgabe zur Genauigkeit der übermittelten Werte gemacht haben, ist das erklärlich. Wir erzeugen eine Grafik mit den Häufigkeiten pro Wert. Dabei betrachten wir die Werte mit Debug-Flag und ohne getrennt. Im Graphen zeigt sich, dass sich die Verteilung ähnelt.

  • Mengenverteilung der eingesetzten Elektronikplattform (Bild: Alexander Merz/Golem.de)
  • Wo überall gemessen wurde in Deutschland, Österreich, Schweiz, Luxemburg und Italien (Bild: Alexander Merz/Golem.de)
  • Karte der IT-Arbeitsplätze in Deutschland (Bild: Institut für deutsche Wirtschaft)
  • Häufigkeitsverteilung der Messwerte (Bild: Alexander Merz/Golem.de)
  • Median und Durchschnitt der Temperaturwerte im Tagesverlauf (Bild: Alexander Merz/Golem.de)
  • Durchschnittstemperaturen im Ländervergleich (Bild: Alexander Merz/Golem.de)
  • Mediantemperaturen im Ländervergleich (Bild: Alexander Merz/Golem.de)
  • Durchschnittstemperaturen im Bundesländervergleich (Bild: Alexander Merz/Golem.de)
  • Mediantemperaturen im Bundesländer-Vergleich (Bild: Alexander Merz/Golem.de)
  • Durchschnittliche Temperarturentwicklung (Bild: Alexander Merz/Golem.de)
  • Temperarturentwicklung im Median (Bild: Alexander Merz/Golem.de)
  • Entwicklung der Lufttemperatur und der Bürotemperatur (Bild: Alexander Merz/Golem.de)
  • Verhältnis zwischen den Messwerten mit Token und ohne Token (Bild: Alexander Merz/Golem.de)
  • Geräte der Nicht-Token-Nutzer (Bild: Alexander Merz/Golem.de)
  • Geräte der Token-Nutzer (Bild: Alexander Merz/Golem.de)
  • Anzahl der neu genutzten Tokens pro Tag (Bild: Alexander Merz/Golem.de)
  • Messdauer von Tokennutzern (Bild: Alexander Merz/Golem.de)
  • Von R generierte Graphik der Nicht-Token-Nutzern, weitgehend im Roh-Zustand (Bild: Alexander Merz/Golem.de)
Häufigkeitsverteilung der Messwerte (Bild: Alexander Merz/Golem.de)

Die Werte 0 und 99 treten vergleichsweise häufig auf. Auch wir hatten zu Beginn unseres Projekts häufig solche Werte, während wir mit den verschiedenen Elektronikplattformen experimentierten. Sie entstanden durch fehlerhaft ausgelesene Sensoren oder Fehler bei der Aufbereitung der Daten für die Übermittlung per URL.

Auffällig ist auch die Häufung im Bereich um die 40 °C. Ein Blick in die Datenbank zeigt, dass es sich anscheinend tatsächlich um die korrekten Werte eines einzelnen Teilnehmers handelt, auch wenn sie als Debug-Werte gekennzeichnet sind.

Aufgrund der Häufigkeitsverteilung wird deutlich, dass wir uns für eine sinnvolle Betrachtung auf einen Wertebereich von 10 bis 45 °C Grad beschränken können. Das sind immer noch gut 4,1 Millionen Messwerte.

Am wärmsten ist es nicht mittags

Aus dieser Menge errechnen wir einen Mittelwert über den ganzen Tag von 24,8 °C. Unterscheiden wir nach der Tageszeit: Tagsüber, von 7 bis 19 Uhr, beträgt der Median 24,9 °C, der Durchschnitt 25 °C. Nachts liegt der Temperatur-Mittelwert bei 24,7 °C. Gliedern wir die Werte nach den Stunden des Tages auf, ist das Minimum gegen 7 und 8 Uhr früh erkennbar. Das Maximum wird gegen 17 Uhr erreicht. Dabei beträgt allerdings die Differenz zwischen Minimum- und Maximum-Temperatur gerade einmal rund 1,4 °C.

Interessant wird es im Ländervergleich.

 Die Programmiersprache für StatistikfansDer European Office Contest 

eye home zur Startseite
H4ndy 15. Mär 2017

Seit Golem.de nur noch über SSL läuft, funktioniert mein kleiner ESP leider nicht mehr...

Eheran 09. Mär 2017

Weil das Luftfeuchte, also verdampftes Wasser, ist. So wie man bei kochendem Wasser...

am (golem.de) 09. Mär 2017

Da danken wir doch ganz besonders!

am (golem.de) 09. Mär 2017

Vielen Dank und der Fehelr ist gefixt!

am (golem.de) 09. Mär 2017

Vielen Dank für das Lob! Wegen Skript siehe hier: https://forum.golem.de/kommentare...



Anzeige

Stellenmarkt
  1. GK Software AG, Schöneck, Sankt Ingbert, Berlin, Köln
  2. Nuuk GmbH, Hamburg
  3. Volkswagen Zubehör GmbH, Dreieich bei Frankfurt am Main
  4. Bosch Software Innovations GmbH, Waiblingen


Anzeige
Top-Angebote
  1. (u. a. Ghost Recon Wildlands 26,99€, GTA 5 24,99€, Rainbox Six Siege 17,99€, Urban Empire 9...
  2. 44,99€
  3. (heute u. a. Crucial 240-GB-SSD 68€, Creative Sound Blaster Z 50,24€ und weiteres PC-Zubehör...

Folgen Sie uns
       


  1. FTTH

    Bauern am Glasfaserpflug arbeiten mit Netzbetreibern

  2. BGP-Hijacking

    Traffic von Google, Facebook & Co. über Russland umgeleitet

  3. 360-Grad-Kameras im Vergleich

    Alles so schön rund hier

  4. Grundversorgung

    Telekom baut auch noch mit Kupfer aus

  5. Playerunknown's Battlegrounds

    Pubg-Schöpfer fordert besseren Schutz vor Klonen

  6. Solarstrom

    Der erste Solarzug der Welt nimmt seinen Betrieb auf

  7. Microsoft

    Kostenloses Tool hilft bei der Migration von VMs auf Azure

  8. Streaming-Streit

    Amazon will wieder Chromecast und Apple TV verkaufen

  9. IT in der Schule

    Die finnische Modellschule hat Tablets statt Schreibtische

  10. Joanna Rutkowska

    Qubes OS soll "einfach wie Ubuntu" werden



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Kilopower: Ein Kernreaktor für Raumsonden
Kilopower
Ein Kernreaktor für Raumsonden
  1. Raumfahrt Nasa zündet Voyager-Triebwerke nach 37 Jahren
  2. Bake in Space Bloß keine Krümel auf der ISS
  3. Raumfahrtpionier Der Mann, der lange vor SpaceX günstige Raketen entwickelte

Kingdom Come Deliverance angespielt: Und täglich grüßt das Mittelalter
Kingdom Come Deliverance angespielt
Und täglich grüßt das Mittelalter

E-Golf auf Tour: Reichweitenangst oder: Wie wir lernten, Lidl zu lieben
E-Golf auf Tour
Reichweitenangst oder: Wie wir lernten, Lidl zu lieben
  1. Sattelschlepper Thor ET-One soll Teslas Elektro-Lkw Konkurrenz machen
  2. Einkaufen und Laden Kostenlose Elektroauto-Ladesäulen mit 50 kW bei Kaufland
  3. Uniti One Schwedisches Unternehmen Uniti stellt erstes Elektroauto vor

  1. Re: Bei voller Leistung reicht das Netzteil nicht...

    mekkv2 | 13:16

  2. Re: Heuchler

    ORlo | 13:13

  3. Re: Dass man sich wirklich mal auf Google oder FB...

    ManuPhennic | 13:12

  4. Re: Irgendwie macht "konkurrierende Minecraft...

    s1ou | 13:10

  5. Re: Amazon Prime auf Chromecast

    sniner | 13:09


  1. 13:00

  2. 12:41

  3. 12:04

  4. 11:44

  5. 11:30

  6. 10:48

  7. 10:26

  8. 10:20


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel