Abo
  • Services:

Geoencoding hilft uns weiter

Dazu schreiben wir ein Python-Skript. Es ermittelt alle Datensätze in der Datenbank, in denen entweder eine Stadt oder eine Postleitzahl oder beides angegeben ist. Mit diesen Daten rufen wir das Python-Package geocoder auf. Es liefert uns die zugehörigen geografischen Angaben, zumindest meistens. Leider ist auch nicht jede Angabe eindeutig. Deshalb müssen wir zwangsläufig jeden Eintrag manuell gegenprüfen, wobei wir noch einige Zahlendreher und Vertipper in Postleitzahlen entdecken. Schließlich gelingt es uns. Alle Datensätze mit Ortsangaben haben nun auch eine Breiten- und Längengradangabe, insgesamt sind es 326 verschiedene Ortsangaben.

Eine große Überraschung

Stellenmarkt
  1. LEONI AG, Zürich (Schweiz)
  2. ADG Apotheken-Dienstleistungsgesellschaft mbH, Mannheim

Mit den so korrigierten Datensätzen erzeugen wir in QGIS erneut eine Übersichtskarte der Messstationen - und sind verblüfft: Das Verteilungsmuster kommt uns bekannt vor. Tatsächlich gleicht es der vom Institut für deutsche Wirtschaft herausgegebenen Karte der IT-Arbeitsplätze in Deutschland.

  • Mengenverteilung der eingesetzten Elektronikplattform (Bild: Alexander Merz/Golem.de)
  • Wo überall gemessen wurde in Deutschland, Österreich, Schweiz, Luxemburg und Italien (Bild: Alexander Merz/Golem.de)
  • Karte der IT-Arbeitsplätze in Deutschland (Bild: Institut für deutsche Wirtschaft)
  • Häufigkeitsverteilung der Messwerte (Bild: Alexander Merz/Golem.de)
  • Median und Durchschnitt der Temperaturwerte im Tagesverlauf (Bild: Alexander Merz/Golem.de)
  • Durchschnittstemperaturen im Ländervergleich (Bild: Alexander Merz/Golem.de)
  • Mediantemperaturen im Ländervergleich (Bild: Alexander Merz/Golem.de)
  • Durchschnittstemperaturen im Bundesländervergleich (Bild: Alexander Merz/Golem.de)
  • Mediantemperaturen im Bundesländer-Vergleich (Bild: Alexander Merz/Golem.de)
  • Durchschnittliche Temperarturentwicklung (Bild: Alexander Merz/Golem.de)
  • Temperarturentwicklung im Median (Bild: Alexander Merz/Golem.de)
  • Entwicklung der Lufttemperatur und der Bürotemperatur (Bild: Alexander Merz/Golem.de)
  • Verhältnis zwischen den Messwerten mit Token und ohne Token (Bild: Alexander Merz/Golem.de)
  • Geräte der Nicht-Token-Nutzer (Bild: Alexander Merz/Golem.de)
  • Geräte der Token-Nutzer (Bild: Alexander Merz/Golem.de)
  • Anzahl der neu genutzten Tokens pro Tag (Bild: Alexander Merz/Golem.de)
  • Messdauer von Tokennutzern (Bild: Alexander Merz/Golem.de)
  • Von R generierte Graphik der Nicht-Token-Nutzern, weitgehend im Roh-Zustand (Bild: Alexander Merz/Golem.de)
Wo überall gemessen wurde in Deutschland, Österreich, Schweiz, Luxemburg und Italien (Bild: Alexander Merz/Golem.de)

Zumindest für die IT-Büros scheint die Teilnehmerverteilung des Temperaturmessprojekts repräsentativ zu sein.

Wenn zu viel getestet wird

Bevor wir mit den Temperaturwerten beginnen, werfen wir einen Blick auf die Menge der Testwerte. Nutzer konnten ihren übermittelten Datensatz mit einem Debug-Flag versehen. Der Wert sollte dann nicht in die Auswertung eingehen. Doch unsere Datenbank liefert uns eine überraschende Aussage: Ein Viertel der Werte ist mit einem Debug-Flag versehen. Darunter befinden sich auch viele Datensätze von Token-Nutzern - deren übrige Angaben aber korrekt aussehen. Wir schauen uns deren Werte an, sie sehen trotz des Debug-Flags valide aus. Deshalb entscheiden wir uns, auch Datensätze mit dem Debug-Flag in die Auswertung mitaufzunehmen. Wir können schließlich auch bei den vermeintlich regulären Sendungen nicht von fehlerfreien Messungen ausgehen.

Hoffentlich valide Temperaturdaten

Eine Häufigkeitsanalyse liefert uns einen ersten Eindruck von den Temperaturwerten. Insgesamt gibt es 5.493 unterschiedliche Messwerte. Die Anzahl mag verblüffen, aber da wir keine konkrete Vorgabe zur Genauigkeit der übermittelten Werte gemacht haben, ist das erklärlich. Wir erzeugen eine Grafik mit den Häufigkeiten pro Wert. Dabei betrachten wir die Werte mit Debug-Flag und ohne getrennt. Im Graphen zeigt sich, dass sich die Verteilung ähnelt.

  • Mengenverteilung der eingesetzten Elektronikplattform (Bild: Alexander Merz/Golem.de)
  • Wo überall gemessen wurde in Deutschland, Österreich, Schweiz, Luxemburg und Italien (Bild: Alexander Merz/Golem.de)
  • Karte der IT-Arbeitsplätze in Deutschland (Bild: Institut für deutsche Wirtschaft)
  • Häufigkeitsverteilung der Messwerte (Bild: Alexander Merz/Golem.de)
  • Median und Durchschnitt der Temperaturwerte im Tagesverlauf (Bild: Alexander Merz/Golem.de)
  • Durchschnittstemperaturen im Ländervergleich (Bild: Alexander Merz/Golem.de)
  • Mediantemperaturen im Ländervergleich (Bild: Alexander Merz/Golem.de)
  • Durchschnittstemperaturen im Bundesländervergleich (Bild: Alexander Merz/Golem.de)
  • Mediantemperaturen im Bundesländer-Vergleich (Bild: Alexander Merz/Golem.de)
  • Durchschnittliche Temperarturentwicklung (Bild: Alexander Merz/Golem.de)
  • Temperarturentwicklung im Median (Bild: Alexander Merz/Golem.de)
  • Entwicklung der Lufttemperatur und der Bürotemperatur (Bild: Alexander Merz/Golem.de)
  • Verhältnis zwischen den Messwerten mit Token und ohne Token (Bild: Alexander Merz/Golem.de)
  • Geräte der Nicht-Token-Nutzer (Bild: Alexander Merz/Golem.de)
  • Geräte der Token-Nutzer (Bild: Alexander Merz/Golem.de)
  • Anzahl der neu genutzten Tokens pro Tag (Bild: Alexander Merz/Golem.de)
  • Messdauer von Tokennutzern (Bild: Alexander Merz/Golem.de)
  • Von R generierte Graphik der Nicht-Token-Nutzern, weitgehend im Roh-Zustand (Bild: Alexander Merz/Golem.de)
Häufigkeitsverteilung der Messwerte (Bild: Alexander Merz/Golem.de)

Die Werte 0 und 99 treten vergleichsweise häufig auf. Auch wir hatten zu Beginn unseres Projekts häufig solche Werte, während wir mit den verschiedenen Elektronikplattformen experimentierten. Sie entstanden durch fehlerhaft ausgelesene Sensoren oder Fehler bei der Aufbereitung der Daten für die Übermittlung per URL.

Auffällig ist auch die Häufung im Bereich um die 40 °C. Ein Blick in die Datenbank zeigt, dass es sich anscheinend tatsächlich um die korrekten Werte eines einzelnen Teilnehmers handelt, auch wenn sie als Debug-Werte gekennzeichnet sind.

Aufgrund der Häufigkeitsverteilung wird deutlich, dass wir uns für eine sinnvolle Betrachtung auf einen Wertebereich von 10 bis 45 °C Grad beschränken können. Das sind immer noch gut 4,1 Millionen Messwerte.

Am wärmsten ist es nicht mittags

Aus dieser Menge errechnen wir einen Mittelwert über den ganzen Tag von 24,8 °C. Unterscheiden wir nach der Tageszeit: Tagsüber, von 7 bis 19 Uhr, beträgt der Median 24,9 °C, der Durchschnitt 25 °C. Nachts liegt der Temperatur-Mittelwert bei 24,7 °C. Gliedern wir die Werte nach den Stunden des Tages auf, ist das Minimum gegen 7 und 8 Uhr früh erkennbar. Das Maximum wird gegen 17 Uhr erreicht. Dabei beträgt allerdings die Differenz zwischen Minimum- und Maximum-Temperatur gerade einmal rund 1,4 °C.

Interessant wird es im Ländervergleich.

 Die Programmiersprache für StatistikfansDer European Office Contest 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7. 6
  8. 7
  9.  


Anzeige
Hardware-Angebote
  1. 116,75€ + Versand
  2. und 50€-Steam-Guthaben erhalten
  3. bei dell.com

H4ndy 15. Mär 2017

Seit Golem.de nur noch über SSL läuft, funktioniert mein kleiner ESP leider nicht mehr...

Eheran 09. Mär 2017

Weil das Luftfeuchte, also verdampftes Wasser, ist. So wie man bei kochendem Wasser...

am (golem.de) 09. Mär 2017

Da danken wir doch ganz besonders!

am (golem.de) 09. Mär 2017

Vielen Dank und der Fehelr ist gefixt!

am (golem.de) 09. Mär 2017

Vielen Dank für das Lob! Wegen Skript siehe hier: https://forum.golem.de/kommentare...


Folgen Sie uns
       


Golem.de ist Kratos - God of War (Live, keine Spoiler)

Die Handlung verraten wir nicht, trotzdem wollen wir das andersartige neue God of War besprechen. Zu diesem Zweck haben wir eine stellvertretende Mission herausgesucht, in der es nicht um die primäre Handlung geht. Ziel ist es, den Open-World-Ansatz zu zeigen, das Kampfsystem zu erklären und die Spielmechaniken zu verdeutlichen.

Golem.de ist Kratos - God of War (Live, keine Spoiler) Video aufrufen
EU-Urheberrechtsreform: Wie die Affen auf der Schreibmaschine
EU-Urheberrechtsreform
Wie die Affen auf der Schreibmaschine

Nahezu wöchentlich liegen inzwischen neue Vorschläge zum europäischen Leistungsschutzrecht und zu Uploadfiltern auf dem Tisch. Sie sind dilettantische Versuche, schlechte Konzepte irgendwie in Gesetzesform zu gießen.
Ein IMHO von Friedhelm Greis

  1. Leistungsschutzrecht VG Media darf Google weiterhin bevorzugen
  2. EU-Verhandlungen Regierung fordert deutsche Version des Leistungsschutzrechts
  3. Fake News EU-Kommission fordert Verhaltenskodex für Online-Plattformen

Steam Link App ausprobiert: Games in 4K auf das Smartphone streamen
Steam Link App ausprobiert
Games in 4K auf das Smartphone streamen

Mit der Steam Link App lassen sich der Desktop und Spiele vom Computer auf Smartphones übertragen. Im Kurztest mit einem Windows-Desktop und einem Google Pixel 2 klappte das einwandfrei - sogar in 4K.
Ein Bericht von Marc Sauter

  1. Valve Steam Spy steht nach Datenschutzänderungen vor dem Aus
  2. Insel Games Spielehersteller wegen Fake-Reviews von Steam ausgeschlossen
  3. Spieleportal Bitcoin ist Steam zu unbeständig und zu teuer

Black-Hoodie-Training: Einmal nicht Alien sein, das ist toll!
Black-Hoodie-Training
"Einmal nicht Alien sein, das ist toll!"

Um mehr Kolleginnen im IT-Security-Umfeld zu bekommen, hat die Hackerin Marion Marschalek ein Reverse-Engineering-Training nur für Frauen konzipiert. Die Veranstaltung platzt inzwischen aus allen Nähten.
Von Hauke Gierow

  1. Ryzenfall CTS Labs rechtfertigt sich für seine Disclosure-Strategie
  2. Starcraft Remastered Warum Blizzard einen Buffer Overflow emuliert

    •  /