Abo
  • Services:
Anzeige
Informationen über New Yorker Taxifahrer wurden durch einen Fehler öffentlich.
Informationen über New Yorker Taxifahrer wurden durch einen Fehler öffentlich. (Bild: Henning 48 / Wikimedia Commons, CC by-sa)

Hashfunktionen: Datenbank über New Yorker Taxis deanonymisiert

Behörden in New York haben auf Anfrage eine riesige Datenbank mit Informationen über Taxirouten veröffentlicht. Wegen eines Fehlers lassen sich die Nummernschilder und mit deren Hilfe auch die Namen der Taxifahrer herausfinden. Der Grund ist die fehlerhafte Verwendung einer Hashfunktion.

Anzeige

Eine Datenbank über die Routen von Taxis in New York wurde offenbar fehlerhaft anonymisiert. Mit einigen Tricks ist es gelungen, sämtliche Datensätze den entsprechenden Nummernschildern und Zulassungslizenzen der einzelnen Taxifahrer zuzuordnen. Denn die Behörden hatten eine Hashfunktion nicht korrekt angewendet.

Der Blogger Chris Whong wollte Daten über Taxifahrten in New York auswerten und hatte bei den zuständigen Behörden eine Anfrage nach dem Freedom of Information Act gestellt. Der Freedom of Information Act ist das US-amerikanische Informationsfreiheitsgesetz, das es Bürgern in vielen Fällen erlaubt, US-Behörden zur Herausgabe von Daten zu zwingen. Whong erhielt daraufhin eine 20 GByte große Datei im CSV-Format, die Details zu etwa 170 Millionen Taxifahrten beinhaltete.

Hashes aus MD5-Summen

Neben Datum, Uhrzeit und den GPS-Koordinaten von Start und Ziel einer Taxifahrt befanden sich in jedem Datensatz auch zwei offenbar anonymisierte Werte für das Nummernschild und die Lizenznummer. Dabei handelte es sich jeweils um eine 32-stellige Hexadezimalzahl. In einem Kommentar auf Reddit wies ein Nutzer darauf hin, dass offenbar ein bestimmter Taxifahrer auffällig viele Fahrten hinter sich hätte. Dem Programmierer Vijay Pandurangan fiel auf, dass es sich bei dem Wert "CFCD208495D565EF66E7DFF9F98764DA" allerdings lediglich um den MD5-Hash-Wert der Zahl 0 handelte. Damit war klar, dass offenbar MD5-Hashes zur Anonymisierung der Nummernschilder und Lizenznummern verwendet wurden.

Eine Hashfunktion wie MD5 weist jedem beliebigen Eingabewert einen festen Ausgabewert einer bestimmten Länge zu, bei MD5 sind dies 128 Bit. Eine wichtige Eigenschaft von Hashfunktionen ist, dass es sich um Einwegfunktionen handelt: Es soll mit realistischem Rechenaufwand unmöglich sein, aus einem Hashwert Rückschlüsse auf den Eingabewert zu ziehen. Dies gilt allerdings nur dann, wenn ein Angreifer keine Informationen über den Eingabewert hat.

Zurückrechnen möglich

Die Nummernschilder von New Yorker Taxis sind alle nach einem bestimmten Schema gestaltet, insgesamt gibt es lediglich zwei Millionen Varianten. Auf einem handelsüblichen Computer lassen sich diese Varianten innerhalb von Sekunden durchrechnen. Damit ist eine Deanonymisierung der Daten möglich. Ähnlich verhält es sich mit den Lizenznummern der Taxifahrer: Hier gibt es 22 Millionen verschiedene Varianten, auch die lassen sich innerhalb von Minuten alle berechnen. Die Zuordnung der Nummernschilder und Taxilizenznummern zu den Namen der einzelnen Taxifahrer ist mit Hilfe anderer Daten, die öffentlich im Internet verfügbar sind, ebenfalls möglich.

MD5 gilt aus heutiger Sicht als nicht mehr sicher. Allerdings sind die Schwächen von MD5 in diesem Fall nicht das Problem, sondern vielmehr, dass hier eine Hashfunktion völlig falsch verwendet wurde. Selbst eine sichere Hashfunktion wie SHA-2 hätte keine Abhilfe gebracht.

Besser immer mit Salz

Hätte man für die Datensätze einen Salt-Wert verwendet, wäre der Angriff zwar erschwert worden, aber immer noch möglich. Ein Salt-Wert ist ein Zufallswert, der im Hashwert abgespeichert wird. In dem Fall hätte man die Berechnungen für jeden Datensatz einzeln vornehmen müssen.

Eine sinnvolle Möglichkeit zur Anonymisierung der Daten wäre es gewesen, alle Datensätze mit einem geheimen Schlüssel und einem symmetrischen Verschlüsselungsalgorithmus wie AES zu verschlüsseln. Vijay Pandurangan weist in seinem Blogbeitrag allerdings darauf hin, dass selbst dann unter bestimmten Umständen eine Deanonymisierung möglich gewesen wäre.


eye home zur Startseite
JensTautenhahn 29. Jun 2014

Vergesst es. Die Informationen zur Lizenznummer in Wikipedia sind offensichtlich veraltet.

robinx999 27. Jun 2014

Im Prinzip im Text "Der Blogger Chris Whong wollte Daten über Taxifahrten in New York...

katzenpisse 26. Jun 2014

Oder er hat sich nicht lange genug Gedanken darüber gemacht. Auf den ersten Blick...



Anzeige

Stellenmarkt
  1. über TOPOS Personalberatung GmbH, Norddeutschland
  2. Endress+Hauser Conducta GmbH+Co. KG, Gerlingen
  3. Garz & Fricke GmbH, Hamburg
  4. Daimler AG, Stuttgart


Anzeige
Spiele-Angebote
  1. 15,99€
  2. 23,99€
  3. 6,49€

Folgen Sie uns
       

Anzeige
Whitepaper
  1. Globale SAP-Anwendungsunterstützung durch Outsourcing
  2. Praxiseinsatz, Nutzen und Grenzen von Hadoop und Data Lakes
  3. Sicherheitsrisiken bei der Dateifreigabe & -Synchronisation


  1. Raumfahrt

    Chang'e 5 fliegt zum Mond und wieder zurück

  2. Android 7.0

    Sony stoppt Nougat-Update für bestimmte Xperia-Geräte

  3. Dark Souls 3 The Ringed City

    Mit gigantischem Drachenschild ans Ende der Welt

  4. HTTPS

    Weiterhin rund 200.000 Systeme für Heartbleed anfällig

  5. Verkehrsexperten

    Smartphone-Nutzung am Steuer soll strenger geahndet werden

  6. Oracle

    Java entzieht MD5 und SHA-1 das Vertrauen

  7. Internetzensur

    China macht VPN genehmigungspflichtig

  8. Hawkeye

    ZTE will bei mediokrem Community-Smartphone nachbessern

  9. Valve

    Steam erhält Funktion, um Spiele zu verschieben

  10. Anet A6 im Test

    Wenn ein 3D-Drucker so viel wie seine Teile kostet



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Shield TV (2017) im Test: Nvidias sonderbare Neuauflage
Shield TV (2017) im Test
Nvidias sonderbare Neuauflage
  1. Wayland Google erstellt Gamepad-Support für Android in Chrome OS
  2. Android Nougat Nvidia bringt Experience Upgrade 5.0 für Shield TV
  3. Nvidia Das Shield TV wird kleiner und kommt mit mehr Zubehör

Nintendo Switch im Hands on: Die Rückkehr der Fuchtel-Ritter
Nintendo Switch im Hands on
Die Rückkehr der Fuchtel-Ritter
  1. Nintendo Vorerst keine Videostreaming-Apps auf Switch
  2. Arms angespielt Besser boxen ohne echte Arme
  3. Nintendo Switch Eltern bekommen totale Kontrolle per App

Autonomes Fahren: Laserscanner für den Massenmarkt kommen
Autonomes Fahren
Laserscanner für den Massenmarkt kommen
  1. BMW Autonome Autos sollen mehr miteinander quatschen
  2. Nissan Leaf Autonome Elektroautos rollen ab Februar auf Londons Straßen
  3. Autonomes Fahren Neodriven fährt autonom wie Geohot

  1. Re: Rollenspiele sind out

    mnementh | 21:57

  2. Re: wie schwer war das packet?

    Moe479 | 21:55

  3. Situationsbedingte Strafen statt generellem Verbot

    nycalx | 21:55

  4. Re: Selten so einen schlechten Artikel bei Golem...

    Haze95 | 21:46

  5. Re: Weitere Geräte als die bekannten ~80?!

    v2nc | 21:45


  1. 18:19

  2. 17:28

  3. 17:07

  4. 16:55

  5. 16:49

  6. 16:15

  7. 15:52

  8. 15:29


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel