Abo
  • Services:
Anzeige
Nur durch konsequente Anonymisierung von Big Data ist auch Datenschutz gewährleistet.
Nur durch konsequente Anonymisierung von Big Data ist auch Datenschutz gewährleistet. (Bild: The Opte Project/CC-BY 2.5)

Anonymisierung Big Data mit dem Datenschutz versöhnen

Mit Big Data lassen sich große Datenmengen sammeln und schnell analysieren - der Datenschutz gerät dabei leicht in Gefahr. Wann ist Big Data legal?

Anzeige

"Big Data - machen Sie mehr aus Ihren Daten!" - so wird für die große Datenauswertung geworben. Doch viele Daten, die benutzt werden, um statistische Trends zu erkennen, sind personenbezogen. Wenn sie nicht ausreichend anonymisiert sind, ist die Auswertung aus Sicht des Datenschutzes illegal. Big Data mit Datenschutz zu versöhnen und Daten damit legal zu analysieren, ist nur mit einer Anonymisierung möglich, die möglicherweise mit Informationsverlusten verbunden ist.

Big-Data-Forscher Günter Karjoth von den Züricher IBM Research Labs kennt mehrere Methoden, Daten über Generalisierungen zu anonymisieren, ohne dass sie später Personen zugeordnet werden können: So können etwa Geburtstage aus mehreren Jahren zusammengefasst werden, der Ehestand (verheiratet, geschieden, Witwe) kann mit dem Begriff "nicht-ledig" umschrieben werden.

Dass es nicht damit getan ist, einen Namen durch einen Code zu ersetzen, zeigt folgender Vergleich: Mit Angaben des Geburtsdatums, des Geschlechts und einer fünfstelligen Postleitzahl können bis zu 87 Prozent der US-amerikanischen Bevölkerung reidentifiziert werden. Bei Angabe des Geburtsjahrs, des Geschlechts und einer dreistelligen Postleitzahl hingegen sind es nur noch 0,04 Prozent. Für die Aufdeckung ist entscheidend, wie charakteristisch die Daten insgesamt sind.

Die Leitlinien für das richtige Vorgehen hat das Bundesverfassungsgericht in vielen Entscheidungen gesetzt. Dabei müsse ein Schutz der Grundrechte "durch Verfahren, Pseudonymisierung und Anonymisierung, Protokollierung und Dokumentation, Sicherung der Verantwortlichkeit, Transparenz und unabhängige sowie demokratische Kontrolle" erfolgen, zählt der schleswig-holsteinische Landesdatenschützer Thilo Weichert auf.

Legale Betrugsbekämpfung bei Lidl

Als gelungenes Beispiel für eine Big-Data-Anwendung gilt das Kassensystem des Discounters Lidl, das ein Datenschutz-Gütesiegel erhalten hat. Hier werden sämtliche Kassendaten analysiert, um Manipulationen im Kassierprozess aufzudecken. Dabei werden die Daten mit vermuteten Vorgehensweisen bei Manipulationen abgeglichen. Werden bestimmte festgelegte Grenzwerte überschritten wie etwa bei Fehlbuchungen oder Stornos, werden nur diese Ausreißer überprüft. Nach einer kurzen Frist werden die Daten gelöscht, wenn sich keine Auffälligkeiten zeigen.

Die Kassendaten werden in pseudonymisierter Form gespeichert. Nur wenn die Auffälligkeiten zu einem konkreten Verdacht führen, dürfen die Pseudonyme nach einem festgelegten Verfahren gelüftet werden. Die Daten können zunächst auf Gruppen hin ausgewertet werden. Erst bei nachhaltigen Auffälligkeiten wird eine Einzelauswertung vorgenommen. Ein neutraler Dienstleister verarbeitet dabei die Daten, der Betriebsrat ist eingebunden.

Datenschutzkonforme gezielte Werbung

Das Unabhängige Landeszentrum für Datenschutz in Schleswig-Holstein hat neben dem Kassensystem von Lidl auch einige Anwendungen von europäischen Internetwerbeanbietern als datenschutzkonform zertifiziert. Die Werbeanbieter aggregieren ihre Auswertungen von digitalen Nutzungsspuren so, dass gezielte Werbung geschaltet und verkauft werden kann. Dabei werden Merkmale und Datensätze zusammengeführt, so dass anonymisierte Datensätze entstehen und keine einzelnen Nutzer mehr identifiziert werden können. Zudem werden die Aufbewahrungszeiten begrenzt und die Anonymisierungsdienstleistungen werden auf voneinander getrennte Stellen verteilt. So wird das Risiko vermindert, dass Daten doch wieder einzelnen Personen zugeschrieben werden können.

Unzureichende Anonymisierung ist illegal

Unzureichend anonymisiert waren zum Beispiel die Rezeptdaten, die von Apothekenrechenzentren weitergegeben wurden. So verkaufte das süddeutsche Apothekenrechenzentrum VSA Patientendaten an Marktforschungsunternehmen, unter anderem an IMS Health. Betroffen waren 42 Millionen Patienten in Deutschland.

Der Name der Patienten war nur durch einen 64-stelligen Code verschleiert, der sich einem Bericht des Spiegels zufolge allerdings auf die Versichertennummer zurückrechnen ließ. Alter und Geschlecht wurden an die Marktforscher weitergegeben. Dank der Daten ließ sich nachvollziehen, welche Arztpraxen welche Medikamente verschrieben hatten. IMS Health wehrte sich allerdings gegen den Vorwurf, die anonymisierten Daten könnten Ärzten, Apotheken oder Patienten zugeordnet werden.

Mit Blick auf diesen Fall moniert der schleswig-holsteinische Landesdatenschützer Thilo Weichert, dass hier Pseudonyme, die dem Patienten zugeordnet werden können, einfach als "anonym" bezeichnet wurden. Weichert sagt: "Da die Identifizierbarkeit von Daten technisch voraussetzungsvoll ist, wird Anonymität oft unhinterfragt behauptet, wo keine Anonymität besteht." Die Big-Data-Praktiken von heute neigten fast durchgängig dazu, illegal zu sein, weil keine hinreichende Anonymisierung durchgeführt werde.

Datenschutzkonform kann mit Big Data also ausgewertet werden, wenn technische und prozedurale Sicherungen eingeführt werden. Das Missbrauchsrisiko wird durch definierte Rollen und Zugriffskonzepte minimiert. Außerdem wird das Verfahren so transparent gestaltet, dass sich die Auswertungsergebnisse nachvollziehen und überprüfen lassen. Neben einer internen Datenschutzkontrolle kann zudem eine Personalvertretung beteiligt werden, womit auch eine demokratische Legitimation gegeben ist.


eye home zur Startseite
matok 12. Sep 2013

Wenn das für dich BigData ist, ok.

Dicker Bub 12. Sep 2013

Öh, das hier ist der Bericht zur Sommerakademie 2013 des ULD, oder?



Anzeige

Stellenmarkt
  1. T-Systems International GmbH, Mülheim an der Ruhr, Berlin, Darmstadt, München, Saarbrücken
  2. Bilfinger GreyLogix GmbH, Flensburg
  3. Deutsche Post DHL Group, Bonn
  4. GIGATRONIK München GmbH, München


Anzeige
Hardware-Angebote
  1. (reduzierte Überstände, Restposten & Co.)
  2. 349.99$/316,98€

Folgen Sie uns
       

Anzeige
Whitepaper
  1. Leitfaden für den gezielten Einsatz von SAP HANA
  2. Wettbewerbsfaktor Analytics im Internet der Dinge.
  3. Unternehmensweites Dokumenten- und Wissensmanagement

  1. 5G

    Verizon soll versuchen, Comcast oder Charter zu kaufen

  2. DRAM und Flash

    Toshiba könnte sein Speichergeschäft an WD verkaufen

  3. Satellitennavigation

    Galileo gehen die Uhren aus

  4. Shield TV (2017) im Test

    Nvidias sonderbare Neuauflage

  5. Zenimax

    Mark Zuckerberg verteidigt Macher von VR-Brille bei Gericht

  6. Statt Begnadigung

    Snowdens Aufenthalt in Russland verlängert

  7. FAA

    Drohnenbetreiber muss 200.000 US-Dollar Geldstrafe zahlen

  8. Breath of the Wild

    Zelda bietet auf Switch bessere Auflösung und Sounds

  9. Android Wear 2.0

    Neue Tag-Heuer-Smartwatch soll im Mai 2017 erscheinen

  10. FTC

    Qualcomm soll Apple zu Exklusivvertrag gezwungen haben



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Glasfaser: Nun hängt die Kabel doch endlich auf!
Glasfaser
Nun hängt die Kabel doch endlich auf!
  1. Fake News Für Facebook wird es hässlich
  2. Nach Angriff auf Telekom Mit dem Strafrecht Router ins Terrorcamp schicken oder so
  3. Soziales Netzwerk Facebook wird auch Instagram kaputt machen

Western Digital Pidrive im Test: Festplatte am Raspberry Pi leicht gemacht
Western Digital Pidrive im Test
Festplatte am Raspberry Pi leicht gemacht
  1. Sopine A64 Weiterer Bastelrechner im Speicherriegel-Format erscheint
  2. Bootcode Freie Firmware für Raspberry Pi startet Linux-Kernel
  3. Raspberry Pi Compute Module 3 ist verfügbar

Autonomes Fahren: Wenn die Strecke dem Zug ein Telegramm schickt
Autonomes Fahren
Wenn die Strecke dem Zug ein Telegramm schickt
  1. Fahrgastverband "WLAN im Zug funktioniert ordentlich"
  2. Deutsche Bahn WLAN im ICE wird kostenlos
  3. Mobilfunk Telekom baut LTE an Regionalbahnstrecken aus

  1. Re: Mmmmh, 30 FPS

    surpriseurdead | 13:10

  2. Aber das geht doch gar nicht

    quineloe | 13:10

  3. Re: Wieso?

    Trollversteher | 13:09

  4. Re: Die Obama-Enttäuschung

    AllDayPiano | 13:08

  5. Re: nur 8GB speicher nicht direkt erweiterbar bei...

    My1 | 13:07


  1. 13:01

  2. 12:46

  3. 12:31

  4. 12:10

  5. 11:54

  6. 11:36

  7. 11:26

  8. 11:11


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel