• IT-Karriere:
  • Services:

Differential Privacy: Es bleibt undurchsichtig

Mit Differential Privacy soll die Privatsphäre von Menschen geschützt werden, obwohl jede Menge persönlicher Daten verarbeitet werden. Häufig sagen Unternehmen aber nicht, wie genau sie das machen.

Artikel von Anna Biselli veröffentlicht am
Mit verrauschten Daten die Privatsphäre schützen (Symbolbild)
Mit verrauschten Daten die Privatsphäre schützen (Symbolbild) (Bild: Andrea Piacquadio/pexels.com)

Was haben der US-Zensus, Googles Mobilitätsstatistiken während der Covid-19-Pandemie und Apples Emoji-Vorschläge gemeinsam? Für alle drei Anwendungen werden eine beträchtliche Menge personenbezogener Daten erhoben - von Informationen über Alter, Wohnsituation und Bewegungsdaten bis hin zu Kommunikationsvorlieben. All diese Daten müssen geschützt werden und dafür nutzen die dahinterstehenden Organisationen und Unternehmen Verfahren, die auf Differential Privacy basieren.

Inhalt:
  1. Differential Privacy: Es bleibt undurchsichtig
  2. Kontrolliertes Grundrauschen
  3. Emojis und Eingabevorschläge

Die Grundlagen von Differential Privacy definierten Cynthia Dwork, Frank McSherry, Kobbi Nissim und Adam Smith bereits vor 14 Jahren in ihrem Paper Calibrating Noise to Sensitivity in Private Data Analysis. Die Gruppe schlug erste Verfahren vor, um auf Basis großer Mengen persönlicher Daten möglichst genaue statistische Berechnungen durchzuführen, ohne dass dadurch Erkenntnisse über Einzelpersonen möglich sind.

Mehr als zehn Jahre später erhielt das Team für seine Arbeit den renommierten Gödel-Preis für Veröffentlichungen in der theoretischen Informatik, die Arbeit wurde Tausende Male zitiert. 2006 steckten große Datenkonzerne noch in den Anfängen, Google hatte gerade Youtube übernommen, Facebook öffnete seine Plattform für alle.

Seitdem wächst mit den verfügbaren Datenmengen die Notwendigkeit, sie bei der Verarbeitung zu schützen, und der Wunsch, dennoch so viele Erkenntnisse wie möglich daraus zu ziehen - sei es aus kommerziellem Interesse, um Geschäftsprozesse und Werbung zu optimieren, oder um medizinische Forschung voranzutreiben, die sich auf eine große Zahl persönlicher und besonders geschützter Gesundheitsdaten verlässt.

Anonymisierung ist häufig keine

Stellenmarkt
  1. Bundesnachrichtendienst, Berlin
  2. Landratsamt Göppingen, Göppingen

Daten vermeintlich zu anonymisieren, indem etwa der genaue Wohnort auf die Postleitzahl reduziert und Nutzernamen durch zufällige Pseudonyme ersetzt werden, reicht in den wenigsten Fällen aus. Häufig sind Rückschlüsse auf Einzelpersonen möglich, gerade wenn Daten aus verschiedenen Quellen zusammenkommen.

Dann ist es plötzlich unerheblich, dass in einer medizinischen Datenbank der Wohnort von Alice nur bis auf die Postleitzahl genau angegeben wird, wenn aus einem Zeitungsarchiv ersichtlich wird, dass es eine Unterstützungskampagne für eine Frau mit einer seltenen Krankheit in Bad Fallingbostel gab.

Bei einer Untersuchung mit Daten aus Washington konnten Patienten aus fast der Hälfte von 81 vermeintlich anonymisierten Krankenhausberichten identifiziert werden, indem die Berichte mit Nachrichtenartikeln über Unfälle abgeglichen wurden.

Hacking & Security: Das umfassende Handbuch. 2. aktualisierte Auflage des IT-Standardwerks (Deutsch) Gebundene Ausgabe

Bei Differential Privacy sind die Privatsphäre-Garantien anders: Das Versprechen ist erfüllt, wenn eine Anfrage an einen Datensatz nicht offenbart, ob eine bestimmte Person zu einem Datensatz beigetragen hat. Es geht um den scheinbaren Widerspruch, aus großen Datenmengen nützliche Informationen über die Gesamtheit zu bekommen, ohne brauchbare und demnach auch missbrauchbare Informationen über Einzelpersonen zu erlangen.

Dwork und ihre Kollegen nahmen in ihrer frühen Arbeit zwei Datenbanken als Beispiel: Die zweite unterscheidet sich von der ersten nur dadurch, dass die zusätzliche Person Alice enthalten ist. Angreifer wüssten vorher, dass Alice Raucherin ist, aber nicht, ob Alice eine Lungenkrankheit hat. Sie könnten zwar aus beiden Datenbanken gleichermaßen lernen, dass Rauchen die Wahrscheinlichkeit für eine Lungenkrankheit erhöht, aber nicht, ob konkret Alice (oder eine beliebige andere Person) davon betroffen und in dieser Statistik enthalten ist.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
Kontrolliertes Grundrauschen 
  1. 1
  2. 2
  3. 3
  4.  


Anzeige
Top-Angebote
  1. (u. a. Gaming-Monitore, LG- & Sony-TVs, Xiaomi-Smartphones, Bosch Professional uvm. zu Bestpreisen)
  2. (u. a. PS4 Pro 1TB für 329,52€, Sandisk Extreme Pro micro-SDXC 128GB für 16,57€, Crucial...
  3. (u. a. Find X2 Neo 256GB 6,5 Zoll für 439,99€, Watch 41 mm Smartwatch für 179,99€)

sevenacids 16. Okt 2020 / Themenstart

Und das ist, nach meiner Ansicht, dass in vielen Fällen einfach mehr personenbezogene...

Kommentieren


Folgen Sie uns
       


Watch Dogs Legion - Fazit

Mit Legion liefert Ubisoft das bisher mit Abstand beste Watch Dogs ab.

Watch Dogs Legion - Fazit Video aufrufen
    •  /