Zum Hauptinhalt Zur Navigation Zur Suche

Differential Privacy: Apples Datenschutz-Hack für bessere Emojis

Apple will mit den Assistenzdiensten von Google und Microsoft mithalten – dazu bedarf es aber Informationen und künstlicher Intelligenz. Trotzdem soll die Privatsphäre der Nutzer geschützt bleiben – Differential Privacy soll helfen.
/ Hauke Gierow
11 Kommentare Auf Google folgen (öffnet im neuen Fenster)
Apple betreib viel Aufwand, um Nutzern datenschutzgerecht Emjois vorzuschlagen. (Bild: Miguel Medina/Getty Images)
Apple betreib viel Aufwand, um Nutzern datenschutzgerecht Emjois vorzuschlagen. Bild: Miguel Medina/Getty Images

Neben den Neuerungen an den Plattformen des Unternehmens hat Apple gestern auf der Entwicklerkonferenz WWDC ein neues Feature vorgestellt, das die Privatsphäre der Nutzer schützen und es Apple gleichzeitig ermöglichen soll, mehr über seine Nutzer zu erfahren.

Nicht erst seit dem öffentlichen Streit mit dem FBI wirbt Apple damit, seine Umsätze im Wesentlichen mit Hardware zu machen und daher keine invasiven Datensammlungen über die Nutzer anstellen zu müssen, um Profite zu generieren. Doch im derzeitigen Wettbewerb um die besten digitalen Assistenten, die auf Basis von Nutzerdaten und mit Hilfe künstlicher Intelligenz den Alltag der Nutzer vereinfachen sollen, kommt Apple nicht umhin, mehr zu erfahren. Siri, einst das innovativste Produkt am Markt, hinkt Diensten wie Cortana und Google Now mittlerweile hinterher.

Apples Antwort auf dieses Problem heißt jetzt "Differential Privacy", also ungefähr "unterschiedliche Privatheit". Mit diesem von Apple zu Marketingzwecken übernommenen Begriff wird eine Forschungsrichtung in der Statistik beschrieben. Letztlich geht es darum, mathematisch zu beweisen, dass Informationen aus einer Datenbank nicht einer individuellen Person zugeordnet werden können.

Differential Privacy soll es Angreifern unmöglich machen, Informationen über Individuen auszulesen, weil den besonders schützenswerten Daten Zufallswerte hinzugefügt werden. Dies geschehe mit einer Mischung aus Hashing, der Analyse nur kleiner Teile der Datenbank (Subsampling) und mathematischen Störgeräuschen.

Haben Sie schon mal das Gesetz gebrochen?

Ein Beispiel dafür: Bei einer Umfrage sollen Menschen angeben, ob sie das Gesetz gebrochen haben oder nicht. Um sich nicht selbst zu belasten, wird vorher ein Zufallsmoment eingeführt. Basierend auf einem Würfelwurf oder einem Münzwurf beantwortet der Teilnehmer die Frage deterministisch ehrlich oder unehrlich – später lässt sich dann trotzdem herausrechnen, wie das korrekte Ergebnis der Umfrage lautet(öffnet im neuen Fenster), ohne die Individuen belasten zu können.

Damit soll Apple in der Lage sein, wie Wired schreibt(öffnet im neuen Fenster), "so viel wie möglich über eine Gruppe zu lernen und dabei gleichzeitig so wenig wie möglich über eine einzelne Person darin". So könnte Apple erfahren, worüber Menschen sprechen, was sie tun und was sie wollen, ohne diese Informationen einem Individuum zuordnen zu können.

Spotlight-Suche, Quicktype und schöne Emojis dank KI

"Mit einer großen Datenbank, die die Daten vieler Individuen enthält, sind sie in der Lage, einen lernenden Algorithmus anzuwenden, der dann statistisch relevante Informationen über die Datenbank als Ganzes gewinnt", sagte der Wissenschaftler Aaron Roth zu Wired. Roth wurde von Apples Softwarechef Craig Federigi explizit erwähnt und soll Apple bei der Entwicklung der Technologie beraten haben.

Differential Privacy soll in iOS10 eingesetzt werden, um die Empfehlungen der Quicktype-Tastatur zu verbessern, außerdem sollen passenden Emojis vorgeschlagen werden, Empfehlungen für die Spotlight-Suche gegeben und passende Notizen vorgeschlagen werden.

Differential Privacy ist nicht der erste Versuch

Schon seit vielen Jahren wird in der Statistik versucht, Informationen in Datenbanken zu anonymisieren, um sie zum Beispiel für Forschungszwecke nutzbar zu machen, ohne die Privatsphäre der in der Datenbank erfassten Personen zu beeinträchtigen. Das funktioniert sehr häufig nicht. Forschern gelang es zum Beispiel, anonymisierte Gesundheitsdaten aus den USA zu analysieren und dabei Rückschlüsse auf einzelne Operationen in bestimmten Krankenhäusern zu ziehen.

Meist werden bei diesen Versuchen der Anonymisierung nur einzelne Merkmale in den Daten, wie zum Beispiel der Name, entfernt. Komplexe Abfragen lassen aber häufig trotzdem Rückschlüsse auf einzelne Personen zu.

Ein anderer Versuch, Informationen zu nutzen und gleichzeitig zu schützen ist es, sie in einer gehashten Datenbank abzulegen. Ein solches Konzept existiert etwa mit CryptDB. Der Suchbegriff wird mit dem gleichen Algorithmus verschlüsselt wie die Daten, so dass auf Basis des Cyphertextes Übereinstimmungen gefunden werden können. Auch hier gibt es aber bekannte Angriffe, die Technik ermöglicht vor allem bei wenig zufälligen Daten die Identifikation einzelner Datensubjekte.

Es bleibt also abzuwarten, ob Apple halten kann, was es verspricht.


Relevante Themen