Differential Privacy: Google legt datenschutzfreundliche Analysebibliothek offen

Google hat eine C++-Bibliothek als Open Source veröffentlicht, mit der sich Datenanalysen nach dem Prinzip der Differential Privacy umsetzen lassen, wie das Unternehmen in seinem Entwicklerblog(öffnet im neuen Fenster) mitteilt. Ziel dieses Prinzip ist es, Analysen auch auf sehr sensiblen Daten durchzuführen, ohne dabei die Privatsphäre oder den Datenschutz zu unterlaufen. Vor allem sollen Ergebnisse nicht dazu genutzt werden können, einzelne Datensätze etwa mit spezifischen Eigenschaften einer einzelnen Person zu identifizieren.
In der Ankündigung verweist Google als Anwendungszweck dieses Prinzips etwa auf die Analysen von Patientendaten in Krankenhäusern. Sinnvoll sei der Einsatz darüber hinaus natürlich auch in einer Vielzahl weiterer Fälle, mit denen Software-Entwickler konfrontiert sein könnten. Der Grundsatz der Differential Privacy soll mit dem damit verbundenen Schutz der Privatsphäre vor allem dafür sorgen, dass Kunden, Nutzer oder auch Bürger nicht das Vertrauen in die Dienste verlieren.
Eine Version der nun von Google bereitgestellten Bibliothek nutzt das Unternehmen intern selbst. Um die Verwendung für viele Entwickler zu vereinfachen, habe sich Google für die nun erfolgte Offenlegung zunächst auf einige wichtige Funktionen fokussiert, die besonders schwer selbst auszuführen seien, wie es in der Ankündigung heißt.
Zu den Kernfunktionen der Bibliothek gehören typische statistische Methoden wie etwa das Ermitteln von Durchschnitt, Median oder auch Perzentilen und weiteren. Hinzu kommt eine ausgiebige Test-Suite, die helfen soll, Fehler bei der Verwendung der Bibliothek zu vermeiden. Zusätzlich stellt Google ein Beispiel zur Verwendung der Bibliothek(öffnet im neuen Fenster) bereit sowie eine PostgreSQL-Erweiterung(öffnet im neuen Fenster) , um Differential-Privacy-Funktionen zu nutzen. Der Code steht auf Github(öffnet im neuen Fenster) unter der Apache-Lizenz bereit.



