Datensicherheit: Geschlecht und Alter sind leicht zu hacken

Aus Daten, die illegal über öffentliche Wi-Fi-Hotspots erfasst oder durch Angriffe auf die Computerinfrastruktur von Dienstanbietern erbeutet werden, können Kriminelle wichtige persönliche Daten extrahieren. Das hat ein Forscherteam am Illinois Institute of Technology(öffnet im neuen Fenster) jetzt gezeigt, um Schwächen der Datensicherheit zu brandmarken. Das Team hat ein neuronales Netzwerkmodell entwickelt, um die Geschlechtszugehörigkeit mit einer Genauigkeit abzuschätzen, die andere Verfahren wie Entscheidungsbaum-, Random-Forest- und Gradent-Boosting-Modelle deutlich übertrifft. Sie kamen auf 67 Prozent. Mit ihrem Verfahren konnten sie zudem das Alter einzelner Benutzer mit einer Genauigkeitsrate von 78 Prozent bestimmen. Die Forscher nutzten Daten eines lateinamerikanischen Mobilfunkunternehmens, um das Geschlecht und Alter einzelner Nutzer durch ihre private Kommunikation relativ einfach abzuschätzen.
Informationen sind vermeintlich harmlos
" Alters- und Geschlechtsinformationen scheinen harmlos zu sein, doch sie können von Fremden auf schändliche Weise verwendet werden ", sagt Matthew Shapiro, Professor für Politikwissenschaften. Das habe oft verheerende Folgen. Die Informationen könnten von Pädophilen genutzt werden, um gezielt Kinder zu identifizieren mit dem Ziel, sie auf irgendeine Art zu missbrauchen. Am anderen Ende des Altersspektrums sind Senioren gefährdet. Sie könnten gezielt mit ausgeklügelten Spam- und Phishing-Aktionen um ihr Erspartes gebracht werden.
Es klappt mit ganz normalen Laptops
Was die Forscher natürlich ohne böse Absicht gemacht haben, ist auch für gewiefte Kriminelle möglich. " Der Laptop, den wir für diese Arbeit verwendet haben, ist überhaupt nicht exklusiv ", sagt Vijay K. Gurbani, Assistenzprofessor für Informatik. „Solche Angriffe sind leider nicht selten" , so der Informatiker. " Derartige Daten zu sammeln ist zwar nicht einfach, doch auch nicht unmöglich. "
Maschinelles Lernen hebelt Datenschutz aus
Ziel der Arbeit war es, einen Dialog zu beginnen, der die Auswirkungen des aufkommenden maschinellen Lernens und der KI-Techniken auf die Datenschutzbestimmungen kritisch untersucht, und wie die Verbraucher vor der unmittelbaren Bedrohung durch Datenschutzverletzungen geschützt werden können. " Maschinelles Lernen und automatisierte Entscheidungsfindung werden ein Mainstream von Geschäftsprozessen sein, und es gibt kein Entkommen ", sagt Gurbani. " Es geht darum, wie die Privatsphäre des Einzelnen sowie gesellschaftliche und wirtschaftliche Interessen mit dem entsprechenden Rechtsrahmen vor Betrug geschützt werden können. "
Zahlreiche Empfehlungen
Eine Möglichkeit bestehe darin, den Verbrauchern die "Opt-out-Option" zur Verfügung zu stellen, um ihre persönlichen Daten bei der Installation einer App verborgen zu halten, sagt Yuri Mansury, außerordentlicher Professor für Sozialwissenschaften. Zu den weiteren Empfehlungen gehören die Verwendung synthetischer Daten anstelle von Benutzerbeobachtungen für Modelle des maschinellen Lernens, die Zusammenarbeit von Dateninhabern mit Spezialisten für maschinelles Lernen, um Best Practices zu entwickeln, der Aufbau eines regulatorischen Rahmens, der es Benutzern ermöglicht, die gemeinsame Nutzung von Daten abzulehnen, um personenbezogene Daten privat zu halten, sowie die Aktualisierung bestehender Nichtkonformitätsprotokolle.



