Abo
  • Services:
Anzeige

Facebook-Crawler

Datensammeln leichtgemacht

Bots werden es künftig leichter haben, Facebook-Nutzer mit Spam und Phishing-Einladungen zu überhäufen. Grund ist ein neuer Crawler, mit dem sich die Namen und Links zu Facebook-Konten auslesen lassen. Ein 10-GByte-Datensatz mit 170 Millionen Links liegt Golem.de vor.

Das in Ruby geschriebene Script von Ron Bowes ist recht einfach. Aus dem offiziellen Facebook-Verzeichnis liest er die Namen und zugehörigen Links von Nutzerkonten aus. Davon gibt es mittlerweile weltweit rund 500 Millionen. Mit dem Crawler wurden von seinem Entwickler offenbar testweise US-Konten gesammelt - Ron Bowes ist laut seinem Blog Skullsecurity.org Nordamerikaner.

Anzeige

Die als Torrent-Datei zum Download angebotene Datei bringt es als um Dubletten bereinigter Datensatz mit 170 Millionen Account-Links auf 10 GByte. Es gibt weitere Dateien, in denen die Vor- und Nachnamen nach Häufigkeit sortiert sind und in denen einmalige Namen aufgelistet werden. Es dürfte kein Problem sein, mit einem leicht geänderten Crawler auch deutsche Facebook-Konten zu sammeln.

Um auch die Kontakte der Nutzer auszulesen, müssten deutlich mehr Daten verarbeitet werden, wozu der Entwickler des Crawlers derzeit keine Möglichkeiten hat. Pläne hat er trotzdem: "Ich würde das in der Zukunft angehen, wenn also irgendjemand Bandbreite zur Verfügung hat und spenden will, brauche ich nur einen ssh-Account und ein installiertes Nmap", so Bowes.

Private Daten auf Facebook werden durch den neuen Facebook-Crawler zwar nicht ausgelesen. Doch das damit erstellte "Facebook-Telefonbuch" kann als Ausgangspunkt für weitere Crawler und vor allem für Bots genutzt werden. Ein Beispiel sind Friend-Inviter, die in Verbindung mit eigens angelegten Facebook-Konten automatisch massenhaft Freundeseinladungen verschicken - etwa um dann Daten zu sammeln oder Werbung für etwas zu machen.

Es ist nicht das erste Mal, dass Nutzerdaten von Facebook und Co. ausgelesen werde. Soziale Netzwerke können sich gegen Sammelaktionen von öffentlichen Daten kaum schützen - vor allem dann nicht, wenn sie - wie Facebook - auch mit Suchmaschinenbetreibern wie etwa Google zusammen arbeiten. Immerhin müssen sich die Nutzer untereinander auch finden können. Zwar können sich Nutzer bei Facebook aus dem Suchindex ausblenden und Kontaktmöglichkeiten für Fremde deaktivieren, doch das erschwert gleichzeitig die Kontaktaufnahme.

Beim Schutz der nicht-öffentlichen Daten hat sich etwa Facebook-Konkurrent VZ Netzwerke (StudiVZ, SchülerVZ, MeinVZ) mehr ins Zeug gelegt als Facebook. Dennoch kann es seinen Nutzern nicht versprechen, dass sie komplett geschützt sind - und durch die wiederholten Crawling-Vorfälle auch nicht gerechtfertigt wäre. Die VZ Netzwerke gehören wie Golem.de zur Verlagsgruppe Georg von Holtzbrinck.

Generell lässt sich das Auslesen von Daten aus sozialen Netzwerken - zumindest aus zentral organisierten - kaum verhindern. Einerseits weil sie eben vernetzen und andererseits, weil es bei manchen Nutzern ein Sport geworden ist, möglichst viele Kontakte zu sammeln, auch solche, die weder Freunde noch Bekannte sind.


eye home zur Startseite
Ey voll buhuhu... 28. Jul 2010

Auch über diese kann man Werbung verschicken.

oxigensurfer 28. Jul 2010

meine Erlaubnis hamse...

oxigensurfer 28. Jul 2010

ßwie oft benutzt du das telefonbuch um jemand aus privaten gründen zu suchen ich meine...

Achtung Parallele 28. Jul 2010

so wie der verzweifelte Junge beim Studi VZ Crawler. (Der ist doch mit dem Taxi alleine...

Du bist naiv 28. Jul 2010

Trag dich sofort aus dem Telefonbuch aus und gib deinen Freunden deine Telefonnummer...



Anzeige

Stellenmarkt
  1. IT Baden-Württemberg (BITBW), Stuttgart-Feuerbach
  2. ALDI SÜD, Mülheim an der Ruhr
  3. Regierungspräsidium Freiburg, Freiburg
  4. Trebing & Himstedt Prozeßautomation GmbH & Co. KG, verschiedene Einsatzorte (Home-Office)


Anzeige
Hardware-Angebote
  1. (Core i5-7600K + Asus GTX 1060 Dual OC)
  2. 1.029,00€ + 5,99€ Versand
  3. (täglich neue Deals)

Folgen Sie uns
       


  1. Obsoleszenz

    Apple repariert zahlreiche Macbooks ab Mitte 2017 nicht mehr

  2. Komplett-PC

    In Nvidias Battleboxen steckt AMDs Ryzen

  3. Internet

    Cloudflare macht IPv6 parallel zu IPv4 jetzt Pflicht

  4. Square Enix

    Neustart für das Final Fantasy 7 Remake

  5. Agesa 1006

    Ryzen unterstützt DDR4-4000

  6. Telekom Austria

    Nokia erreicht 850 MBit/s im LTE-Netz

  7. Star Trek Bridge Crew im Test

    Festgetackert im Holodeck

  8. Quantenalgorithmen

    "Morgen könnte ein Physiker die Quantenmechanik widerlegen"

  9. Astra

    ZDF bleibt bis zum Jahr 2020 per Satellit in SD verfügbar

  10. Kubic

    Opensuse startet Projekt für Container-Plattform



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Razer Core im Test: Grafikbox + Ultrabook = Gaming-System
Razer Core im Test
Grafikbox + Ultrabook = Gaming-System
  1. Gaming-Notebook Razer will das Blade per GTX 1070 aufrüsten
  2. Razer Lancehead Symmetrische 16.000-dpi-Maus läuft ohne Cloud-Zwang
  3. 17,3-Zoll-Notebook Razer aktualisiert das Blade Pro mit THX-Zertifizierung

Matebook X und E im Hands on: Huawei kann auch Notebooks
Matebook X und E im Hands on
Huawei kann auch Notebooks
  1. Matebook X Huawei stellt erstes Notebook vor
  2. Trotz eigener Geräte Huawei-Chef sieht keinen Sinn in Smartwatches
  3. Huawei Matebook Erste Infos zu kommenden Huawei-Notebooks aufgetaucht

Debatte nach Wanna Cry: Sicherheitslücken veröffentlichen oder zurückhacken?
Debatte nach Wanna Cry
Sicherheitslücken veröffentlichen oder zurückhacken?
  1. Android-Apps Rechtemissbrauch ermöglicht unsichtbare Tastaturmitschnitte
  2. Sicherheitslücke Fehlerhaft konfiguriertes Git-Verzeichnis bei Redcoon
  3. Hotelketten Buchungssystem Sabre kompromittiert Zahlungsdaten

  1. 6 Jahre Reparatursupport sollten ja auch reichen

    Sharra | 07:29

  2. Re: Fn-Unsinn

    igor37 | 07:29

  3. Re: 850Mb/s muss ich (nicht) haben

    picaschaf | 07:27

  4. Re: Und wieder das Anti-Fortschritts-Gemecker...

    DY | 07:24

  5. Re: Krankenhäuser sind auch betroffen

    divStar | 07:19


  1. 07:17

  2. 18:08

  3. 17:37

  4. 16:55

  5. 16:46

  6. 16:06

  7. 16:00

  8. 14:21


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel