Abo
  • Services:
Anzeige

Facebook-Crawler

Datensammeln leichtgemacht

Bots werden es künftig leichter haben, Facebook-Nutzer mit Spam und Phishing-Einladungen zu überhäufen. Grund ist ein neuer Crawler, mit dem sich die Namen und Links zu Facebook-Konten auslesen lassen. Ein 10-GByte-Datensatz mit 170 Millionen Links liegt Golem.de vor.

Das in Ruby geschriebene Script von Ron Bowes ist recht einfach. Aus dem offiziellen Facebook-Verzeichnis liest er die Namen und zugehörigen Links von Nutzerkonten aus. Davon gibt es mittlerweile weltweit rund 500 Millionen. Mit dem Crawler wurden von seinem Entwickler offenbar testweise US-Konten gesammelt - Ron Bowes ist laut seinem Blog Skullsecurity.org Nordamerikaner.

Anzeige

Die als Torrent-Datei zum Download angebotene Datei bringt es als um Dubletten bereinigter Datensatz mit 170 Millionen Account-Links auf 10 GByte. Es gibt weitere Dateien, in denen die Vor- und Nachnamen nach Häufigkeit sortiert sind und in denen einmalige Namen aufgelistet werden. Es dürfte kein Problem sein, mit einem leicht geänderten Crawler auch deutsche Facebook-Konten zu sammeln.

Um auch die Kontakte der Nutzer auszulesen, müssten deutlich mehr Daten verarbeitet werden, wozu der Entwickler des Crawlers derzeit keine Möglichkeiten hat. Pläne hat er trotzdem: "Ich würde das in der Zukunft angehen, wenn also irgendjemand Bandbreite zur Verfügung hat und spenden will, brauche ich nur einen ssh-Account und ein installiertes Nmap", so Bowes.

Private Daten auf Facebook werden durch den neuen Facebook-Crawler zwar nicht ausgelesen. Doch das damit erstellte "Facebook-Telefonbuch" kann als Ausgangspunkt für weitere Crawler und vor allem für Bots genutzt werden. Ein Beispiel sind Friend-Inviter, die in Verbindung mit eigens angelegten Facebook-Konten automatisch massenhaft Freundeseinladungen verschicken - etwa um dann Daten zu sammeln oder Werbung für etwas zu machen.

Es ist nicht das erste Mal, dass Nutzerdaten von Facebook und Co. ausgelesen werde. Soziale Netzwerke können sich gegen Sammelaktionen von öffentlichen Daten kaum schützen - vor allem dann nicht, wenn sie - wie Facebook - auch mit Suchmaschinenbetreibern wie etwa Google zusammen arbeiten. Immerhin müssen sich die Nutzer untereinander auch finden können. Zwar können sich Nutzer bei Facebook aus dem Suchindex ausblenden und Kontaktmöglichkeiten für Fremde deaktivieren, doch das erschwert gleichzeitig die Kontaktaufnahme.

Beim Schutz der nicht-öffentlichen Daten hat sich etwa Facebook-Konkurrent VZ Netzwerke (StudiVZ, SchülerVZ, MeinVZ) mehr ins Zeug gelegt als Facebook. Dennoch kann es seinen Nutzern nicht versprechen, dass sie komplett geschützt sind - und durch die wiederholten Crawling-Vorfälle auch nicht gerechtfertigt wäre. Die VZ Netzwerke gehören wie Golem.de zur Verlagsgruppe Georg von Holtzbrinck.

Generell lässt sich das Auslesen von Daten aus sozialen Netzwerken - zumindest aus zentral organisierten - kaum verhindern. Einerseits weil sie eben vernetzen und andererseits, weil es bei manchen Nutzern ein Sport geworden ist, möglichst viele Kontakte zu sammeln, auch solche, die weder Freunde noch Bekannte sind.


eye home zur Startseite
Ey voll buhuhu... 28. Jul 2010

Auch über diese kann man Werbung verschicken.

oxigensurfer 28. Jul 2010

meine Erlaubnis hamse...

oxigensurfer 28. Jul 2010

ßwie oft benutzt du das telefonbuch um jemand aus privaten gründen zu suchen ich meine...

Achtung Parallele 28. Jul 2010

so wie der verzweifelte Junge beim Studi VZ Crawler. (Der ist doch mit dem Taxi alleine...

Du bist naiv 28. Jul 2010

Trag dich sofort aus dem Telefonbuch aus und gib deinen Freunden deine Telefonnummer...



Anzeige

Stellenmarkt
  1. über Robert Half Technology, Frankfurt am Main
  2. DR. KADE Pharmazeutische Fabrik GmbH, Berlin
  3. DZR Deutsches Zahnärztliches Rechenzentrum GmbH, Stuttgart
  4. dSPACE GmbH, Paderborn


Anzeige
Hardware-Angebote
  1. (u. a. MSI Gaming X 8G, Evga ACX 3.0, Gainward Phoenix GS, Gigabyte G1 Gaming)
  2. (Core i5-6500 + Geforce GTX 1060)

Folgen Sie uns
       

Anzeige
Whitepaper
  1. Tipps für IT-Engagement in Fernost
  2. Mehr dazu im aktuellen Whitepaper von Bitdefender
  3. Globale SAP-Anwendungsunterstützung durch Outsourcing


  1. Olympia

    Kann der Hashtag #Rio2016 verboten werden?

  2. Containerverwaltung

    Docker für Mac und Windows ist einsatzbereit

  3. Drosselung

    Telekom schafft wegen intensiver Nutzung Spotify-Option ab

  4. Quantenkrytographie

    Chinas erster Schritt zur Quantenkommunikation per Satellit

  5. Sony

    Absatz der Playstation 4 weiter stark

  6. Gigafactory

    Teslas Gigantomanie in Weiß und Rot

  7. Cloud-Speicher

    Amazon bietet unbegrenzten Speicherplatz für 70 Euro im Jahr

  8. Rechtsstreit

    Nvidia zahlt 30 US-Dollar für 512 MByte

  9. Formel E

    Die Elektrorenner bekommen einen futuristischen Frontflügel

  10. Familienmediathek

    Google lässt gekaufte Play-Store-Inhalte teilen



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Geforce GTX 1060 im Test: Knapper Konter
Geforce GTX 1060 im Test
Knapper Konter
  1. Quadro P6000/P5000 Nvidia kündigt Profi-Karten mit GP102-Vollausbau an
  2. Grafikkarte Nvidia bringt neue Titan X mit GP102-Chip für 1200 US-Dollar
  3. Notebooks Nvidia bringt Pascal-Grafikchips für Mobile im August

Dirror angeschaut: Der digitale Spiegel, der ein Tablet ist
Dirror angeschaut
Der digitale Spiegel, der ein Tablet ist
  1. Bluetooth 5 Funktechnik sendet mehr Daten auch ohne Verbindungsaufbau
  2. Smarter Schalter Wenn Github mit dem Lichtschalter klingelt
  3. Tony Fadell Nest-Gründer macht keine Omeletts mehr

Pokémon Go im Test: Hype in der Großstadt, Flaute auf dem Land
Pokémon Go im Test
Hype in der Großstadt, Flaute auf dem Land
  1. Pokémon Go Pikachu versus Bundeswehr
  2. Nintendo Gewinn steigt durch Pokémon Go kaum an
  3. Pokémon Go Monsterjagd im Heimatland

  1. Re: Welche Rechte/Pflichten erhält man am Ende...

    Paule | 15:43

  2. Wäre toll wenn man das irgendwie als Dateisystem...

    HiddenX | 15:42

  3. Re: tja der Rest der Welt muss sich wieder selbst...

    0xDEADC0DE | 15:42

  4. Re: Und die Schweizer?!

    Prypjat | 15:40

  5. Re: Die GTX970 bekam heute(?) den legacy Status.

    0xDEADC0DE | 15:40


  1. 14:28

  2. 13:00

  3. 12:28

  4. 12:19

  5. 12:16

  6. 12:01

  7. 11:39

  8. 11:23


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel