Abo
  • Services:
Anzeige

Facebook-Crawler

Datensammeln leichtgemacht

Bots werden es künftig leichter haben, Facebook-Nutzer mit Spam und Phishing-Einladungen zu überhäufen. Grund ist ein neuer Crawler, mit dem sich die Namen und Links zu Facebook-Konten auslesen lassen. Ein 10-GByte-Datensatz mit 170 Millionen Links liegt Golem.de vor.

Das in Ruby geschriebene Script von Ron Bowes ist recht einfach. Aus dem offiziellen Facebook-Verzeichnis liest er die Namen und zugehörigen Links von Nutzerkonten aus. Davon gibt es mittlerweile weltweit rund 500 Millionen. Mit dem Crawler wurden von seinem Entwickler offenbar testweise US-Konten gesammelt - Ron Bowes ist laut seinem Blog Skullsecurity.org Nordamerikaner.

Anzeige

Die als Torrent-Datei zum Download angebotene Datei bringt es als um Dubletten bereinigter Datensatz mit 170 Millionen Account-Links auf 10 GByte. Es gibt weitere Dateien, in denen die Vor- und Nachnamen nach Häufigkeit sortiert sind und in denen einmalige Namen aufgelistet werden. Es dürfte kein Problem sein, mit einem leicht geänderten Crawler auch deutsche Facebook-Konten zu sammeln.

Um auch die Kontakte der Nutzer auszulesen, müssten deutlich mehr Daten verarbeitet werden, wozu der Entwickler des Crawlers derzeit keine Möglichkeiten hat. Pläne hat er trotzdem: "Ich würde das in der Zukunft angehen, wenn also irgendjemand Bandbreite zur Verfügung hat und spenden will, brauche ich nur einen ssh-Account und ein installiertes Nmap", so Bowes.

Private Daten auf Facebook werden durch den neuen Facebook-Crawler zwar nicht ausgelesen. Doch das damit erstellte "Facebook-Telefonbuch" kann als Ausgangspunkt für weitere Crawler und vor allem für Bots genutzt werden. Ein Beispiel sind Friend-Inviter, die in Verbindung mit eigens angelegten Facebook-Konten automatisch massenhaft Freundeseinladungen verschicken - etwa um dann Daten zu sammeln oder Werbung für etwas zu machen.

Es ist nicht das erste Mal, dass Nutzerdaten von Facebook und Co. ausgelesen werde. Soziale Netzwerke können sich gegen Sammelaktionen von öffentlichen Daten kaum schützen - vor allem dann nicht, wenn sie - wie Facebook - auch mit Suchmaschinenbetreibern wie etwa Google zusammen arbeiten. Immerhin müssen sich die Nutzer untereinander auch finden können. Zwar können sich Nutzer bei Facebook aus dem Suchindex ausblenden und Kontaktmöglichkeiten für Fremde deaktivieren, doch das erschwert gleichzeitig die Kontaktaufnahme.

Beim Schutz der nicht-öffentlichen Daten hat sich etwa Facebook-Konkurrent VZ Netzwerke (StudiVZ, SchülerVZ, MeinVZ) mehr ins Zeug gelegt als Facebook. Dennoch kann es seinen Nutzern nicht versprechen, dass sie komplett geschützt sind - und durch die wiederholten Crawling-Vorfälle auch nicht gerechtfertigt wäre. Die VZ Netzwerke gehören wie Golem.de zur Verlagsgruppe Georg von Holtzbrinck.

Generell lässt sich das Auslesen von Daten aus sozialen Netzwerken - zumindest aus zentral organisierten - kaum verhindern. Einerseits weil sie eben vernetzen und andererseits, weil es bei manchen Nutzern ein Sport geworden ist, möglichst viele Kontakte zu sammeln, auch solche, die weder Freunde noch Bekannte sind.


eye home zur Startseite
Ey voll buhuhu... 28. Jul 2010

Auch über diese kann man Werbung verschicken.

oxigensurfer 28. Jul 2010

meine Erlaubnis hamse...

oxigensurfer 28. Jul 2010

ßwie oft benutzt du das telefonbuch um jemand aus privaten gründen zu suchen ich meine...

Achtung Parallele 28. Jul 2010

so wie der verzweifelte Junge beim Studi VZ Crawler. (Der ist doch mit dem Taxi alleine...

Du bist naiv 28. Jul 2010

Trag dich sofort aus dem Telefonbuch aus und gib deinen Freunden deine Telefonnummer...



Anzeige

Stellenmarkt
  1. Wolfgang Westarp GmbH, Beckum
  2. Power Service GmbH, Köln
  3. IT4IPM GmbH, Berlin
  4. DRÄXLMAIER Group, Vilsbiburg bei Landshut


Anzeige
Spiele-Angebote
  1. 35,99€
  2. (u. a. Dark Souls III für 24,99€, Darkosuls II: Scholar of the First Sin für 8,99€ und...
  3. 4,99€

Folgen Sie uns
       

Anzeige
Whitepaper
  1. Globale SAP-Anwendungsunterstützung durch Outsourcing


  1. Moto G5 und Moto G5 Plus im Hands on

    Lenovos kompakte Mittelklasse ist zurück

  2. Handy-Klassiker

    HMD Global bringt das Nokia 3310 zurück

  3. Galaxy Tab S3 im Hands on

    Samsung präsentiert Oberklasse-Tablet mit Eingabestift

  4. Galaxy Book im Hands on

    Samsung bringt neuen 2-in-1-Computer

  5. Mobilfunk

    "5G muss weit mehr als LTE bieten"

  6. UHS-III

    Neuer (Micro-)SD-Karten-Standard schafft über 600 MByte/s

  7. Watch 2 im Hands on

    Huaweis neue Smartwatch soll bis zu 21 Tage lang durchhalten

  8. LG G6 im Hands on

    Schlankes Smartphone hat zwei Kameralinsen

  9. P10 und P10 Plus im Hands on

    Huaweis neues P10 kostet 600 Euro

  10. Mobilfunk

    Nokia bringt Vorstandard 5G-Netzwerkausrüstung



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Mechanische Tastatur Poker 3 im Test: "Kauf dir endlich Dämpfungsringe!"
Mechanische Tastatur Poker 3 im Test
"Kauf dir endlich Dämpfungsringe!"
  1. Patentantrag Apple denkt über Tastatur mit Siri-, Emoji- und Teilen-Taste nach
  2. MX Board Silent im Praxistest Der viel zu teure Feldversuch von Cherry
  3. Kanex Faltbare Bluetooth-Tastatur für mehrere Geräte gleichzeitig

Hyperloop-Challenge: Der Kompressor macht den Unterschied
Hyperloop-Challenge
Der Kompressor macht den Unterschied
  1. Arrivo Die neuen alten Hyperlooper
  2. SpaceX Die Bayern hyperloopen am schnellsten und weitesten
  3. Hyperloop HTT baut ein Forschungszentrum in Toulouse

Merkels NSA-Vernehmung: Die unerträgliche Uninformiertheit der Kanzlerin
Merkels NSA-Vernehmung
Die unerträgliche Uninformiertheit der Kanzlerin
  1. Apple Planet der affigen Fernsehshows
  2. München Wie Limux unter Ausschluss der Öffentlichkeit zerstört wird
  3. Glasfaser Nun hängt die Kabel doch endlich auf!

  1. Re: Geiz ist geil

    Bouncy | 20:32

  2. Antennen?

    limo_ | 20:31

  3. Re: Endlich keine Software-Buttons mehr nötig ...

    nolonar | 20:27

  4. Re: Theoretischer vs. praktischer Wert

    ChMu | 20:27

  5. Was ist denn das bitte?

    AllDayPiano | 20:26


  1. 20:32

  2. 20:15

  3. 19:00

  4. 19:00

  5. 18:45

  6. 18:10

  7. 17:48

  8. 15:49


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel