Golem.de
 
Suchen bei Golem.de
Videos
Motorola Milestone 2 mit Motoblur Motorola Milestone 2 mit Motoblur
Stellenmarkt

Requirements Engineer / Business Analyst (m/w)
afb Application Services AG, München

Gruppenleiter (m/w) Testcenter Chipkarten
Deutscher Sparkassenverlag GmbH, Stuttgart

Datenbank-Anwendungsentwickl- er (m/w)
VSM AG, Hannover

Detailsuche
Newsletterabo
Verwandte Themen

Security, Internet, Datenschutz, Facebook, Soziales Netz

Verwandte Artikel
Letzte Meldungen

Open-Xchange: Migrationstool für Outlook und Exchange

Darpa: Software soll Spionage erkennen

Samsung: Neue Notebooks mit Geforce GT 420M angekündigt

Garmin Nülink 1695: Navigationsgerät mit Navteq Traffic und 5-Zoll-Touchscreen

Maximal 50 MBit/s: Vodafone veröffentlicht Preise für LTE-Internetzugänge

Call of Duty 7 Black Ops: Das Glücksspiel mit dem Tomahawk

Navteq Natural Guidance: Navigationsanweisungen sollen menschlich werden

Philips: 3D-Fernseher im Kinoformat

Novell: Suse Linux Enterprise Server für VMware optimiert

Digitale Literatur: Neal Stephenson und die digital-sozialen Mongolen

Unigine: Oil Rush als erstes Spiel geplant

Go Live 1005: Neues Tomtom-Topmodell mit kapazitivem 5-Zoll-Touchscreen

Tomtom Via 120 Traffic: Navigationsgerät mit Bluetooth für 180 Euro

Tomtom Start XL: Einsteiger-Navigationsgerät mit Sechs-Button-Bedienung

Gerücht: Red Hat will Cloud-Startup Makara kaufen

Unreal Engine 3 auf iOS: Epics Demo Citadel setzt Maßstäbe auf iPhone und Co.

Auftragshersteller: Flextronics erhöht die Löhne in China

Binary Planting: Microsoft veröffentlicht neues Hilfe-Werkzeug

Satellitenbetreiber: SES Astra und Sender einigen sich auf 3D-Standards

DivX: Neue Geräte, HTML 5 und ein Ersatz für Flash

Smart Eyes: Überwachungssystem nach menschlichem Vorbild

VMware: Cloud-Plattform vFabric für Java-Anwendungen

Galaxy Tab: Samsungs Android-Tablet ausprobiert

Windows 7 Family Pack: Ende Oktober wieder drei Windows-Lizenzen für 150 Euro?

Smartphone-Betriebssystem: Windows Phone 7 ist fertig

Carl Zeiss: 35-mm-Festbrennweite mit F1,4 für Canon und Nikon

Canon: Schwarz-Weiß-Laserdrucker erzeugt 40 Seiten pro Minute

Apple TV: Kleiner, billiger und ohne Festplatte

Ping: iTunes 10 mit sozialem Netzwerk

Apple: Neuer iPod touch, nano und shuffle

Weitere News


Haben wir etwas übersehen? Dann Mail an news@golem.de.

HOME

Security / 30.07.2010 / 17:05Trackback    Teilen    Druck 

Facebook-Crawler

Einfach als Google ausgeben

Die öffentlichen Nutzerdaten von Facebook sollen sich nicht nur über das Nutzerverzeichnis, sondern auch über die Sitemap gut auslesen lassen. Grund ist ein Versäumnis von Facebook.

Günter Grodotzki hatte bereits im April 2010 herausgefunden, wie sich der öffentliche Teil von Facebook-Profilen massenhaft auslesen lässt. Anders als der Crawler von Ron Bowes, dessen Blog derzeit unerreichbar ist, liest der Crawler von Grodotzki nicht das Facebook-Verzeichnis, sondern die Sitemap des sozialen Netzwerks aus. Das sei "viel einfacher", sagte Grodotzki Golem.de, obwohl auch damit nur so viele Daten auslesbar seien, wie es der Facebook-Nutzer zulasse.

Eine Sitemap ist eine XML-Datei mit allen URLs der Webseite, die von Suchmaschinen wie Google gecrawlt und indexiert werden sollen. Auf sie kann eigentlich nur von berechtigten Hostnamen zugegriffen werden. Darunter laut Grodotzki auch diejenigen, die sich als Googlebot ausweisen. Diesen Hostnamen fälschte Grodotzki und machte sich zunutze, dass Facebook sich nicht mittels Cross-Checking absichert. Letztlich sind dann alle die Daten auslesbar, die regulär von Google gesehen werden.

Schneller Auslesen

Durch das Auslesen der Sitemap ist umfangreiches Crawling ohne Captcha-Hürden möglich. Und das "mit einem viel höheren Datendurchsatz, da man es auch ausgeloggt durchführen kann und es wegen des gefälschten Hostnamens nicht auffällt", so Grodotzki.

Ausprobiert hat er das bereits, indem er laut eigenen Aussagen etwa 10 GByte an reinen XML-Dateien ausgelesen hat. Diese enthielten Links zu den Nutzerprofilen, Profilbildern, Gruppen, Pages und Kontakten. Um auch die Inhalte dieser URLs auszulesen, würden jedoch 2 Terabyte oder mehr Speicherplatz anfallen.

Das Auslesen von öffentlichen Daten aus sozialen Netzwerken lässt sich kaum verhindern. Auch der Facebook-Konkurrent VZ Netzwerke, wie Golem.de zugehörig zur Verlagsgruppe Georg von Holtzbrinck, sammelt auf SchülerVZ, StudiVZ und MeinVZ weiter Erfahrungen mit Crawlern.

Die mit Crawlern gewonnenen Profillinks haben durchaus einen Wert - sie können etwa Ziele für unerwünschte Werbung und Phishingversuche werden. Die persönlichen Daten bleiben den Bots und anderen allzu Neugierigen verborgen, sofern die Nutzer von den sinnvollen Einstellungen für mehr Privatsphäre Gebrauch machen. (ck)
Kommentar-Übersicht / Kommentieren:
Re: Habe meinen Facebook account soeben gelöscht (Turrican, 02.08.10 09:40)
Re: Wenn der user sein Facebook public macht, ist... (Turrican, 02.08.10 07:34)
Re: Facebook Facebook (klo, 01.08.10 21:22)
Hostnamen PTR (Krille, 31.07.10 04:09)
Re: the point being... ? (Verzeihung, 30.07.10 17:47)
Trackback:
Aktuelle Artikel

Open-Xchange
Migrationstool für Outlook und Exchange

Open-Xchange: Migrationstool für Outlook und Exchange Open-Xchange hat eine Software veröffentlicht, die Daten aus Microsofts Outlook auf einen Open-Xchange Server migriert. Der Umzug von Microsofts Exchange-Server soll mit dem Werkzeug ebenfalls möglich sein.

Darpa
Software soll Spionage erkennen

Die Darpa will ein Überwachungssystem entwickeln lassen, das Spione in Behörden oder beim Militär entlarvt. So soll verhindert werden, dass geheime Daten an Organisationen wie Wikileaks gegeben werden.

Samsung
Neue Notebooks mit Geforce GT 420M angekündigt

Samsung: Neue Notebooks mit Geforce GT 420M angekündigt Ifa 2010 Samsungs aktuelle Notebookserien werden zum Teil mit Nvidias Geforce GT 420M ausgestattet. Zudem setzt Samsung jetzt konsequent auf Bluetooth 3.0.

 

 

Audio/Video | Desktop-Applikationen | Foto | Games | Handy | Internet | Mobil | OSS | PC-Hardware | Politik/Recht | Security | Software-Entwicklung | Wirtschaft | Wissenschaft

Ticker | RSS | API | Forum | Zusatz-Dienste | Jobs | IT-Events

Home | Impressum | Werbung | Freunde

Copyright © 1997 - 2010 Golem.de. Alle Rechte vorbehalten.

 

Zum Artikel Text einblenden Text ausblenden