Wie Facebook die Daten von 300 Millionen Nutzern verkraftet

Anzeige

Durch solche und weitere Optimierungen sei es gelungen, die Zahl der physischen I/O-Zugriffe pro ausgeliefertem Bild von rund 10 auf rund 3 zu senken. Letztendlich aber entwickelte Facebook mit Haystack ein eigenes Open-Source-Dateisystem zum Speichern großer Bildermengen, das pro ausgeliefertem Bild nur noch einen I/O-Zugriff benötigt. So sei es nun möglich, rund viermal mehr Bilder mit der gleichen Hardware auszuliefern.

PHP für die Webserver

Die grundlegende Architektur der Facebook-Plattform gliedert sich in drei Schichten: ein Loadbalancer reicht Daten an Webserver weiter, die ihrerseits auf Dienste, Memcached und Datenbanken zugreifen. Bei den Webservern setze Facebook auf PHP als Scriptsprache, da PHP leicht zu lernen, zu programmieren und debuggen sei. Dem stehen hohen Runtimekosten gegenüber, denn PHP brauche viel Speicher und Rechenzeit. Zudem sei die Verbindung mit C++ eine Herausforderung und bei großer Codemenge werfe PHP gewisse organisatorische Probleme auf. Auch mache neuer Code alten langsamer, selbst wenn dieser in keinem Zusammenhang stehe, da der Initialisierungsaufwand, der bei jeder Anfrage anfällt, steige.

Um dem entgegen zu wirken, hat Facebook einige Optimierungen vorgenommen und beispielsweise den APC (Advanced PHP Cache) um Lazy-Loading, Cache-Priming und effizientere Locking-Funktionen erweitert. Zudem wurde eine eigene Memcached-Client-Erweiterung sowie Mechanismen zum asynchronen Event-Handling geschrieben. Derzeit arbeitet Facebook an einem Compiler, der PHP in C++ umsetzt, um daraus hoch optimierte ausführbare Dateien zu machen.

Die Webserver greifen auf Backendsysteme zurück, die in aller Regel in C++ implementiert werden, nutzen aber auch andere Sprachen wie Python, Ruby oder Erlang - je nachdem, welche für die aktuelle Aufgabe am besten geeignet ist. Facebooks Suchdienst ein solches Beispiel.

25 TByte Logfiles pro Tag

Ein weiteres Backendsystem ist Scribe, mit dem Facebook seine große Menge an Logfiledaten verarbeitet, denn täglich fallen rund 25 TByte an Logfiles auf den Servern an, die chronologisch konsolidiert werden müssen. Letztendlich verarbeitet ein Hadoop-Cluster mit rund 1.000 Nodes die Daten und erlaubt Analysen des Nutzerverhaltens, um herauszufinden, wie neue Funktionen von Nutzern verwendet werden.

  1. 1
  2. 2
  3. 3

........... 03. Feb 2010

Eins wird da wohl völlig reichen und selbst dann haste noch etliche Ressourcen frei um...

Michael 76 27. Okt 2009

Schon gewusst, Facebook setzt MySQL gar nicht als relationale Datenbank ein. MySQL dient...

gyko 27. Okt 2009

Da ich grad an der UCSD studiere, konnte mir das das anhören. Kann jedem Technik...

Michael 76 27. Okt 2009

Dir ist aber schon klar, das Abmelden nicht gleich löschen heisst. Meist werden deine...

Michael 76 27. Okt 2009

Für alle dies es nicht wissen sollten !!! Facebook setzt nur auf der Webtierschicht PHP...

Kommentieren


/var/bergercity/ / 29. Okt 2009

unterm Facebook

www.amade.ch / 27. Okt 2009

the blue window

WebhostingBlog - Corporate-Blog der dogado Internet GmbH / 22. Okt 2009

Jeff Rothschild spricht über die Technik von Facebook

Timo Mankartz / 22. Okt 2009

Facebook und die Technik

Blog von Jens Ihnow / 21. Okt 2009

Facebook - Technik im Hintergrund

Test, Download & Empfehlungen / 21. Okt 2009

Fakten: Facebook Zahlen



Anzeige
  1. IT Manager (m/w)
    Seaarland Shipmanagement GmbH & Co. KG, Hamburg (Reisebereitschaft)
  2. Java-Entwickler (m/w) - Bereich ERP
    HALTEC Hallensysteme GmbH, Korntal-Münchingen
  3. Software Engineer (m/w)
    PTV Planung Transport Verkehr AG, Karlsruhe
  4. Java Web Developer Backend (SQLServer) im M-Commerce (m/w)
    über HRM CONSULTING GmbH, Berlin

 

Detailsuche


Folgen Sie uns
       


Meistgelesen
  1. Radeon HD 7770 und 7750 im Test

    Die Grafikkarte mit 1 GHz für 159 Euro

  2. Youporn-Betreiber

    Hacker will 350.000 Datensätze bei Pornoseite erbeutet haben

  3. Nortel Networks

    Nortel war fast zehn Jahre lang gehackt

  4. Unity Technologies

    Bessere Grafik und KI mit Unity 3.5 verfügbar

  5. Abmahnabzocke

    Maximal 100 Euro Abmahngebühr für Urheberrechtsverstöße


Meistkommentiert
  1. Kommentare: 270 | letzter Beitrag 13.02. 23:28

  2. Kommentare: 200 | letzter Beitrag 14.02. 22:07

  3. Kommentare: 194 | letzter Beitrag 14.02. 13:50

  4. Kommentare: 117 | letzter Beitrag 14.02. 12:39

  5. Kommentare: 101 | letzter Beitrag 02:39 Uhr

Mehr


  1. Google

    Wir haben den größten DNS-Dienst

  2. Lensbaby

    Teleobjektiv mit absichtlicher Unschärfe

  3. Smartphone-App

    Remove löscht störende Menschen im Bild

  4. Radeon HD 7770 und 7750 im Test

    Die Grafikkarte mit 1 GHz für 159 Euro

  5. Youporn-Betreiber

    Hacker will 350.000 Datensätze bei Pornoseite erbeutet haben

  6. TZ77XE4

    Biostar zeigt Mainboard für Ivy Bridge und Sandy Bridge

  7. Unity Technologies

    Bessere Grafik und KI mit Unity 3.5 verfügbar

  8. Fifa Street

    Last Man Standing auf dem Bolzplatz

  9. Isis Web Browser

    Neuer Browser für HPs WebOS

  10. Nortel Networks

    Nortel war fast zehn Jahre lang gehackt



Haben wir etwas übersehen?

E-Mail an news@golem.de


IBM-Mainframe: Nasa schaltet letzten Großrechner ab
IBM-Mainframe
Nasa schaltet letzten Großrechner ab

Die Nasa hat den letzten IBM-Mainframe abgeschaltet. Damit gehe eine Rechnerära bei der Nasa zu Ende, schreibt deren IT-Chefin.

  1. Grail Nasa veröffentlicht Video von der Rückseite des Mondes

Test PS Vita: Ausstattungswunder mit Speicherproblem
Test PS Vita
Ausstattungswunder mit Speicherproblem

Zwei Analogsticks und starke Grafik, Berührungs- und Bewegungssteuerung, UMTS und Bluetooth: Sony Computer Entertainment packt in den Nachfolger der Playstation Portable so gut wie alles, was irgendwie Sinn ergibt - nur Speicher etwa für Savegames fehlt der PS Vita von Haus aus.

  1. Playstation Network Umbenennung der Konten und neue Firmware

Club-Mate: Hack fürs Hirn
Club-Mate
Hack fürs Hirn

Es sprudelt, schäumt und schmeckt - nicht jedem. Macht nichts: Club-Mate ist Kult und aus der Hackerkultur nicht mehr wegzudenken. Wie es dazu kommen konnte, erzählt das Buch Hackerbrause.

  1. Retro-Gnome Cinnamon 1.2 stabilisiert API und Desktop
  2. Linux Mint Cinnamon wird wohl Standarddesktop
  3. 28C3 Hacker hinter feindlichen Linien

Zum Artikel