Facebooks Rechenzentrum in Prineville
Facebooks Rechenzentrum in Prineville (Bild: Facebook)

1 Milliarde Nutzer Facebooks größte technische Errungenschaften

Welche Probleme mussten Facebooks Entwickler lösen, um das Wachstum auf mehr als 1 Milliarde aktive Nutzer zu bewerkstelligen, und was waren die daraus resultierenden größten technischen Errungenschaften? Andere, als die meisten denken, sagt Robert Johnson, der fünf Jahre lang Facebooks Infrastruktur-Software-Team leitete.

Anzeige

Facebooks Memcached- und MySQL-Cluster sei für ihn zwar die größte Leistung von Facebook, viele große Errungenschaften, die Facebooks Entwickler hervorgebracht hätten, hätten damit aber eher wenig zu tun, schreibt Robert Johnson, der fünf Jahre lang Facebooks Infrastruktur-Software-Team leitete, auf Quora. Als er Facebook vor einem Jahr verließ, waren in Facebooks Memcached-Cluster mehr als 1 Billion Objekte gespeichert, wobei der Cluster zum Teil mehr als 1 Milliarde Abfragen pro Sekunde abwickelte, von denen die meisten in unter 1 Millisekunde aus verteilten Rechenzentren, die über die ganze Welt verstreut sind, beantwortet wurden. Bereits 2008, als Facebook noch deutlich weniger als 100 Millionen Nutzer hatte, bestand der Memcached-Cluster bereits aus 800 Servern mit mehr als 28 TByte Speicher. Damit das in dieser Größenordnung funktioniert, waren diverse Änderungen notwendig, so manche auch am Linux-Kernel.

Johnson geht aber davon aus, dass dieser Cluster in Zukunft durch neue Technologie ersetzt wird, und zählt daher andere, nachhaltigere Entwicklungen zu Facebooks größten Errungenschaften. Denn Facebook ist angesichts seiner Größe an so mancher Stelle auf Probleme gestoßen, von denen bislang gar nichts bekannt war.

Konsistente Daten weltweit

Da Facebook eine Echtzeitapplikation ist, müssen Änderungen in einem Teil der Welt unmittelbar in allen Teilen der Welt zur Verfügung stehen. Facebook hat dazu unter anderem MySQL angepasst und einen Workaround entwickelt, der sicherstellt, dass Memcached auch dann weltweit korrekt aktualisiert wird, wenn bei der MySQL-Replikation Verzögerungen auftreten. Was sich nach einem kruden Hack anhöre, habe gut funktioniert, schreibt Johnson. Er weist aber darauf hin, dass das Setup heute deutlich komplizierter ist.

Einige nachhaltige Entwicklungen habe es auch im Netzwerkbereich gegeben. Bei Facebook setzen sich Seiten in aller Regel aus einer großen Zahl an Objekten zusammen, die von einem Server angefordert werden. Damit dabei die Netze nicht regelrecht verstopfen, werden bei Facebook schon die Anfragen verzögert. Das gilt insbesondere im Fall von Fehlern, denn in einem System wie dem von Facebook werden auch langsame und keine Antworten als Fehler betrachtet. Die normale Reaktion, eine weitere Anfrage hinterherzuschicken, wäre in diesem Fall aber kontraproduktiv, so Johnson, denn meist sei eine Überlastung der Grund für die Verzögerung. Schicke man dann noch mehr Anfragen, werde aus einem kleinen Problem schnell ein großes.

Weniger ist manchmal mehr

Das gilt auch dann, wenn Anfragen zufällig an einen von vielen Servern gesendet werden. Auch hier gilt: Kommt keine Antwort, ist es nicht unbedingt sinnvoll, die gleiche Anfrage an einen anderen Server zu senden. Ist ein einzelner Server ausgefallen, ist das die richtige Strategie, wenn die Antwort aber deshalb ausbleibt, weil die Hälfte der Server überlastet ist, hat man mit dieser Strategie gute Chancen, das ganze System zu Fall zu bringen.

Ganz wesentlich für Facebooks Erfolg seien zudem die Deployment-Infrastruktur und Monitoring: Facebook setzt hier auf viele kleine Änderungen. Statt mehrere Änderungen in einem Release zu sammeln, werden kleine Änderungen veröffentlicht, gegebenenfalls nur auf einem Teil der Server oder nur für wenige Nutzer. Anschließend werden die Auswirkungen der Änderungen überwacht, um die Folgen von Fehlern gering zu halten.

So manche Software, die Facebook dabei entwickelt hat, steht mittlerweile als Open Source zur Verfügung und kommt auch bei vielen anderen zum Einsatz. Dazu zählen Programme im Hadoop-Umfeld wie Hive und HBase ebenso wie die verteilte NoSQL-Datenbank Cassandra, die mittlerweile von der Apache Software Foundation weiterentwickelt wird. Gleiches gilt für die Schnittstelle Thrift. Für Linux wurde mit Flashcache ein Block-Cache entwickelt, der SSDs als Cache unterhalb des Dateisystems zur Verfügung stellt. Auch der Log-Aggregator Scribe und der PHP-Compiler Hiphop entstanden bei Facebook. Eine Übersicht über alle Open-Source-Projekte von Facebook findet sich unter developers.facebook.com/opensource.


Neuro-Chef 02. Feb 2013

Pfff, die Kombination kriegt man mit hoher Chance ja schon mit dem reinen Installieren...

Hu5eL 01. Feb 2013

Kannte ich noch nicht :D

Suckerpunch 30. Jan 2013

war es nicht irgendwas mit in den letzten 30 tagen eingeloggt ?

gutschilla 30. Jan 2013

Nun, ACID-konforme Transaktionen und Rollbacks kann mySQL mit dem InnoDB-Backend seit...

Casandro 30. Jan 2013

Naja, damals hat man irre viel in Glasfaserfernleitungen investiert. Vermutlich mehr als...

Kommentieren


Bitpage.de - Der Technikblog / 29. Jan 2013

Facebook Stasi-Funktion “Gesehen von” ausschalten



Anzeige

  1. Software Ingenieure (m/w)
    seneos GmbH, Stuttgart
  2. IT-Specialist (m/w) Internationales Reporting
    ALDI SÜD, Mülheim an der Ruhr
  3. Systembetreuer/in für das Einlagengeschäft Online Banking
    Daimler AG, Stuttgart
  4. IT-Consultant CRM (m/w)
    Media-Saturn IT Services GmbH, Ingolstadt

 

Detailsuche


Spiele-Angebote
  1. PlayStation 4 - Konsole Ultimate Player 1TB Edition
    395,00€
  2. NEU: The Elder Scrolls Online: Tamriel Unlimited - Xbox One
    39,00€
  3. NEU: GTA 5 (Xbox One)
    19,00€

 

Weitere Angebote


Folgen Sie uns
       


  1. Verdacht auf Landesverrat

    Generalbundesanwalt ermittelt gegen Netzpolitik.org

  2. Security

    Gehacktes Scharfschützengewehr schießt daneben

  3. Sony

    Schwarze Zahlen dank Playstation 4 und Fotosensoren

  4. Rocket League im Test

    Fantastische Tore mit der Heckklappe

  5. Neuer Windows Store

    Windows 10 erlaubt deutlich weniger Parallelinstallationen

  6. Schwache Mobilsparte

    Samsung plant Preisreduzierung der Galaxy-S6-Modelle

  7. Angry Birds 2

    Vogelauswahl im Schweinekampf

  8. Windows 10 im Tablet-Test

    Ein sinnvolles Windows für Tablets

  9. Elon Musk

    Tesla-Fahrer sollen neue Tesla-Fahrer werben

  10. Minecraft

    Beta mit nutzbarer Zweithand



Haben wir etwas übersehen?

E-Mail an news@golem.de



Neue WLAN-Router-Generation: Hohe Bandbreiten mit zweifelhaftem Nutzen
Neue WLAN-Router-Generation
Hohe Bandbreiten mit zweifelhaftem Nutzen
  1. EA8500 Linksys' MU-MIMO-Router kostet 300 Euro
  2. Aruba Networks 802.11ac-Access-Points mit integrierten Bluetooth Beacons
  3. 802.11ac Wave 2 Neue Chipsätze für die zweite Welle von ac-WLAN

Simulus QR-X350.PRO im Test: Der Quadcopter, der vom Himmel fiel
Simulus QR-X350.PRO im Test
Der Quadcopter, der vom Himmel fiel
  1. Flugverkehrskontrolle Amazon will Drohnenverkehr regeln
  2. Paketzustellung Google will Flugverkehrskontrolle für Drohnen entwickeln
  3. Luftzwischenfall Beinahekollision zwischen Lufthansa-Flugzeug und Drohne

OCZ Trion 100 im Test: Macht sie günstiger!
OCZ Trion 100 im Test
Macht sie günstiger!
  1. PM863 Samsung packt knapp 4 TByte in ein flaches Gehäuse
  2. 850 Evo und Pro Samsung veröffentlicht erste Consumer-SSDs mit 2 TByte
  3. TLC-Flash Samsung plant SSDs mit 2 und 4 TByte

  1. sony Kameras

    arknius | 20:11

  2. Re: Deshalb schau ich BBC

    MrAnderson | 20:10

  3. Re: Schoenen Faschostaat habt ihr da...

    kim3000 | 20:09

  4. Re: Wo bleibt der Aufschrei der Medien?

    ip_toux | 20:08

  5. Re: Sinn?

    Clarissa1986 | 20:07


  1. 17:25

  2. 17:08

  3. 14:58

  4. 14:44

  5. 13:07

  6. 12:48

  7. 12:11

  8. 12:05


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel