Vom Erfolg bedroht: Der Kampf ums technische Überleben

Nashville im Oktober 2012. Spätsommer in der Hauptstadt des US-Bundesstaates Tennessee und Football-Saison. Die Cheerleader an einer Highschool in dem Ort feuern ihre Mannschaft an. Die Fans jubeln auf den Tribünen. Mit ihren Smartphones machen sie Fotos vom Spiel und von den tanzenden Mädchen. Ein Fan lädt seine Bilder zu einem Fotosharing-Dienst hoch, den dort kaum jemand kennt: EyeEm. Den Link schickt er per Twitter an seine Freunde. Die laden sich die App herunter und eigene Fotos hoch. Mehr Links werden geteilt. Tennessee ist im Fotosharing-Rausch.

So ungefähr muss es gewesen sein an dem Tag im Oktober 2012, als im fast achttausend Kilometer entfernten EyeEm(öffnet im neuen Fenster) -Büro in Berlin ein ungewöhnlich "hoher Traffic registriert" wurde, wie Startup-Mitbegründer Ramzi Rizk es nennt. Der gebürtige Libanese benutzt Wörter wie "krass" und "big" , wenn er über die Nashville-Zeit redet, "zehn, elf schlaflose Tage und Nächte" , in denen sein Team alles tat, "um zu überleben" .
Damals deutete sich zum ersten Mal an, was passiert, wenn sich über Nacht und unvorhersehbar der Erfolg einstellt – in seiner Plötzlichkeit gefährlich wie eine Naturkatastrophe. Aus dem 2011 von Rizk und Florian Meissner, Lorenz Aschoff und Gen Sadakane gegründeten Startup wurde ein international bekanntes Unternehmen. Nashville war nur der Anfang.
Nach Nashville ist vor Instagram
Vorweihnachtszeit. Rizk sitzt im Berliner Büro. Die Feiertage will er bei seiner Familie im Libanon verbringen. Dass Konkurrent Instagram eine Änderung seiner Datenschutzrichtlinien angekündigt hat – eine Randnotiz. Mit Instagram, das von Facebook gekauft wurde, will sich EyeEm nicht vergleichen.
Dass EyeEm von den geänderten Instagram-Datenschutzrichtlinien profitieren wird, ahnt Rizk nicht. Auch einen Tag später, als die Nutzerzahlen hochschnellen, sehen die Entwickler nicht den Zusammenhang. Rizk erinnert sich: An dem Tag "habe ich eine Mail bekommen von Gen, von einem meiner Mitbegründer. Und er meinte: 'Nashville schon wieder?' Wir gucken auf den Server und merken, okay, da passiert irgendwas, aber das ist ein bisschen krasser als Nashville."
Den Instagram-Mitgliedern passen die Neuerungen des Fotosharing-Dienstes nicht. Sie lesen heraus, dass das Unternehmen ihre Bilder verkaufen wolle. Erst jetzt wird dem EyeEm-Team der Zusammenhang bewusst. "Die haben sich dann gesagt, okay, wenn ich das sehe, dann will ich nicht mehr bei Instagram sein" , sagt Rizk.
Der Nutzerandrang kommt wieder aus den USA. Wenn Nashville eine Flutwelle war, dann handelte es sich jetzt um einen mittleren Tsunami, "eine Riesenwelle" , wie Rizk sagt.
Zu frühe Optimierung ist die Wurzel allen Übels
Das Mantra der EyeEm-Entwickler und eine goldene Regel aller Startups wird dem Team fast zum Verhängnis: "Premature optimization is the root of all evil." Zu frühe Optimierung ist die Wurzel allen Übels. Ein Satz, der vom US-Informatiker Donald E. Knuth(öffnet im neuen Fenster) stammt.
Immerhin ist die Serverarchitektur bei EyeEm trotzdem skalierbar ausgelegt, um kleine Wellen wie die von Nashville meistern zu können. Man kann nie wissen. Es gab schließlich in der Vergangenheit immer mal wieder kleine oder größere Peaks. Aber das Zehnfache an Traffic?
Das Team teilt sich über die Feiertage auf. "Wir haben alle in Schichten gearbeitet" , sagt Rizk. Lead-Backend-Entwickler François Hodierne sitzt Heiligabend bis fünf Uhr morgens am Rechner. Stephanie Leong beantwortet rund um die Uhr Supportanfragen.
Das Startup-Geschäft kennt keine Feiertage
Rizk selbst fliegt zwar wie geplant nach Hause in den Libanon, sitzt aber dort Tag und Nacht am Computer. Die Server müssen mitmachen. Ständig der prüfende Blick auf Monit(öffnet im neuen Fenster) , "ob alles gesund ist und läuft." Das Startup-Geschäft kennt keine Feiertage. Die Server hoffentlich auch nicht.
EyeEm hostet bei Amazon. Dessen Cloud-Dienste sind bei Startups beliebt. Denn Amazon Web Services rechnet nach Nutzung ab und erlaubt es, auch kurzfristig neue Server hochzufahren oder abzuschalten, ohne den Support kontaktieren zu müssen. Wie geschaffen für EyeEm in diesen Tagen.
Fast zwei Wochen tost der Erfolg. Vorher waren es drei Server, jetzt sind zehn im Einsatz. Einige hochgefahren mit den Smartphones der EyeEm-Gründer. Kleinere Dienste werden abgestellt. Kapazitäten müssen eingespart werden. Auf seinem Blog entschuldigt sich das Team(öffnet im neuen Fenster) für kurzzeitige Serverausfälle. "Das war ziemlich anstrengend" , sagt Rizk, "wir waren aber gut genug positioniert, so dass wir diese Welle überlebt haben." Doch die nächste wird noch höher.
Nach Instagram ist vor Texas
Zum Jahreswechsel ist das EyeEm-Team wieder in Berlin. Strategien und Ideen werden besprochen, wie ein neuer plötzlicher Nutzerandrang bewältigt werden kann. "Wir wollten schauen, was wir anpassen müssen an unsere Architektur."
Dazu müssen Daten analysiert werden. Das macht EyeEm unter anderem mit dem Business Intelligence Tool Pentaho(öffnet im neuen Fenster) , das auch von Spielefirmen wie Travian Games benutzt wird, um große Datenmengen zu bewerten.
Aber dem Team bleibt kaum Zeit, um die Daten in Ruhe auszuwerten. "Zehn Tage später, wir waren gerade an dem Punkt, an dem wir die ganzen Architekturfragen angefangen haben zu lösen, ging es wieder los" , erinnert sich Rizk.
Vierzigmal mehr Traffic als im Dezember. Wieder kommen die meisten Nutzer aus den USA. Diesmal fängt es in einer Kleinstadt in Texas an, in der Nähe von Houston. Mehrere Studenten melden sich dort bei EyeEm an, laden ihre Fotos hoch und verbreiten die Links auf Facebook und Twitter.
EyeEm überholt Instagram
"Wir waren auf einmal bei Twitter in den Trending Topics in den USA" , sagt Rizk und wundert sich immer noch über den Erfolg. "Das hat dazu geführt, dass wieder andere Leute von uns erfahren haben." Ein Selbstläufer. Immer mehr Nutzer laden die App herunter, melden sich an und teilen ihre Fotos – die Zahlen behält EyeEm allerdings für sich. EyeEm überholt in Apples App Store den Konkurrenten Instagram .
Jetzt fangen größere Medien an, über das Startup aus Berlin zu berichten. Weltweit laden Nutzer die App herunter. In Japan, Brasilien, Indonesien, Singapur, England, Frankreich und Spanien. Auch in Deutschland.
Den meisten Traffic gibt es am späten Nachmittag. "Dann, wenn die Leute in Europa Feierabend haben und nach Hause gehen und die Menschen in den USA aufwachen" , sagt Rizk. Morgens gegen acht Uhr sinken die Zugriffe. Diese Ruhepausen halten etwa bis halb zehn an.
Die Zeit nutzt das Team, um weiter an der Serverarchitektur zu arbeiten. Wieder schlaflose Nächte. Diesmal ist Rizk aber in Berlin. Von hier aus kann er alles leichter koordinieren und Aufgaben erledigen, die EyeEm so vorher noch nie bewältigen musste.
Die Server werden an Knuth angepasst
Erst Wochen später kehrt wieder so etwas wie Normalität ein. Langsam realisiert das Team, was in den vergangenen Wochen und Monaten geschehen ist. Erfolg? Naja. Davon wollen Rizk und seine Kollegen erst sprechen, wenn sich ihr Startup dauerhaft behauptet, gleichmäßig wächst. In der Zwischenzeit versuchen sie nun doch, sich auf neue Wellen vorzubereiten – obwohl sie an Knuths Aussage mit der zu frühen Optimierung festhalten wollen.
Endlich haben sie Zeit, sich in Ruhe um die Architektur zu kümmern. Sie entscheiden sich für eine dynamische Struktur. "Unsere Architektur ist ein Cluster aus mindestens vier Servern. Wenn die Last steigt, dann kommen mehr dazu" , erklärt Rizk. Das passiert automatisch. Und das mittlerweile 15-köpfige Team kann sich mit der Weiterentwicklung des Fotosharing-Dienstes beschäftigen – für iOS, Android und Windows Phone.
"Im Prinzip sind wir bereit für die nächste Welle und könnten locker mit fünfzigmal mehr Traffic umgehen" , sagt Rizk. "Nur wenn mal ein Server nicht performt und es nicht automatisch durch die Infrastruktur behoben wird, müssen wir manuell zugreifen."
Jetzt werden "Prozesse formalisiert" , wie Rizk es nennt. Von RTO (Recovery Time Objective) und RPO (Recovery Point Objective) ist die Rede, davon, "Ziele zu definieren" , um "Game Days" vorzubereiten. "Disaster Recovery" -Szenarien werden simuliert. Startup-Sprech. Rizk ist in seinem Element. Der Stress der vergangenen Monate ist abgefallen.
In Nashville beginnt bald wieder die Football-Saison.



