Phase 2: Skalierung für Hunderte von Anwendungsfällen

Nach der Bereitstellung des ersten Keystone-MVP und der Migration einiger interner Kunden haben wir nach und nach an Zutrauen gewonnen. Außerdem verbreiteten sich die Neuigkeiten an andere Entwicklerteams. Das Streaming bei Netflix gewann an Dynamik, da es inzwischen ganz leicht ist, Protokolle für die analytische Verarbeitung zu verschieben und operative Informationen nach Bedarf abzurufen.

Jetzt war die Zeit für eine Skalierung auf die allgemeinen Kunden gekommen.

  • Verschieben der Daten vom Rand zum Data Warehouse (Bild: Zhenzhong Xu)
  • Fehleranfällige Architektur mit Batch-Pipeline vor der Migration (Bild: Zhenzhong Xu)
  • Keystone-Streamingarchitektur nach der Migration (Bild: Zhenzhong Xu)
  • So unterstützt die Streamverarbeitung den Umgang mit operativen und analytischen Daten. (Bild: Zhenzhong Xu)
  • Trennung der Bedenken für unterschiedliche Szenarien bei der Streamverarbeitung (Bild: Zhenzhong Xu)
  • Diagramm zur sich entwickelnden Keystone-Architektur, circa 2016. Keystone enthält Kafka- und Flink-Engines als Kernkomponenten. Weitere Details zum technischen Design finden sich in Blogposts mit dem Schwerpunkt Kafka und Flink. (Bild: Zhenzhong Xu)
  • Keystone-UI zeigt eine Drag-and-Drop-Erfahrung im Self-Service, die von einer voll verwalteten Streamingarchitektur mit mehreren Mandanten gestützt wird. (Bild: Zhenzhong Xu)
  • A/B-Test zur Auswahl der besten künstlerischen Darstellung für die Personalisierung (Bild: Netflix)
  • Architektur mit Abtrennung der Flink-Plattform als separatem Produkteinstiegspunkt (Bild: Zhenzhong Xu)
  • Abstimmung der Streamverarbeitung in Netflix - 2021 (Bild: Zhenzhong Xu)
  • Optimalpunkt zwischen Einfachheit und Flexibilität (Bild: Zhenzhong Xu)
Diagramm zur sich entwickelnden Keystone-Architektur, circa 2016. Keystone enthält Kafka- und Flink-Engines als Kernkomponenten. Weitere Details zum technischen Design finden sich in Blogposts mit dem Schwerpunkt Kafka und Flink. (Bild: Zhenzhong Xu)

Herausforderungen in Phase 2

Herausforderung 1: Erhöhte operative Last. Anfangs boten wir unseren Neukunden einen umfassenden Einführungsservice. Das ließ sich mit wachsender Nachfrage allerdings nicht lange durchhalten. Wir mussten anfangen, das MVP weiterzuentwickeln, um mehr als nur ein Dutzend Kunden zu unterstützen.

In der Folge mussten wir einige Komponenten umbauen. Beispielsweise war die Zeit gekommen, uns von reinen Tabellen zu einer ordentlichen Steuerungsplattform mit Datenbank im Hintergrund zu entwickeln.

Herausforderung 2: Unterschiedliche Bedürfnisse. Als die Kundenanfragen zunahmen, standen wir vor immer vielfältigeren Bedürfnissen. Diese lassen sich in zwei wichtige Kategorien unterteilen: Eine Gruppe bevorzugte einen voll verwalteten Service mit einfacher Nutzung. Die andere Gruppe bevorzugte Flexibilität und benötigte komplexe Rechenfähigkeiten, um umfangreichere geschäftliche Probleme zu lösen. Für sie war es völlig in Ordnung, Pager zu nutzen und Teile der Infrastruktur selbst zu verwalten. Aber wir können nicht beides gleichzeitig gut machen.

Herausforderung 3: Alles, was wir anfassten, ging kaputt. Ganz im Ernst: Aufgrund der Skalierung haben wir alle unsere abhängigen Services irgendwann kaputt gemacht. Wir haben einmal AWS S3 kaputt gemacht. Wie haben viele Bugs in Kafka und Flink gefunden. Wir haben Titus (die verwaltete Containerinfrastruktur) mehrmals kaputt gemacht und sind auf merkwürdige Probleme mit der CPU-Isolierung und Netzwerken gestoßen. Wir haben Spinnaker (die Plattform für das kontinuierliche Deployment) kaputt gemacht, als wir Hunderte von Kunden-Deployments automatisch gestartet haben.

Zum Glück waren diese Teams hervorragend. Sie haben mit uns gemeinsam diese Probleme nach und nach behoben. Diese Anstrengungen tragen entscheidend zur Reifung der gesamten Streaminglandschaft bei.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed

Zusammenfassung zu Streamverarbeitungsmustern in Phase 2

MusterProduktAnwendungsfälle
DatenroutingKeystoneProtokollierung, Datenbewegung (+ skaliert)
Echtzeit-Datenstichproben / EntdeckungMantisKostengünstige Echtzeitinformationen
Echtzeitwarnungen / DashboardMantis, KafkaSPS-Warnung,
+ Infrastrukturzustand-Überwachung (Cassandra & Elasticsearch),
+ Echtzeit-QoE-Überwachung
Streamverarbeitungsmuster in Phase 2
 Strategiewetten in Phase 1Strategiewetten und Erkenntnisse in Phase 2 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7. 6
  8. 7
  9. 8
  10. 9
  11. 10
  12. 11
  13.  


Aktuell auf der Startseite von Golem.de
Whistleblower
Ehemaliger US-Konteradmiral äußert sich zu Außerirdischen

Wieder hat sich in den USA ein ehemals hochrangiger Militär und Beamter über Kontakte mit Aliens geäußert.

Whistleblower: Ehemaliger US-Konteradmiral äußert sich zu Außerirdischen
Artikel
  1. Schadstoffnorm 7: Neue Grenzwerte für Abrieb gelten auch für E-Autos
    Schadstoffnorm 7
    Neue Grenzwerte für Abrieb gelten auch für E-Autos

    Die neue Euronorm 7 legt nicht nur Grenzwerte für Bremsen- und Reifenabrieb fest, sondern auch Mindestanforderungen für Akkus.

  2. Ramjet: General Electric testet Hyperschalltriebwerk
    Ramjet
    General Electric testet Hyperschalltriebwerk

    Das Triebwerk soll Flüge mit Mach 5 ermöglichen.

  3. Elektroautos: Mercedes und Stellantis übernehmen komplette Umweltprämie
    Elektroautos
    Mercedes und Stellantis übernehmen komplette Umweltprämie

    Nach dem abrupten Aus der staatlichen Förderung springen erste Hersteller von Elektroautos ein.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • Last-Minute-Angebote bei Amazon • Avatar & The Crew Motorfest bis -50% • Xbox Series X 399€ • Cherry MX Board 3.0 S 49,95€ • Crucial MX500 2 TB 110,90€ • AVM FRITZ!Box 7590 AX + FRITZ!DECT 500 219€ [Werbung]
    •  /