Strategiewetten und Erkenntnisse aus Phase 3

Wette 1: Aufbau eines neuen Produkteinstiegspunktes mit Refaktorierung bestehender Architektur oder Aufbau eines völlig neuen, isolierten Produkts. In Bezug auf die analytische Verarbeitung beschlossen wir, eine neue Plattform auf der ursprünglichen Architektur aufzubauen, um die komplette Leistung der Streamverarbeitung mit Apache Flink zu nutzen.

Wir würden ein völlig neues internes Kundensegment aufbauen, sahen aber den richtigen Zeitpunkt gekommen, die Architektur zu refaktorieren, um redundante Investitionen (zwischen den Plattformen Keystone und Flink) zu minimieren. Die niedrigere Flink-Plattform unterstützt sowohl Keystone- als auch benutzerdefinierte Anwendungsfälle in dieser neuen Architektur.

  • Verschieben der Daten vom Rand zum Data Warehouse (Bild: Zhenzhong Xu)
  • Fehleranfällige Architektur mit Batch-Pipeline vor der Migration (Bild: Zhenzhong Xu)
  • Keystone-Streamingarchitektur nach der Migration (Bild: Zhenzhong Xu)
  • So unterstützt die Streamverarbeitung den Umgang mit operativen und analytischen Daten. (Bild: Zhenzhong Xu)
  • Trennung der Bedenken für unterschiedliche Szenarien bei der Streamverarbeitung (Bild: Zhenzhong Xu)
  • Diagramm zur sich entwickelnden Keystone-Architektur, circa 2016. Keystone enthält Kafka- und Flink-Engines als Kernkomponenten. Weitere Details zum technischen Design finden sich in Blogposts mit dem Schwerpunkt Kafka und Flink. (Bild: Zhenzhong Xu)
  • Keystone-UI zeigt eine Drag-and-Drop-Erfahrung im Self-Service, die von einer voll verwalteten Streamingarchitektur mit mehreren Mandanten gestützt wird. (Bild: Zhenzhong Xu)
  • A/B-Test zur Auswahl der besten künstlerischen Darstellung für die Personalisierung (Bild: Netflix)
  • Architektur mit Abtrennung der Flink-Plattform als separatem Produkteinstiegspunkt (Bild: Zhenzhong Xu)
  • Abstimmung der Streamverarbeitung in Netflix - 2021 (Bild: Zhenzhong Xu)
  • Optimalpunkt zwischen Einfachheit und Flexibilität (Bild: Zhenzhong Xu)
Architektur mit Abtrennung der Flink-Plattform als separatem Produkteinstiegspunkt (Bild: Zhenzhong Xu)

Wette 2: Erstes Streaming mit Anwendungsfällen für ETL und Beobachtbarkeit oder gleichzeitige Behandlung aller benutzerdefinierten Anwendungsfälle. Es gab viele Möglichkeiten, doch wir beschlossen, uns auf der analytischen Seite auf das Streaming von ETL-Anwendungsfällen und auf der operativen Seite auf Anwendungsfälle mit Beobachtbarkeit in Echtzeit zu konzentrieren.

Diese Anwendungsfälle stellen uns durch ihre Komplexität und ihren Umfang vor die größten Herausforderungen. Da wir die Leistung der Streamverarbeitung komplett abrufen wollten, hielten wir es für sinnvoll, zuerst die schwierigsten Fälle anzugehen und daraus zu lernen.

Wette 3: Anfängliches Teilen der operativen Verantwortung mit den Kunden und gemeinsame Innovationsschritte, um die langfristige Belastung zu verringern. Wir hatten das große Glück, dass unsere Early Adopters relativ anspruchslos waren. Außerdem boten wir den Kunden, die Schwierigkeiten hatten, umfassende Unterstützung an. Schrittweise erweiterten wir die operativen Investitionen, beispielsweise die automatische Skalierung, verwaltete Deployments, intelligente Warnungen, Hinterfüllmöglichkeiten und vieles mehr.

Erkenntnisse aus Phase 3

Erkenntnis 1: Ein neuer Produkteinstiegspunkt zur Unterstützung neuer benutzerdefinierter Anwendungsfälle ist ein wichtiger Entwicklungsschritt. Er bietet zudem die Möglichkeit einer Neugestaltung oder Refaktorierung der Architektur und der Anpassung an die bestehende Produktlandschaft. Man sollte sich nicht dazu verleiten lassen, ein komplett neues System aufzubauen. Ein zweites System muss vermieden werden.

Erkenntnis 2: Einfachheit ist in 80 Prozent der Anwendungsfälle attraktiv. Flexibilität ist für die größeren Anwendungsfälle hilfreich. Im Rückblick sind das Beobachtungen aus den tatsächlichen Kundensegmenten der vergangenen Jahre. Was ich damit sagen will, ist, dass die Priorisierung zwischen der Unterstützung der Mehrheit oder den Anwendungsfällen mit größerer Auswirkung von der jeweiligen Situation abhängt. Für beide Seiten gibt es gute Argumente, aber die Begründung sollte zum jeweiligen Geschäftsszenario passen.

Einfachheit und Flexibilität sind NICHT die beiden entgegengesetzten Enden des Spektrums, sondern eher eine in sich geschlossene Feedbackschleife für Innovationen. Flexibilität sorgt für neue, gemeinsame Innovationen mit einer kleinen Kundengruppe. Anfangs sind diese Innovationen vielleicht etwas teurer, aber wenn sie sich erstmal bewährt haben, kann dieser Mehrwert auch monetarisiert werden und die vereinfachte Erfahrung als Standard genutzt werden. Da die Innovationen auch zu höheren Kundenzahlen führen, fragt vielleicht erneut eine Gruppe neuer Nutzer nach der Flexibilität.

Erkenntnis 3: Gute Behandlung von Early Adoptern. Sie sind die treuesten Kunden und übernehmen kostenlos das Marketing. Dank der Unterstützung seitens unserer Early Adopter sind unsere Anwendungsfälle in dieser Phase in die Tausende gegangen.

Erkenntnis 4: Wenn etwas kaputt geht: keine Panik. Man sollte den Menschen in seinem Umfeld vertrauen. Ein Bonuspunkt ist eine bereits bestehende Community, die das Produkt unterstützt. Ich erinnere mich an eine Zeit, in der sich die gesamte Plattform nach und nach verschlechterte.

Jeden Tag kamen Unmengen von Seiten dazu, und wir schafften es zwei Wochen lang nicht, die Ursache zu finden. Das war erschreckend, dem Team ging es schlecht und die Kunden hatten zu leiden. Aber dem Team gelang es, über die Teamgrenzen hinweg zusammenzuarbeiten, Menschen mit den richtigen Fachkenntnissen einzubeziehen und anhand von Daten die Symptome logisch zu untersuchen.

Schließlich fanden wir einen Fehler im Linux-Kernel, der zu einem allmählichen Speicherleck beim Streaming-Workload führte. Wir mussten allen beteiligten Mitarbeitern vertrauen, auch wenn wir nicht alle über die entsprechenden Kompetenzen verfügten.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 Phase 3: Skalierung von Tausenden von AnwendungsfällenPhase 4: Erweiterte Zuständigkeiten bei der Streamverarbeitung 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7. 6
  8. 7
  9. 8
  10. 9
  11. 10
  12. 11
  13.  


Aktuell auf der Startseite von Golem.de
Street View in Deutschland
Google entfernt die Möglichkeit zur Zeitreise

Mit der überfälligen Aktualisierung verliert Street View auch das alte Bildmaterial - und das hat nicht nur mit Datenschutz zu tun.
Von Daniel Ziegener

Street View in Deutschland: Google entfernt die Möglichkeit zur Zeitreise
Artikel
  1. Wissenschaft: In Energydrinks enthaltenes Taurin könnte Leben verlängern
    Wissenschaft
    In Energydrinks enthaltenes Taurin könnte Leben verlängern

    Wissenschaftler haben Anzeichen dafür entdeckt, dass Taurin die Gesundheit verbessern und das Leben verlängern könnte. Mehr Energydrinks sollte man aber nicht trinken.

  2. Tesla Files: Cybertruck ist undicht, laut und bremst schlecht
    Tesla Files
    Cybertruck ist undicht, laut und bremst schlecht

    Internen Dokumenten zufolge steht Teslas Pick-up-Truck vor großen Problemen. Der Cybertruck befinde sich in der Alpha-Phase.

  3. Einführung in Plotly: Damit die Daten Sinn ergeben
    Einführung in Plotly
    Damit die Daten Sinn ergeben

    Interaktive Plots mit Plotly zu erstellen, ist nicht schwer - und sehr nützlich. In einer zweiteiligen Reihe zeigen wir Schritt für Schritt, wie es funktioniert.
    Eine Anleitung von Antony Ghiroz

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • XXL-Sale bei Alternate (u. a. Samsung 970 EVO Plus 2 TB 84,90€) • MindStar: Palit RTX 4070 Ti GameRock OC 859€, be quiet! Pure Base 500 59€ • Thermaltake Toughliquid Ultra 240 145,89€ • PS5-Spiele & Zubehör bis -75% • Chromebooks bis -32% • NBB: Gaming-Produkte bis -50% [Werbung]
    •  /