Vertrauen in die Cloud: Atlassian und Hetzner zeigen, wie es nicht geht

Die Cloud ist wohl doch nicht so ausfallsicher, wie Unternehmen gern suggerieren. Das zeigen Atlassian und Hetzner eindrucksvoll.

Ein IMHO von veröffentlicht am
Alles wird gut: Bei Atlassian und Hetzner kommt es nur gerade zu Problemen.
Alles wird gut: Bei Atlassian und Hetzner kommt es nur gerade zu Problemen. (Bild: Pixabay.com/Montage: Golem.de/Pixabay License)

Viele Unternehmen verkaufen ihre Cloud-Angebote als möglichst hochverfügbare und ausfallsichere Plattformen. Dabei müssen Kunden nicht einmal ihre eigene Hardware betreiben und können die Verantwortung bei Dritten abgeben. In der Theorie ist das verlockend und auch in der Praxis läuft es meist rund.

Inhalt:
  1. Vertrauen in die Cloud: Atlassian und Hetzner zeigen, wie es nicht geht
  2. Ein wichtiger Schritt ist es, eigene Fehler einzugestehen

Allerdings zeigen aktuelle Vorfälle beim Hoster Hetzner Cloud und dem Softwareunternehmen Atlassian, wie schnell das blinde Vertrauen bestraft werden kann.

Mitte April 2022 meldeten mehrere Kunden von Atlassian, dass sie auf Programme wie Jira und Confluence nicht mehr zugreifen könnten. Das bestätigte das Unternehmen auch in einer offiziellen E-Mail an die Betroffenen. Durch interne Fehlkommunikation und ein schlecht verfasstes Skript können viele der Kunden noch immer nicht richtig arbeiten.

Entwickler können nicht arbeiten

Gerade Jira wird in der täglichen Arbeit von Entwicklerteams als Organisationstool eingesetzt. Kunden vertrauen also auf die Cloud-basierte Software im Unternehmen. Teilweise haben sie auch keine andere Wahl: Seit Februar 2021 werden keine Lizenzen mehr für On-Premises-Server verkauft. Die Cloud ist für Atlassian und Kunden der zwangsläufige Weg in die Zukunft.

Stellenmarkt
  1. Microsoft Powerplatform & RPA Specialist (m/w/d)
    GILDEMEISTER Beteiligungen GmbH, Bielefeld
  2. Teamleiter IT - SAP Basis (m/w/d)
    GILDEMEISTER Beteiligungen GmbH, Bielefeld, Pfronten
Detailsuche

Sicher ist das für Atlassian auch eine Geldfrage. Cloud-Lizenzen und damit zusammenhängende Serviceangebote bringen auf lange Sicht mehr Umsatz ein. Gleichzeitig kann am Servicepersonal gespart werden, da eine zentrale Verwaltung aller Instanzen und die Auslagerung in die AWS-Cloud weniger aufwendig ist.

Offensichtlich hat die Firma an der falschen Stelle gespart. Wie CTO Sri Viswanath bestätigte, kam es in gleich zwei Situationen zu Problemen: Um Zeit zu sparen, wurde ein offensichtlich ungeeignetes Automatisierungsskript verwendet, das durch seine Löschfunktion sehr viel Schaden anrichten kann. Bereits hier hätten mehrere Ebenen prüfen müssen, ob wirklich der richtige Schritt durchgeführt wurde.

Kommunikation ist der Schlüssel

Dazu kommt, dass sich zwei am Prozess beteiligte Arbeitsgruppen schlecht abgesprochen haben. Normalerweise hat dies mehrere Gründe, die auch kombiniert auftreten können: Die Teams haben aus Zeit- und damit Kostengründen zu hastig agiert oder Kommunikationswege sind intransparent oder komplex. Die Teams könnten zudem die Auswirkungen ihrer Arbeit auf aktive Kundenplattformen unterschätzt haben. Zudem könnten bei der Arbeit einmal mehr Kontrollinstanzen fehlen, die sich den Prozess noch einmal genau anschauen.

Wenn ein Unternehmen die Kundschaft zu einem Wechsel in die Cloud-Infrastruktur zwingt, sollte davon ausgegangen werden, dass so etwas nicht vorkommt. Wenn es doch passiert, was natürlich nie ausgeschlossen werden kann, sollten Kunden nicht drei Wochen lang auf eine Lösung warten müssen. CTO Viswanath sagte selbst, dass bisher noch kein automatisierter und schneller Prozess für diesen Fall im Unternehmen existiere.

Bei Hetzner ist es etwas anders: Durch den aktuellen Vorfall sind lediglich Snapshots existierender Daten betroffen, also im Prinzip die Wiederherstellungspunkte vergangener Zustände. Daher kam es nicht zum unmittelbaren Datenverlust und Kunden können teilweise aufatmen.

Western Digital 18TB Elements Desktop externe Festplatte USB3.0 - WDBWLG0180HBK-EESN

Wenn Geld sparen nach hinten losgeht

Auch hier liegt es größtenteils an Geldeinsparungen, dass so etwas überhaupt vorkommt. Snapshots auf nur einer Ebene am gleichen Standort abzulegen, ist ein kalkulierter Risikofaktor. Nach Unternehmensangaben durften zudem nur zwei Festplatten gleichzeitig ausfallen. Je nach Anzahl der genutzten Laufwerke im durch Erasure Coding geschützten Cluster kann das sehr wenig sein. Nun ist also der Worst Case eingetroffen und 1.500 Snapshots wurden irreparabel zerstört.

Zusätzliche Replikas der Backups an anderen Orten kosten eben Ressourcen - und die konnte oder wollte Hetzner nicht in die eigene Infrastruktur investieren. Schließlich geht das Unternehmen durch relativ günstige Abopreise auf Kundensuche.

Wie die Golem.de-Community bereits richtig festgestellt hat, kann dann nicht allzu viel von der Datensicherheit erwartet werden. Zudem ersetzen einmalige Snapshots keine richtige Backup-Strategie mit mehreren Rückfallebenen.

Trotzdem: Weniger versierte Menschen erwarten von einem Cloud-System in jedem Fall Zuverlässigkeit und Sicherheit, ohne sich über die Funktionsweise Gedanken machen zu müssen. Dieses Vertrauen wurde klar gebrochen.

Wenigstens sind sowohl Atlassian als auch Hetzner transparent und ehrlich.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
Ein wichtiger Schritt ist es, eigene Fehler einzugestehen 
  1. 1
  2. 2
  3.  


godmode 19. Apr 2022 / Themenstart

Das sehe ich aehnlich. Ich finde wenn ein (praktischer) cloud-only Anbieter wie Atlassian...

lunarix 19. Apr 2022 / Themenstart

Ich nutze das Cloud-Angebot ganz gern. Aber Snapshots verwende ich für das, wofür sie...

amagol 18. Apr 2022 / Themenstart

Du glaubst also, dass eine Firma mit ein paar IT-Fachleuten eine Loesung hinbekommt die...

Doener 18. Apr 2022 / Themenstart

Du kannst in confluence jeden space einzeln als xml exportieren. Von Cloud zu Cloud hat...

Kommentieren



Aktuell auf der Startseite von Golem.de
Entwickler im Ukrainekrieg
"Es ist schwierig, aber das Team unterstützt mich"

Bereits im März sprach Golem.de mit zwei IT-Fachkräften aus Kyjiw. So geht es ihnen jetzt, mehr als zwei Monate nach Beginn des Ukrainekriegs.
Ein Bericht von Daniel Ziegener

Entwickler im Ukrainekrieg: Es ist schwierig, aber das Team unterstützt mich
Artikel
  1. Raumfahrt: Starliner fliegt nach mehr als zwei Jahren zum zweiten Mal
    Raumfahrt
    Starliner fliegt nach mehr als zwei Jahren zum zweiten Mal

    Nach einem fehlgeschlagenen Testflug, klemmenden Treibstoffventilen und vielen Verzögerungen ist Boeings Starliner erfolgreich abgehoben.
    Von Frank Wunderlich-Pfeiffer

  2. Kitty Lixo: Nach Sex mit Mitarbeitern Instagram-Account zurückerhalten
    Kitty Lixo
    Nach Sex mit Mitarbeitern Instagram-Account zurückerhalten

    Laut einer Sexdarstellerin muss man nur die richtigen Leute bei Facebook sehr intim kennen, um seinen Instagram-Account immer wieder zurückzubekommen.

  3. Delfast Top 3.0: Ukrainische Armee setzt E-Motorräder zur Panzerjagd ein
    Delfast Top 3.0
    Ukrainische Armee setzt E-Motorräder zur Panzerjagd ein

    Ukrainische Infanteristen nutzen E-Motorräder, um leise und schnell zum Einsatz zu gelangen und die Panzerabwehrlenkwaffe NLAW zu transportieren.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Borderlands 3 gratis • Cyber Week: Top-Rabatte auf PC-Komponenten • Inno3D RTX 3070 günstig wie nie: 614€ • AMD Ryzen 9 5900X 398€ • Edifier Studio Lautsprecher 129€ • Kingston SSD 2TB günstig wie nie: 129,90€ • Samsung Soundbar + Subwoofer 3.1.2 günstig wie nie: 228,52€ [Werbung]
    •  /