Vertrauen in die Cloud: Atlassian und Hetzner zeigen, wie es nicht geht

Die Cloud ist wohl doch nicht so ausfallsicher, wie Unternehmen gern suggerieren. Das zeigen Atlassian und Hetzner eindrucksvoll.

Ein IMHO von veröffentlicht am
Alles wird gut: Bei Atlassian und Hetzner kommt es nur gerade zu Problemen.
Alles wird gut: Bei Atlassian und Hetzner kommt es nur gerade zu Problemen. (Bild: Pixabay.com/Montage: Golem.de/Pixabay License)

Viele Unternehmen verkaufen ihre Cloud-Angebote als möglichst hochverfügbare und ausfallsichere Plattformen. Dabei müssen Kunden nicht einmal ihre eigene Hardware betreiben und können die Verantwortung bei Dritten abgeben. In der Theorie ist das verlockend und auch in der Praxis läuft es meist rund.

Inhalt:
  1. Vertrauen in die Cloud: Atlassian und Hetzner zeigen, wie es nicht geht
  2. Ein wichtiger Schritt ist es, eigene Fehler einzugestehen

Allerdings zeigen aktuelle Vorfälle beim Hoster Hetzner Cloud und dem Softwareunternehmen Atlassian, wie schnell das blinde Vertrauen bestraft werden kann.

Mitte April 2022 meldeten mehrere Kunden von Atlassian, dass sie auf Programme wie Jira und Confluence nicht mehr zugreifen könnten. Das bestätigte das Unternehmen auch in einer offiziellen E-Mail an die Betroffenen. Durch interne Fehlkommunikation und ein schlecht verfasstes Skript können viele der Kunden noch immer nicht richtig arbeiten.

Entwickler können nicht arbeiten

Gerade Jira wird in der täglichen Arbeit von Entwicklerteams als Organisationstool eingesetzt. Kunden vertrauen also auf die Cloud-basierte Software im Unternehmen. Teilweise haben sie auch keine andere Wahl: Seit Februar 2021 werden keine Lizenzen mehr für On-Premises-Server verkauft. Die Cloud ist für Atlassian und Kunden der zwangsläufige Weg in die Zukunft.

Stellenmarkt
  1. IT-Projektkoordinatoren und Prozessbegleiter (m/w/d)
    Schottener Soziale Dienste gemeinnützige GmbH, Schotten, remote
  2. Mitarbeiter (m/w/d) IT-Support
    Otto Krahn Group GmbH, Hamburg
Detailsuche

Sicher ist das für Atlassian auch eine Geldfrage. Cloud-Lizenzen und damit zusammenhängende Serviceangebote bringen auf lange Sicht mehr Umsatz ein. Gleichzeitig kann am Servicepersonal gespart werden, da eine zentrale Verwaltung aller Instanzen und die Auslagerung in die AWS-Cloud weniger aufwendig ist.

Offensichtlich hat die Firma an der falschen Stelle gespart. Wie CTO Sri Viswanath bestätigte, kam es in gleich zwei Situationen zu Problemen: Um Zeit zu sparen, wurde ein offensichtlich ungeeignetes Automatisierungsskript verwendet, das durch seine Löschfunktion sehr viel Schaden anrichten kann. Bereits hier hätten mehrere Ebenen prüfen müssen, ob wirklich der richtige Schritt durchgeführt wurde.

Kommunikation ist der Schlüssel

Dazu kommt, dass sich zwei am Prozess beteiligte Arbeitsgruppen schlecht abgesprochen haben. Normalerweise hat dies mehrere Gründe, die auch kombiniert auftreten können: Die Teams haben aus Zeit- und damit Kostengründen zu hastig agiert oder Kommunikationswege sind intransparent oder komplex. Die Teams könnten zudem die Auswirkungen ihrer Arbeit auf aktive Kundenplattformen unterschätzt haben. Zudem könnten bei der Arbeit einmal mehr Kontrollinstanzen fehlen, die sich den Prozess noch einmal genau anschauen.

Wenn ein Unternehmen die Kundschaft zu einem Wechsel in die Cloud-Infrastruktur zwingt, sollte davon ausgegangen werden, dass so etwas nicht vorkommt. Wenn es doch passiert, was natürlich nie ausgeschlossen werden kann, sollten Kunden nicht drei Wochen lang auf eine Lösung warten müssen. CTO Viswanath sagte selbst, dass bisher noch kein automatisierter und schneller Prozess für diesen Fall im Unternehmen existiere.

Bei Hetzner ist es etwas anders: Durch den aktuellen Vorfall sind lediglich Snapshots existierender Daten betroffen, also im Prinzip die Wiederherstellungspunkte vergangener Zustände. Daher kam es nicht zum unmittelbaren Datenverlust und Kunden können teilweise aufatmen.

Western Digital 18TB Elements Desktop externe Festplatte USB3.0 - WDBWLG0180HBK-EESN

Wenn Geld sparen nach hinten losgeht

Auch hier liegt es größtenteils an Geldeinsparungen, dass so etwas überhaupt vorkommt. Snapshots auf nur einer Ebene am gleichen Standort abzulegen, ist ein kalkulierter Risikofaktor. Nach Unternehmensangaben durften zudem nur zwei Festplatten gleichzeitig ausfallen. Je nach Anzahl der genutzten Laufwerke im durch Erasure Coding geschützten Cluster kann das sehr wenig sein. Nun ist also der Worst Case eingetroffen und 1.500 Snapshots wurden irreparabel zerstört.

Zusätzliche Replikas der Backups an anderen Orten kosten eben Ressourcen - und die konnte oder wollte Hetzner nicht in die eigene Infrastruktur investieren. Schließlich geht das Unternehmen durch relativ günstige Abopreise auf Kundensuche.

Wie die Golem.de-Community bereits richtig festgestellt hat, kann dann nicht allzu viel von der Datensicherheit erwartet werden. Zudem ersetzen einmalige Snapshots keine richtige Backup-Strategie mit mehreren Rückfallebenen.

Trotzdem: Weniger versierte Menschen erwarten von einem Cloud-System in jedem Fall Zuverlässigkeit und Sicherheit, ohne sich über die Funktionsweise Gedanken machen zu müssen. Dieses Vertrauen wurde klar gebrochen.

Wenigstens sind sowohl Atlassian als auch Hetzner transparent und ehrlich.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
Ein wichtiger Schritt ist es, eigene Fehler einzugestehen 
  1. 1
  2. 2
  3.  


godmode 19. Apr 2022

Das sehe ich aehnlich. Ich finde wenn ein (praktischer) cloud-only Anbieter wie Atlassian...

lunarix 19. Apr 2022

Ich nutze das Cloud-Angebot ganz gern. Aber Snapshots verwende ich für das, wofür sie...

amagol 18. Apr 2022

Du glaubst also, dass eine Firma mit ein paar IT-Fachleuten eine Loesung hinbekommt die...

Doener 18. Apr 2022

Du kannst in confluence jeden space einzeln als xml exportieren. Von Cloud zu Cloud hat...



Aktuell auf der Startseite von Golem.de
Krieg der Steine
Kopierte Lego-Mini-Figuren dürfen nicht verkauft werden

Lego hat einen Rechtsstreit um Mini-Figuren gegen einen Spielwarenhändler gewonnen, der Figuren aus China verkauft hat.

Krieg der Steine: Kopierte Lego-Mini-Figuren dürfen nicht verkauft werden
Artikel
  1. Smartphones: Xiaomis neues Foldable ist wesentlich günstiger
    Smartphones
    Xiaomis neues Foldable ist wesentlich günstiger

    Das Xiaomi Mix Fold 2 ähnelt dem Samsung Galaxy Fold 4. Es ist ähnlich gut ausgestattet, kostet aber wesentlich weniger Geld.

  2. USA: Tesla stoppt Bestellungen für das Model 3 Long Range
    USA
    Tesla stoppt Bestellungen für das Model 3 Long Range

    In den USA und Kanada übersteigt die Nachfrage nach dem Tesla Model 3 LR das Angebot, so dass Tesla erstmal keine Bestellungen mehr annimmt.

  3. Web Components mit StencilJS: Mehr Klarheit im Frontend
    Web Components mit StencilJS
    Mehr Klarheit im Frontend

    Je mehr UI/UX in Anwendungen vorkommt, desto mehr Unordnung gibt es im Frontend. StencilJS zeigt, wie man verschiedene Frameworks mit Web Components zusammenbringt.
    Eine Anleitung von Martin Reinhardt

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • BenQ Mobiuz EX3410R 499€ • HyperX Cloud Flight heute für 44€ • MindStar (u. a. AMD Ryzen 5 5600X 169€, Intel Core i5-12400F 179€ und GIGABYTE RTX 3070 Ti Master 8G 699€ + 20€ Cashback) • Weekend Sale bei Alternate (u. a. AKRacing Master PRO für 353,99€) [Werbung]
    •  /