Atlassian: Jira und Confluence haben seit fast einer Woche Probleme

Das Administrationsteam von Atlassian arbeitet seit mehreren Tagen an Problemen, die einige Produkte plagen. Kunden weltweit können teilweise nicht auf Dienste wie Jira, Confluence und Opsgenie zugreifen. Folglich werden auf der offiziellen Statusseite des Unternehmens(öffnet im neuen Fenster) viele Dienste derzeit mit einer Fehlerwarnung angezeigt, darunter auch das Portal Atlassian Developers, auf dem es einige Marktplatz-Einschränkungen gibt.
"Ein dediziertes Team arbeitet weiterhin rund um die Uhr daran, die Wiederherstellung des Dienstes zu beschleunigen. Die Wiederherstellung aller Kunden bleibt unsere oberste Priorität" , heißt es auf der Jira-Statusseite. Eine identische Nachricht wird auf der Statusseite von Confluence angezeigt. Seit dem 5. April 2022 wird versucht, das Problem zu beheben. Dieses äußerte sich anfangs durch den Ausfall mehrerer Cloud-Instanzen, die fälschlicherweise die Nachricht "wird gewartet" ausgaben und nicht mehr reagierten.
Ein kaputtes Script nimmt Dienste offline
Offensichtlich ist ein Routine-Wartungs-Script am Ausfall schuld, das Atlassian selbst ausgeführt hat. Es schaltete einige Standorte im Unternehmen ab und Instanzen waren plötzlich nicht mehr erreichbar. Seitdem arbeitet das Admin-Team daran, die betroffenen Systeme wieder herzustellen. Der Hersteller erwartet nicht, dass es zu Datenverlust kommt. Das wird laut dem Magazin Bleeping Computer(öffnet im neuen Fenster) betroffenen Kunden zumindest schriftlich per E-Mail versichert. Demnach ist der Ausfall auch kein Resultat einer Cyberattacke, sondern im Prinzip eigenverschuldet.
Einige Kunden verwenden Atlassian-Produkte für die tägliche Arbeit und können seit fast einer Woche kaum richtig arbeiten. "Zwölf Stunden sind nun vergangen, seitdem wir die Tools verloren haben, auf die wir uns täglich verlassen und die Entwicklungsarbeit ist fast komplett zum Erliegen gekommen." , schreibt ein Kunde kurz nach dem Ausfall auf Twitter(öffnet im neuen Fenster) . "Ich habe noch nie in meinem Leben einen so schrecklich und schlecht gehandhabten Ausfall gesehen" , schreibt ein weiterer Kunde(öffnet im neuen Fenster) .
Nachtrag vom 12. April 2022, 12:21 Uhr
Atlassian hat eine öffentliche Stellungnahme herausgegeben. Wir haben sie auf Deutsch übersetzt:
"Wir wissen, dass dieser Ausfall inakzeptabel ist, und wir setzen uns voll und ganz dafür ein, ihn zu beheben. Unsere globalen Teams arbeiten rund um die Uhr daran, eine vollständige und sichere Wiederherstellung für unsere 400 betroffenen Kunden zu erreichen, und sie machen weiterhin Fortschritte."
"Derzeit haben wir die Funktionalität für über 35 Prozent der Benutzer, die von dem Dienstausfall betroffen sind, wiederhergestellt. Wir wissen, dass wir unsere Kunden gerade jetzt enttäuschen, und wir tun alles in unserer Macht Stehende, um das in Zukunft zu verhindern."
"Dieser Vorfall war nicht das Ergebnis eines Cyberangriffs und es gab keinen unbefugten Zugriff auf Kundendaten. Im Rahmen der planmäßigen Wartung ausgewählter Cloud-Produkte hat unser Team ein Script ausgeführt, um Legacy-Daten zu löschen. Diese Daten stammten von einem veralteten Dienst, der in den Kerndatenspeicher unserer Produkte verschoben wurde."
"Anstatt die Legacy-Daten zu löschen, löschte das Script fälschlicherweise Sites und alle zugehörigen Produkte für diese Sites, einschließlich verbundener Produkte, Benutzer und Anwendungen von Drittanbietern. Wir führen umfangreiche Sicherungen und Wiederherstellungen durch, und es wurde kein Datenverlust von Kunden gemeldet, deren Zugang bis jetzt wiederhergestellt wurde."



