Zeitsprung: Wie die Schaltsekunde Chaos im Internet verursachte

Die Schaltsekunde, die in der Nacht zum 1. Juli 2012 die Uhren weltweit mit der Erdrotation synchronisieren sollte, hat zahlreichen Servern Probleme bereitet und legte vorübergehend Webseiten und Datenbanken lahm.
Die Webseite Reddit berichtete von Problemen(öffnet im neuen Fenster) mit ihrer Java- und Cassandra-Infrastruktur. Auch die Server der Webseiten WDR.de, sportschau.de und WDR2.de und das Redaktionssystem des WDR waren betroffen(öffnet im neuen Fenster) .
Hadoop-Ausfall bei Mozilla
Von ähnlichen Problemen zeugt auch ein Bugzilla-Report bei Mozilla(öffnet im neuen Fenster) . Dort hängten sich Java-Applikationen wie Hadoop und Elasticsearch auf. Später berichtete der Bugzilla-Post davon, dass sämtliche JVMs (Java Virtual Machine) außer Kontrolle geraten seien. Der Befehl date; date `date +"%m%d%H%M%C%y.%S"`; date; behob das Problem ohne Server- oder JVM-Neustart. Einem weiteren Kommentar zufolge reicht der Befehl date -s "`date`" .
Das Gawker-Netzwerk, zu dem die Webseite Gizmodo gehört, verfasste selbst einen Artikel(öffnet im neuen Fenster) über den bevorstehenden Zeitsprung und war danach für etliche Minuten nicht mehr erreichbar.
Amadeus-Ausfall verursacht Flugverspätungen
Fünfzig Flüge der australischen Fluglinie Qantas mussten wegen eines Serverausfalls verschoben werden. Qantas nutzt die Reservierungssoftware des Anbieters Amadeus(öffnet im neuen Fenster) . Laut einer Qantas-Sprecherin(öffnet im neuen Fenster) war das weltweite Buchungssystem betroffen.
Was genau die Ausfälle auslöste, wird noch ermittelt, etwa ob die Java Virtual Machines, MySQL oder der Linux-Kernel der Verursacher war. Einiges deutet jedoch auf Komponenten im Linux-Betriebssystem und dessen Kernel hin.
Red Hat hat bereits einen Knowledgebase-Artikel dazu veröffentlicht(öffnet im neuen Fenster) . Demnach sind Linux-Kernel in älteren Versionen von Red Hat Enterprise Linux (RHEL) betroffen.
Linux-Kernel bei Red Hat betroffen
Unter RHEL 6 hat die Schaltsekunde einen Systemabsturz bei der Interrupt-Verwaltung NMI-Watchdog(öffnet im neuen Fenster) ausgelöst. Ein zweiter Bugzilla-Report berichtet von einer außergewöhnlich hohen CPU-Last, die durch zahlreiche Prozesse, vor allem aber durch Java-Anwendungen verursacht wird, nachdem die zusätzliche Sekunde geschaltet wurde. Hier wird explizit RHEL 6.1 erwähnt.
Tzdata-Update hilft
Der Fehler tritt bei RHEL 6 nur dann auf, wenn dort kein NTP-Daemon läuft, der die Zeit auf einem Rechner mit den Zeitservern im Internet synchronisiert. Hier sollte die Synchronisation manuell ausgeführt werden. Zusätzlich sollte das Paket Tzdata auf den aktuellen Stand gebracht werden.
Von der Schaltsekunde betroffen sind auch die Linux-Kernel in RHEL 4 und 5, die auf die Versionen 2.6.9-89.EL und 2.6.18-164.el5 aktualisiert werden sollten. Auch hier empfiehlt Red Hat, die Tzdata-Pakete zu aktualisieren. Der Fehler liegt laut Red Hat darin, dass die Linux-Kernel den Befehl zur Zeitänderung, den sie über den NTP-Daemon erhalten, als Nachricht in die Systemprotokolldatei schreiben möchten, was zum Kernel-Absturz führt.
Fehler im Linux-Kernel 3.4.4 und 3.5-rc4
Betroffen waren unter anderem die Linux-Kernel 3.4.4 und 3.5-rc4(öffnet im neuen Fenster) , die die zusätzliche Sekunde nicht verarbeiten konnten.
Erstaunlich sind die massiven Ausfälle allerdings schon, denn eigentlich sind Distributoren, Entwickler und Administratoren schon seit geraumer Zeit gewarnt. Die Schaltsekunde wird in regelmäßigen Abständen hinzugefügt. Denn Zeitmessung, die seit 1967 mit Atomuhren durchgeführt wird, und Erdrotation sind nämlich nicht ganz synchron: Die Erde dreht sich nicht gleichmäßig, die Gezeiten verlangsamen zudem die Erdrotation kontinuierlich – ein Tag ist heute also länger als einer zu Zeiten Napoleons oder des Römischen Reiches.
Zuletzt wurde die Zeit 2008 angepasst. Damals gab es keine Probleme, was einen Red-Hat-Entwickler noch im Januar 2012 veranlasste, einen Bugreport auf die Schaltsekunde als vernachlässigbar einzustufen(öffnet im neuen Fenster) .
Zeitsprünge scheibchenweise
Auf der Weltfunkkonferenz im Januar 2012 wollte die Internationale Fernmeldeunion (ITU) über die Abschaffung der Schaltsekunde entscheiden. Statt immer wieder eine Sekunde einzufügen, könnte in einigen Jahrhunderten eine ganze Stunde ausgeglichen werden. Die Entscheidung wurde aber vertagt.
Auch Google hatte diesen Vorschlag bereits im September 2011(öffnet im neuen Fenster) ins Gespräch gebracht.
Nachtrag vom 2. Juli 2012, 13:45 Uhr
Die Ursache der Ausfälle liegt offensichtlich in einem Fehler im Linux-Kernel. Zumindest arbeitet der Entwickler John Stultz an einem Patch(öffnet im neuen Fenster) .