Im Sommer 2012 verursachte eine Schaltsekunde noch massive Probleme und Ausfälle in verschiedenen Computersystemen. Ähnlich gravierende Fehler in Verbindung mit der Einführung einer Schaltsekunde sind seitdem ausgeblieben, so auch in der vergangenen Silvesternacht, die eine Sekunde länger war als sonst üblich. Völlig ohne Fehler lief es bei Cloudflare zu Silvester aber nicht, wie der Dienstleister in seinem Blog berichtet.

Denn die Schaltsekunde führte in Verbindung mit einigen anderen Fehlern dazu, dass eines seiner DNS-Systeme kurzzeitig rückwärts in der Zeit zählte, weshalb die hauseigene Software RRDNS teilweise ausgefallen ist. Von dem Fehler betroffen waren laut Aussage von Cloudflare allerdings nur jede fünfhundertste DNS-Anfrage sowie weniger als 1 Prozent aller HTTP-Anfragen.

Nichtmonotone Zeit in Go

Cloudflare schreibt dazu: "Die Ursache für den Fehler, der unseren DNS-Dienst beeinträchtigte, war der Glaube, dass die Zeit nicht rückwärtsgehen kann. In unserem Fall wurde angenommen, dass der Unterschied zwischen zwei Zeiten immer schlimmstenfalls Null wäre".

Darüber hinaus ist RRDNS in der Sprache Go geschrieben und verwende die Funktion time.Now(), um zwei Zeiten miteinander zu vergleichen. Besagte Funktion garantiere allerdings keine Monotonie, so dass die Schaltsekunde sowie das sogenannte Glätten mehrerer Werte über einen bestimmten Zeitraum hinweg zu einer negativen Differenz geführt habe. Der Zeitpunkt Jetzt zum Messen der Dauer einer Anfrage lag also kurioserweise vor dem Startzeitpunkt der Anfrage.

Der Fehler war schnell behoben, indem eine Abfrage nach einer negativen Zeitdifferenz samt entsprechender Fehlerbehandlung in den betroffenen Code eingebaut worden ist. Nach wenigen Stunden war der Fehler in sämtlichen Rechenzentren von Cloudflare behoben.