• IT-Karriere:
  • Services:

CPU-Bug: Wie der Albtraum-Bug in Skylake gefunden wurde

Ein Hardware-Bug ist auch nur so etwas wie ein Software-Bug, hat sich das Team gedacht, das den sogenannten Albtraum-Bug in Skylake-CPUs gefunden hat. Am Ende blieben wenige Zeilen Assembler und das Warten auf den Bugfix von Intel.

Artikel veröffentlicht am ,
Verschiedene CPUs von Intel hatten ein Bug im Microcode.
Verschiedene CPUs von Intel hatten ein Bug im Microcode. (Bild: Martin Wolf/Golem.de)

In einem sehr ausführlichen Blogeintrag beschreibt der Entwickler Joris Giovannangeli, wie der Fehler in dem Microcode für Intels Skylake-CPUs gefunden wurde. Das Debian-Team hatte diesen als Albtraum bezeichnet. Dabei hatte es bei dem Unternehmen Ahrefs viel Hilfe von verschiedenen anderen Entwicklern und vor allem von der Ocaml-Community - und zunächst hatten sie auch eine "verrückte Idee".

Speicherfehler von Hardware ausgelöst

Stellenmarkt
  1. Hughes Network Systems GmbH, Griesheim
  2. ALDI International Services GmbH & Co. oHG, Mülheim an der Ruhr

Demnach konnte das Team den Fehler, der beim Kompilieren von Ocaml ausgelöst wurde, zuerst nur sehr schlecht reproduzieren. Nachdem der Fehler aber auch auf den neuen Produktivservern aufgetreten war, musste das Team handeln. Das augenscheinliche Problem ist ein Segfault, also ein Speicherfehler. Allerdings lag der betroffene Speicherbereich außerhalb des Adressbereiches der Anwendung, was auf Fehler im Kernel oder in der Hardware hindeutet.

Da die Verwendung von Werkzeugen wie Asan oder Valgrind, die zum Untersuchen derartiger Fehler genutzt werden, viel Leistung benötigt, zog das Team zum Testen von den Entwickler-Rechnern auf einen Server um, wo es den Fehler nicht hat reproduzieren können. Erst dann stellte das Team fest, dass nur Skylake-Systeme betroffen sind und möglicherweise die Hardware der Verursacher ist.

Entwickler Giovannangeli beschreibt das als "unübliche" Vermutung und wie erwähnt als "verrückte Idee". Gereift sei diese Überlegung wegen des Berichts von einem anderem Ocaml-Entwickler, der einen ähnlichen Fehler beschrieben hat und diesen in Zusammenhang mit dem Hyperthreading des Skylake brachte.

Fehlersuche bis zum Assemblercode

Golem Akademie
  1. Ansible Fundamentals: Systemdeployment & -management
    26.-30. April 2021, online
  2. Elastic Stack Fundamentals - Elasticsearch, Logstash, Kibana, Beats
    3.-7. Mai 2021, online
Weitere IT-Trainings

Zu der Zeit gab es aber weder in Intels-Errata-Liste eine Beschreibung, die auf das Problem gepasst hätte, noch ein Microcode-Update, das das Problem löst. Also versuchte das Team weiterhin, den Fehler einzugrenzen. Dafür wurde angenommen, dass der Code, der den Speicherfehler provoziert, derjenige ist, der auch in den entsprechenden Bereich schreibt und liest, in diesem Fall der Garbage Collector.

Diese Information kombiniert mit dem Wissen, dass der Fehler nur bei der Verwendung einer bestimmten Compiler-Optimierung auftritt, ermöglichte letztlich die Suche in dem betroffenen Code, so dass das Team eine spezifische Kombination von Register-Befehlen in Assemblercode als Auslöser ausmachen konnte.

Die Auflistung der Änderungen beim aktuellen Microcode-Update für Intels Skylake-CPUs zählt in einem Fall dann auch die betroffene Registersequenz auf. Nach einem Microcode-Update konnten die beteiligten Ocaml-Entwickler den Bugfix bestätigen. "Schließlich", so schreibt das Team, "fühlten sich unsere Skylake-CPUs sicher und Ocaml-Compiler war glücklich."

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Top-Angebote
  1. mit 499€ neuer Bestpreis auf Geizhals
  2. (u. a. Stellaris - Galaxy Edition für 4,19€, Stellaris - Distant Stars Story Pack (DLC) für 2...
  3. 3.999€ statt 4.699€
  4. (u. a. Alita - Battle Angel + 3D für 21,99€, Le Mans 66: Gegen jede Chance für 19,99€, Der...

wsxedc 18. Sep 2017

Dass Intel keinen Mitbewerber mehr hat ist Quatsch. AMD ist jetzt mit Ryzen wieder sehr...

Rubbelbubbel 14. Jul 2017

...der es auch als Flachwitz in das Adventure "Simon the Sorcerer 2" geschafft hat...

Tom01 02. Jul 2017

Das ist ein mieser Programmierstil. Genau das, was Mann nicht machen sollte.

Deff-Zero 30. Jun 2017

Bei CPUs werden im Gegensatz zu Wald- und Wiesensoftware schon lange...

Schleicher 30. Jun 2017

Richtig! Jedenfalls wenn du die Version 0x48 hast. Überprüfen kannst du das mit grep -i...


Folgen Sie uns
       


Die Tesla-Baustelle von oben 2020-2021

Wir haben den Fortschritt in Grünheide dokumentiert.

Die Tesla-Baustelle von oben 2020-2021 Video aufrufen
Programm für IT-Jobeinstieg: Hoffen auf den Klebeeffekt
Programm für IT-Jobeinstieg
Hoffen auf den Klebeeffekt

Aktuell ist der Jobeinstieg für junge Ingenieure und Informatiker schwer. Um ihnen zu helfen, hat das Land Baden-Württemberg eine interessante Idee: Es macht sich selbst zur Zeitarbeitsfirma.
Ein Bericht von Peter Ilg

  1. Arbeitszeit Das Sechs-Stunden-Experiment bei Sipgate
  2. Neuorientierung im IT-Job Endlich mal machen!
  3. IT-Unternehmen Die richtige Software für ein Projekt finden

Weclapp-CTO Ertan Özdil: Wir dürfen nicht in Schönheit und Perfektion untergehen!
Weclapp-CTO Ertan Özdil
"Wir dürfen nicht in Schönheit und Perfektion untergehen!"

Der CTO von Weclapp träumt von smarter Software, die menschliches Eingreifen in der nächsten ERP-Generation reduziert. Deutschen Perfektionismus hält Ertan Özdil aber für gefährlich.
Ein Interview von Maja Hoock


    Fiat 500 als E-Auto im Test: Kleinstwagen mit großem Potenzial
    Fiat 500 als E-Auto im Test
    Kleinstwagen mit großem Potenzial

    Fiat hat einen neuen 500er entwickelt. Der Kleine fährt elektrisch - und zwar richtig gut.
    Ein Test von Peter Ilg

    1. Vierradlenkung Elektrischer GMC Hummer SUV fährt im Krabbengang seitwärts
    2. MG Cyberster MG B Roadster mit Lasergürtel und Union Jack
    3. Elektroauto E-Auto-Prämie übersteigt in 2021 schon Vorjahressumme

      •  /