Zum Hauptinhalt Zur Navigation

Betriebssysteme: Fehler im Linux-Kernel wegen GCC

Ein Fehler hat Abstürze in einer Testversion des Linux-Kernels 3.16rc6 verursacht. Es handelte sich nicht um einen Programmierfehler der Kernel-Entwickler, sondern um einen Bug im Compiler GCC.
/ Jörg Thoma
41 Kommentare News folgen (öffnet im neuen Fenster)
Der Compiler GCC verursachte einen Fehler in der Testversion des Linux-Kernels 3.16. (Bild: Ben Tubby/CC-BY 2.0)
Der Compiler GCC verursachte einen Fehler in der Testversion des Linux-Kernels 3.16. Bild: Ben Tubby/CC-BY 2.0

Ein Fehler in der GNU Compiler Collection hat für einen der berüchtigten Wutausbrüche von Linus Torvalds in der Mailingliste des Linux-Kernels(öffnet im neuen Fenster) gesorgt. Er führte dazu, dass die sechste Testversion des nächsten Linux-Kernels 3.16 sporadisch abstürzte. Der Bug in GCC ist bereits behoben. Allerdings könnten einige aktuelle Linux-Kernel noch fehlerhaft generierten Code enthalten.

Aufgefallen war der Fehler(öffnet im neuen Fenster) in einer Testversion des Linux-Kernels 3.16rc6, der mit GCC 4.9.0 kompiliert wurde. Der Entwickler berichtete von zufälligen Abstürzen der Funktion Load_Balance() im Scheduler des Kernels. Zunächst konnte das Problem nicht lokalisiert werden. Torvalds entdeckte die Ursache etwa eine Woche später. Der mit GCC 4.9.0 generierte Code enthielt einen Fehler, wodurch der Kernel auf Speicher in der sogenannten Red Zone(öffnet im neuen Fenster) zugreifen konnte.

Dieser 128 Bytes große Speicherbereich direkt unterhalb des Stapelzeigers kann von Anwendungen reserviert werden. Im Kernel ist das nicht der Fall, da Hardware spezielle Berechtigungen benötigt, um auf Stapelspeicher zuzugreifen. Daher wurde zumindest zeitweilig bei der Kompilierung des Kernels der Schalter -mno-red-zone verwendet, um das Red-Zoning abzuschalten. GCC ignorierte jedoch den Schalter in bestimmten Konfigurationen. Das führte dazu, dass Daten von anderen Interrupts in der Red Zone überschrieben werden konnten.

Nachdem Torvalds GCC 4.9.0 als "komplette Scheiße" bezeichnet hatte, begannen die sachliche Ursachenforschung und Fehlerbehebung. Es stellte sich heraus, dass der Fehler bereits behoben war, der Patch aber noch nicht in aktuelle Versionen von GCC umgesetzt wurde, auch nicht in Version 4.9.1. Er bestand wohl seit GCC 4.5, war aber bis dahin nicht aufgefallen. Erst durch Codeänderungen in GCC 4.9.0 trat er zum Vorschein. Die meisten Linux-Distributionen verwenden gegenwärtig GCC 4.8, um ihre Kernel zu kompilieren.


Relevante Themen