FMA3-Instruktion: Windows-SMT-Bug lässt Ryzen-Systeme abstürzen

Hochoptimierter Code mit der FMA3-Anweisung führt unter Windows 10 zum Absturz von Ryzen-Systemen, wenn diese SMT nutzen - unabhängig vom Compiler. Unter Linux tritt das Problem nicht auf und selbst Wine führt den Code fehlerfrei aus.

Artikel von veröffentlicht am
Windows-Systeme mit Ryzen können reproduzierbar zum Absturz gebracht werden.
Windows-Systeme mit Ryzen können reproduzierbar zum Absturz gebracht werden. (Bild: Martin Wolf/Golem.de)

Ein Fehler, der von hochoptimiertem Code verursacht wird, kann Windows-10-Systeme mit den neuen Ryzen-CPUs vom AMD reproduzierbar zum Absturz bringen. Das berichtet der Entwickler Alexander Yee, dem dies bei Tests seines Programms Flops aufgefallen ist. Die Anwendung bewertet die Rechenleistung von Gleitkommaoperationen einer CPU und nutzt dafür spezielle x86-Befehlssatzerweiterungen wie SSE oder FMA3 (Fused Multiply-Add 3). Bei dem Test von FMA3 mit 128 Bit Breite stürzt jedoch das gesamte System ab.

Stellenmarkt
  1. Administratorin / Administrator (m/w/d)
    Bundesamt für Familie und zivil­g­esell­schaftliche Aufgaben (BAFzA), Köln
  2. Managing Consultant (m/w/d) Network Architecture
    operational services GmbH & Co. KG, Dresden, Berlin, Frankfurt, München
Detailsuche

Yee hat in dem Hwbot-Forum dazu aufgerufen, seine Ergebnisse zu verifizieren. Tatsächlich haben sich einige Nutzer mit unterschiedlichen Hardware-Konfigurationen gemeldet und bestätigen den Absturz von Windows bei der Verwendung von Ryzen-CPUs. Auch wir konnten den Absturz mit einem Ryzen 7 1800X auf dem Mainboard MSI X370 XPower Gaming Titanium nachstellen und dabei die Fehlerursache zumindest etwas eingrenzen.

Windows-Fehler bei der Verwendung von SMT

Der Absturz tritt bei uns sowohl mit dem von Yee selbst bereitgestellten Binärdateien auf als auch mit der von uns kompilierten Anwendung. Der verwendete Compiler und die Toolchain scheinen darüberhinaus hier nicht das eigentliche Problem zu sein. Denn wir können ebenfalls reproduzierbar einen Absturz mit Binärdateien verursachen, die wir unter Linux mit MinGW für Windows crosskompiliert haben.

Interessanterweise tritt der Fehler bei uns jedoch nicht auf, wenn das Simultaneous Multithreading (SMT) der CPU abgestellt wird. Das unterstützen jedoch nicht alle Mainboards, weshalb Yee dieses Verhalten selbst nicht nachstellen kann. Allerdings bestätigt auch ein Nutzer des Hwbot-Forums, dass der Absturz bei abgeschaltetem SMT nicht auftritt.

Golem Karrierewelt
  1. Adobe Photoshop Aufbaukurs: virtueller Zwei-Tage-Workshop
    12./13.01.2023, Virtuell
  2. Deep Dive: Data Architecture mit Spark und Cloud Native: virtueller Ein-Tages-Workshop
    01.02.2023, Virtuell
Weitere IT-Trainings

Der Fehler ist wohl außerdem auf Windows beschränkt. Unter Linux verursacht die Anwendung unabhängig von der SMT-Nutzung bei uns keine Abstürze. Yee und andere Nutzer bestätigen ebenso, dass Linux nicht betroffen ist. Ebenso fehlerfrei ist die Ausführung der Windows-Binärdateien unter Linux mit Hilfe des Windows-API-Nachbaus von Wine.

Möglicherweise Workaround dank Microcode-Update

Dass der Absturz wie beschrieben nur unter bestimmten Umständen bei der Verwendung von Windows 10 auftritt, deutet daraufhin, dass es sich nicht um einen Fehler der Hardware selbst handelt, sondern eben um einen sehr spezifischen Fehler in Verbindung mit der SMT-Verarbeitung von Windows.

Laut dem Chief Operating Officer von Hwbot, Pieter-Jan Plaisier, der gute Kontakte in der Hardware-Industrie hat, werde der Fehler künftig durch ein Agesa-Microcode-Update von AMD behoben. Sollte dies geschehen, setzt AMD dabei wohl lediglich auf einen Workaround, der eventuell das Abarbeiten der FMA3-Instruktionen anpasst. Eine Stellungnahme von AMD oder Microsoft zu dem Problem gibt es noch nicht.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


triri 27. Jun 2017

Kann ich ehrlich gesagt nicht wirklich nachvollziehen, dass so viele immer solche...

HubertHans 20. Mär 2017

Wie schon jemand geschrieben hat: Compiler.

das sushi 17. Mär 2017

MS muss zu FMA3 gar nix umsetzen, das ist ein Assemblerbefehl zusätzlich, müssen die FPU...

David64Bit 17. Mär 2017

Der Bug wurde schon behoben. Die Mainboardhersteller haben sich allerdings völlig...



Aktuell auf der Startseite von Golem.de
Twitter
Was bisher bei Elon Musks Twitter 2.0 geschah

Nach der Twitter-Übernahme durch Elon Musk ist klar: Das Netzwerk hat wesentlich weniger Mitarbeiter. Es ist aber noch viel mehr passiert.
Ein Bericht von Oliver Nickel

Twitter: Was bisher bei Elon Musks Twitter 2.0 geschah
Artikel
  1. Responsible Disclosure: Obi macht das Melden einer Sicherheitslücke schwer
    Responsible Disclosure
    Obi macht das Melden einer Sicherheitslücke schwer

    Ein Sicherheitsforscher hat eine Lücke bei mehreren Unternehmen und Stadtverwaltungen gemeldet. Obi machte es ihm besonders schwer.

  2. Telefónica: Warum der LTE-Ausbau in der U-Bahn so lange dauert
    Telefónica
    Warum der LTE-Ausbau in der U-Bahn so lange dauert

    Seit August 2010 laufen in Deutschland LTE-Netze. Nun wird 5G langsam wichtiger, doch die Berliner U-Bahn ist noch immer nicht für alle mit 4G versorgt.

  3. Sono Motors: Solarauto Sion steht vor dem Aus
    Sono Motors
    Solarauto Sion steht vor dem Aus

    Sono Motors hat nicht mehr genug Geld für den Aufbau der Serienproduktion des Solarautos Sion. Nun soll die Community finanziell helfen. Mal wieder.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • PS5 bei Amazon • Samsung SSDs bis -28% • Rabatt-Code für ebay • Logitech Mäuse, Tastaturen & Headsets -53% • HyperX PC-Peripherie -56% • Google Pixel 6 & 7 -49% • PS5-Spiele günstiger • Tiefstpreise: Palit RTX 4080 1.369€, Roccat Kone Pro 39,99€, Asus RTX 6950 XT 939€ [Werbung]
    •  /