Silifuzz: Google sucht und findet per Fuzzing CPU-Fehler

Elektrische Defekte in CPUs können Daten und Ergebnisse beeinflussen, ohne dass dies zunächst auffällt. Google sucht diese nun per Fuzzing.

Artikel veröffentlicht am ,
Google sucht elektrische Fehler in CPUs.
Google sucht elektrische Fehler in CPUs. (Bild: Reuters Marketplace - AFLO - Pictures)

Das Fuzzing-Team von Google hat eine neue Technik vorgestellt, mit der das Team nach Fehlern in Prozessoren sucht. Wie die Beteiligten in der Ausarbeitung zu dem Projekt Silifuzz schreiben, zielt dies aber nicht auf inhärente Logik-Fehler, die alle Chips eines Typs betreffen wie Meltdown oder Spectre. Das Team sucht über die neue Methode vielmehr elektrische Fehler, die der CPU-Hersteller beim Testen übersehen hat oder die durch dauerhaften Gebrauch entstehen können.

Stellenmarkt
  1. SAP Berater oder Architekt für SAP Finance (m/w/x)
    über duerenhoff GmbH, Essen
  2. Data Engineer (d/m/w)
    NÜRNBERGER Versicherung, Nürnberg
Detailsuche

Hintergrund der Arbeiten ist dabei, dass diese Art Fehler der CPU eine sogenannte Silent Data Corruption (SDC) auslösen könnte. Dabei werden Daten bis hin zum vollständigen Verlust verändert, ohne dass dies etwa durch einen Absturz auffällt. Darüber hinaus sind heutige Serversysteme oft mit einer Redundanz gegen Ausfälle abgesichert. SDC-Ereignisse seien laut Google aber viel gefährlicher, da gegen dieses Phänomen oft keinerlei Vorkehrungen getroffen werden. Und in vielen Fällen sind elektrische Fehler der CPUs Auslöser für SDCs.

Für die konkrete Suche nach echten Fehlern setzt Google dabei zunächst auf das Fuzzing von CPU-Simulatoren und Disassemblern, um einen entsprechenden Testkorpus aufzubauen. Fehler, die in diesen Systemen auftreten, könnten dann auch in realen CPUs zu finden sein, so die Idee. Das Team selbst schreibt, dass dieses Vorgehen aus akademischer Sicht nicht zwingend neu und das eigene Projekt auch noch nicht ausgereift ist. Silifuzz liefert aber bereits praktische Ergebnisse, weshalb sich die Beteiligten für eine frühe Veröffentlichung der Arbeiten entschieden haben, wie sie selbst schreiben.

Viele verschiedene und bisher nicht entdeckte Fehler

Bei den so generierten Tests handele es sich um etwa 500.000 Stück, die auf "einem großen Teil von Googles Produktionsflotte" genutzt wurden. Und das Team konnte direkt "fehlerhafte" Maschinen finden. Einige der betroffenen Geräte seien bereits durch andere Tests, andere bereits bei Betriebsfehlern aufgefallen. In 45 Prozent der Fälle seien die Fehler aber allein durch Silifuzz gefunden worden.

Golem Akademie
  1. Elastic Stack Fundamentals – Elasticsearch, Logstash, Kibana, Beats: virtueller Drei-Tage-Workshop
    26.–28. Oktober 2021, Virtuell
  2. Java EE 8 Komplettkurs: virtueller Fünf-Tage-Workshop
    24.–28. Januar 2022, virtuell
Weitere IT-Trainings

Zu den konkreten Fehlern gehören falsche Ergebnisse für Ganzzahl-, Gleitkommazahl- oder Vektorinstruktionen. Oft sei hier nur 1 Bit falsch. Hinzu kommen zweifelhafte Fehlersignale (SIGFPE, SIGSEGV, SIGILL), fehlende Ausnahmebehandlungen, das Fehlen der Meldung SIGILL (Illegale Instruktion), wo es eine geben sollte, "Sticky Flags" - also Bit-Werte in Eflags- oder Zustandsregistern, die erhalten bleiben, obwohl dies nicht sein dürfte - oder auch die Nichtübereinstimmung von Werten in Registern für Gleitkommazahlen.

Dazu heißt es: "Wir wissen nicht, ob diese gemeinsamen Muster repräsentativ für alle CPU-Fehler oder einfach mit unserer Technik leicht zu finden sind". Das Team ist sich aber ziemlich sicher, dass die genannten Fehler häufiger bei C-Code auftreten als bei Anwendungen, die etwa JIT-kompiliert werden.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Feldversuch E-Mobility-Chaussee
So schnell bringen E-Autos das Stromnetz ans Limit

Das Laden von Elektroautos stellt Netzbetreiber auf dem Land vor besondere Herausforderungen. Ein Pilotprojekt hat verschiedene Lösungen getestet.
Ein Bericht von Friedhelm Greis

Feldversuch E-Mobility-Chaussee: So schnell bringen E-Autos das Stromnetz ans Limit
Artikel
  1. Encrochat-Hack: Damit würde man keinen Geschwindigkeitsverstoß verurteilen
    Encrochat-Hack
    "Damit würde man keinen Geschwindigkeitsverstoß verurteilen"

    Der Anwalt Johannes Eisenberg hat sich die Daten aus dem Encrochat-Hack genauer angesehen und viel Merkwürdiges entdeckt.
    Ein Interview von Moritz Tremmel

  2. Geforce Now (RTX 3080) im Test: 1440p120 mit Raytracing aus der Cloud
    Geforce Now (RTX 3080) im Test
    1440p120 mit Raytracing aus der Cloud

    Höhere Auflösung, mehr Bilder pro Sekunde, kürzere Latenzen: Geforce Now mit virtueller Geforce RTX 3080 ist Cloud-Gaming par excellence.
    Ein Test von Marc Sauter

  3. SpaceX: Starlink testet Satelliteninternet in Flugzeugen
    SpaceX
    Starlink testet Satelliteninternet in Flugzeugen

    Bald dürften mehrere Flugesellschaften Starlink-Service anbieten. Laut einem Manager soll es so schnell wie möglich gehen.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Gaming-Monitore zu Bestpreisen (u. a. Samsung G9 49" 32:9 Curved QLED 240Hz 1.149€) • Spiele günstiger: PC, PS5, Xbox, Switch • Zurück in die Zukunft Trilogie 4K 31,97€ • be quiet 750W-PC-Netzteil 87,90€ • Cambridge Audio Melomonia Touch 89,95€ • Gaming-Stühle zu Bestpreisen [Werbung]
    •  /