AMD verzögert Auslieferung von Barcelona wegen TLB-Bug
Nach einem Artikel(öffnet im neuen Fenster) in der New York Times, in dem AMD-Sprecher John Taylor weitere Verzögerungen bei Barcelona bestätigte, schlagen die Wogen rund um den Grund für diesen De-facto-Lieferstopp ungewöhnlich hoch. Inzwischen erreichte Golem.de auch eine offizielle Stellungnahme, in der AMD bestätigt, dass nur noch ausgewählte Kunden die Produkte erhalten:
"Wir liefern den AMD Quad-Core-Opteron nur noch in Form von gekennzeichneten Prozessoren für bestimmte Systeme von Endanwendern, bei denen die Kunden die Möglichkeit hatten, die Stabilität und Zuverlässigkeit der Lösung durch einen BIOS-Fix oder einen anderen Workaround per Software in Schwung zu bringen. Die zur allgemeinen Verfügbarkeit im ersten Quartal 2008 ausgelieferten Quad-Core-Opterons werden dieses Erratum nicht haben."
Im Klartext: Opterons mit Barcelona-Kern im Stepping B2 gibt es bis auf weiteres von AMD nur für PC-Hersteller, die sich selbst um einen Workaround für den Bug im L3-TLB kümmern. Dieser "Translation Lookaside Buffer" speichert die Bezüge von virtuellen zu physischen Adressen und dient der Leistungssteigerung. Ein Blick in die Listen von deutschen Hardware-Versendern zeigt, dass die Barcelonas bereits meist mit "Liefertermin unbekannt" geführt sind. Laut AMD werden die Phenoms mit dem TLB-Bug, anders als die Opterons, weiterhin frei verkauft. AMD weist in seiner Stellungnahme aber darauf hin, dass die PC-Hersteller vor der Markteinführung der Phenom-Prozessoren vom 19. November 2007 auf den Fehler hingewiesen worden seien und auch BIOS-Code für einen Workaround zur Verfügung stehe.
Wie AMDs Produktmanager Dave Everitt aber bereits gegenüber Golem.de erklärt hatte , besteht der Fix bisher nur aus dem Abschalten des TLB und soll rund 10 Prozent Rechenleistung kosten. Wie Tech Report(öffnet im neuen Fenster) nun aber mit und ohne TLB gemessen hat, können daraus sowohl in Anwendungen wie Firefox als auch bei synthetischen Speicher-Benchmarks wie dem Latenz-Test von CPU-Z durchaus über 50 Prozent werden. Gemittelt fiel die Leistung von realen Desktop-Anwendungen und Spiele-Engines bei ausgeschaltetem TLB um knapp 14 Prozent.
Wie sich der Fehler in der Praxis äußert, hat AMD auch zwei Wochen nach dem Verkaufsstart der Phenoms noch nicht genau beschrieben. Inzwischen ist aber bekannt, dass der TLB-Fehler intern als "Erratum 298" geführt wird und demnächst dokumentiert werden soll. Das geht unter anderem aus Einträgen von AMD-Mitarbeitern auf der Mailing-Liste von x86-64.org hervor. Bei dieser öffentlichen Liste diskutieren Programmierer die Weiterentwicklung von Linux-Kerneln.
Aus einem der Beiträge(öffnet im neuen Fenster) geht hervor, dass sich beim Auftreten des TLB-Bugs falsche Daten in den L3-Cache einschleichen können. Dabei ist jedoch nicht immer ein Absturz die Folge, es wird vielmehr nur eine Exception, besser bekannt als "Ausnahmefehler", ausgelöst. Die Exceptions erkennt der Prozessor selbst, das Betriebssystem kann sie zudem abfangen. Folglich hat über die Mailing-Liste auch ein anderer AMD-Programmierer bereits einen Patch für Linux veröffentlicht(öffnet im neuen Fenster) , der aber wegen seiner tiefen Eingriffe in die Speicherverwaltung ausdrücklich als nicht geeignet für Linux-Distributionen bezeichnet wird.
Sollte das dort beschriebene Verfahren stabil funktionieren, wäre es für AMD auch möglich, Software-Workarounds ohne Abschalten des TLB per BIOS für alle gebräuchlichen Betriebssysteme zu erstellen. Die Erfahrung mit anderen Prozessor-Fehlern - mit denen auch Intel öfter zu kämpfen hat - zeigt jedoch, dass es Monate dauern kann, bis Microsoft derartige Patches nach aufwendiger Prüfung auch per Windows-Update verteilt.



