CPUs: Hotfix für Windows 7 macht AMDs Bulldozer schneller

Microsoft hat einen Hotfix für Windows 7 fertiggestellt, der auf Systemen mit AMDs FX-CPUs für mehr Leistung sorgen soll. Den Patch gibt es jedoch nur auf Anfrage.

Artikel veröffentlicht am ,
AMDs FX-8150 alias Bulldozer
AMDs FX-8150 alias Bulldozer (Bild: PCGH)

In seiner Knowledge Base weist Microsoft auf einen Hotfix hin, der auf Rechnern mit AMDs Bulldozer-CPUs für mehr Rechenleistung unter Windows 7 sorgen soll. Wie bei manchen dieser nicht voll getesteten Patches üblich, wird die Datei nicht zum freien Download zur Verfügung gestellt, sondern ist nur auf Anfrage direkt bei Microsoft erhältlich.

Stellenmarkt
  1. Softwareentwickler (m/w/d) Embedded Systems
    Arburg GmbH & Co. KG, Loßburg
  2. Produktmanager Enterprise IAM Services (m/w/d)
    Helios IT Service GmbH, Berlin-Buch
Detailsuche

Der Hotfix löst ein Problem, das die mit Windows 7 eingeführte Funktion des SMT Parking bei Bulldozer-CPUs verursacht. SMT Parking wurde von Intel und Microsoft gemeinsam entwickelt, um die Auslastung der Hyperthreading-Kerne von Intel-CPUs und das Hochschalten in den Turbo-Boost zu entflechten. Das konnte bei Windows Vista noch bremsen, weil das Betriebssystem die Kerne der Reihe nach belastet hat, je nachdem, wie viele Threads gerade liefen.

Mit Windows 7 hat Microsoft deshalb seinen Thread Scheduler so umgebaut, dass zuerst die physischen und dann die Hyperthreading-Kerne belastet werden. Dabei werden beispielsweise bei einem Quad-Core mit Hyperthreading zuerst im Muster Core 0, 2, 4, 6 die physischen Cores belastet. Erst wenn diese nicht mehr ausreichen, kommen die Hyperthreading-Cores 1, 3, 5, 7 zum Einsatz. Bei Bulldozer hat das den gegenteiligen Effekt, da in einem Modul, das sich den L2-Cache teilt, die Cores 0 und 1, 2 und 3 und so fort zusammengefasst sind. Zudem bremst ein Thread-Wechsel den Turbo, sinnvoll wäre es, nur so wenige Module wie möglich zu belasten.

Bei Bulldozer wirkt das SMT Parking vor allem deswegen wie eine Bremse, weil AMDs Design aus Modulen, nicht aus vollwertigen Kernen besteht: In jedem dieser Module sitzen zwei Integereinheiten, die sich dem Betriebssystem wie ein eigener Kern darstellen und sich zudem auch noch den L2-Cache teilen. Die Kerne 0 und 1 sind also auf demselben Modul untergebracht. Der Turbo von AMD kann aber nur dann optimal greifen, wenn nur je eine Integereinheit eines Moduls ausgelastet ist.

  • Anno 1404
  • Bad Company 2
  • Cinebench R10, xCPU
  • Super Pi Mod 1.5 XS
  • Starcraft 2
  • Leistungsaufnahme Gesamtsystem
  • 3DMark-Vantage-CPU
  • AMDs Testmuster
  • Der neue FX passt in den Sockel AM3+.
  • Blockdiagramm aller Funktionseinheiten
  • Alle FX-CPUs, nur vier gibt es zum Marktstart
  • Große Verzweigungspuffer
  • Die Dual-Core-Module sitzen in den Ecken.
  • Insgesamt je 8 MByte L2- und L3-Cache
  • Zwei Integer-Cores pro Module, die sich vieles teilen müssen
  • Diese FX-CPUs will AMD ab sofort anbieten.
  • Technologievergleich á la AMD
  • Turbo-Core 2.0 greift auch bei Volllast.
  • Die Plattform Scorpius
  • Billiger als Intel, aber auch viel langsamer
  • Der Scheduler von Windows 8 soll mehr Leistung bringen.
  •  
  • Das shared frontend
  •  
Der Scheduler von Windows 8 soll mehr Leistung bringen.
Golem Akademie
  1. Penetration Testing Fundamentals
    23.-24. September 2021, online
  2. Microsoft 365 Security Workshop
    27.-29. Oktober 2021, Online
  3. IT-Fachseminare der Golem Akademie
    Live-Workshops zu Schlüsselqualifikationen
Weitere IT-Trainings

Laut früheren Angaben von AMD und eigenen Messungen des Chipherstellers soll eine geschicktere Threadzuteilung zwischen 2 und 10 Prozent mehr Rechenleistung ergeben. AMD hatte das mit einer Beta von Windows 8 überprüft, die bereits den neuen Thread Scheduler enthielt.

Kaum Effekt bei sehr vielen Threads

Unabhängige Benchmarks mit stark rechenlastigen Anwendungen wie etwa Cinebench, wie sie unter anderem im Forum von Overclock.net zu finden sind, zeigen aber ein anderes Bild. Dort steigt die Rechenleistung auch mit dem Patch kaum, was aber nicht überrascht: Wenn alle Kerne - wie bei Cinebench - ausgelastet sind, gibt es kaum Spielraum für den Turbo.

Sinnvoll ist der Hotfix zwar für alle Anwender, aber deutliche Vorteile kann er nur bringen, wenn nicht ständig 8 sehr aktive Threads oder mehr laufen. Das ist aber bei der Mehrzahl der Anwendungen im privaten Umfeld der Fall - nicht umsonst hatte AMD für seine Messungen unter Windows 8 ausschließlich Spiele verwendet.

Nachtrag vom 16. Dezember 2011, 13:35 Uhr:

Nach Messungen von Planet3Dnow und HT4U bringt der Hotfix sehr gemischte Ergebnisse. Die Mehrzahl der getesteten Programme wird langsamer - einige wie die Computation-Suite von PCMark 7 legen aber sogar um mehr als zehn Prozent zu.

Offenbar verteilt der neue Thread Scheduler die Threads stets gezielt auf so viele Module wie möglich, was zwar dem Turbo zu Gute kommt. Bei Threads, die voneinander abhängen, kann das aber kontraproduktiv sein, weil diese schneller laufen würden, wenn sie den gemeinsamen L2-Cache eines Moduls nutzen würden.

Bisher ist noch nicht abzusehen, ob Microsoft eine neue Version des Patches auflegt, die auf die Eigenheiten der Bulldozer-Architektur mehr Rücksicht nimmt.

Nachtrag vom 20. Dezember 2011, 10:15 Uhr:

Microsoft hat den Patch zurückgezogen. Der Eintrag 2592546 der Knowledge Base führt nur noch zu einer Fehlermeldung. Kurzzeitig hatte Microsoft dort laut Fudzilla vermerkt, dass der Hotfix unvollständig sei. Nötig seien zwei Teile, nur einer davon sei veröffentlicht worden.

Aufgrund der sehr gemischten Benchmarkergebnisse empfiehlt es sich wohl, den Hotfix zu deinstallieren. Mit einer neuen Version des Patches, die dann vollständig sein soll, ist erst im ersten Quartal 2012 zu rechnen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Victorian Big Battery
Tesla-Speicher brannte vier Tage lang

Viel Aufwand war nötig, um das brennende Akku-Modul zu löschen.

Victorian Big Battery: Tesla-Speicher brannte vier Tage lang
Artikel
  1. Windows 365: Der mietbare Cloud-PC mit Windows kann bestellt werden
    Windows 365
    Der mietbare Cloud-PC mit Windows kann bestellt werden

    Microsoft startet mit Windows 365 und gibt Preise für den Cloud-PC bekannt. Die VMs sollen wie physische Windows-PCs funktionieren.

  2. Android: Googles Tensor-SoC ist eine halbe Mogelpackung
    Android
    Googles Tensor-SoC ist eine halbe Mogelpackung

    Für seinen ersten eigenen Smartphone-Chip liefert Google ausschließlich Erwartbares und dämpft damit sämtliche Hoffnungen an besseren Support und gute Linux-Treiber.
    Ein IMHO von Sebastian Grüner

  3. Apple-Tastatur: Magic Keyboard mit Touch ID jetzt ohne iMac erhältlich
    Apple-Tastatur
    Magic Keyboard mit Touch ID jetzt ohne iMac erhältlich

    Apple verkauft das Magic Keyboard mit Fingerabdruckscanner Touch ID nun auch einzeln - mit und ohne Ziffernblock.

Muxxon 18. Dez 2011

Äh, hä? Warum soll Triple-Channel "für Gamer ganz nett" sein?

Anonymer Nutzer 18. Dez 2011

...was ausgeschrieben "Symmetric Multi Processing" heißt. Weder "Hyperthreading"- noch...

scinaty 17. Dez 2011

Die Lösung muss nicht zwangsläufig dynamisch sein. Wenn ich dem System einmal sage dass...

Oberst 17. Dez 2011

aktuelle Linux Versionen berücksichtigen die Eigenheiten des FX bereits, die brauchen...

MESH 16. Dez 2011

er war nie direkt herunterladbar...



Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Schnäppchen • Speicherwoche bei Saturn Samsung • C27RG54FQU, 27 Zoll, curved 203,55€ • Bosch Professional Werkzeuge und Messtechnik • Samsung Galaxy Vorbesteller-Aktion • Speicherwoche bei Media Markt • 15% auf Xiaomi-Technik • Hisense UHD-Fernseher • Saturn: 1 Produkt zahlen, 2 erhalten [Werbung]
    •  /