OpenGL ES 2.0 und Flash: Das kann die GPU von Nvidias Tegra 2

Der Grafikteil des System-on-a-Chip (SoC) Tegra 2 von Nvidia heißt "ULP Geforce" . Diese Abkürzung steht für "Ultra Low Power" – der Grafikprozessor soll also besonders wenig elektrische Leistung aufnehmen. Wie viel genau und bei welchen Spannungen, diese Angaben behält Nvidia für sich. Die Werte sind jedoch auch vom Hersteller des Endgeräts abhängig, der je nach angepeilter Laufzeit und Kühlung darauf Einfluss nehmen kann.








Kernstück des ULP Geforce sind je vier Rechenwerke für Vertices(öffnet im neuen Fenster) und Pixel. Anders als bei aktuellen PC-GPUs sind Pixel- und Vertex-Shader nicht vereint. Das ist seit dem Geforce 8 und dem Radeon 2900 als "unified shader architecture" bei PCs eigentlich Standard. Die Universalrechenwerke sind aber komplexer und benötigen damit mehr Strom als spezialisierte Einheiten.
Gerade bei einer Handheld-GPU wie dem ULP Geforce ist es sinnvoll, Vertices und Pixel von räumlich getrennten Einheiten berechnen zu lassen. Je feiner die Funktionen verteilt sind, desto mehr der Einheiten können zum Stromsparen abgeschaltet werden. Wie bei den PC-GPUs sind Pixel- und Vertex-Shader aber voll programmierbar.
Das ist auch eine der Anforderungen von OpenGL ES 2.0 . Diese Schnittstelle wird von Tegra 2 voll unterstützt. Open GL ES 2.0 setzt auf eine programmierbare Renderpipeline und ist in den Grundfunktionen für die Darstellung von 3D-Grafik mit Open GL 2.0 vergleichbar. Zusätzlich hat Nvidia noch einige proprietäre Erweiterungen – was OpenGL prinzipiell erlaubt – vorgenommen. Dazu zählen die Unterstützung von Primitiven(öffnet im neuen Fenster) und eine eigene Texturierungseinheit.
Anti-Aliasing und Flash-Beschleunigung
Mit diesen zusätzlichen Funktionsblöcken realisiert Nvidia Dinge, die OpenGL ES 2.0 nicht fordert, wie HDR(öffnet im neuen Fenster) und Anisotropie bis 16x- und auch Anti-Aliasing, was viel Leistung und Speicherbandbreite benötigt. Da das auch den Strombedarf in die Höhe treibt, wurde Anti-Aliasing bei Handheld-GPUs traditionell vernachlässigt. Nvidia sieht daher statt dem vollständigen Filtern mit Multi-Sample-Antialising (MSAA) – wie es PC-GPUs beherrschen – nur Coverage Samples vor.








Was vom Chiphersteller als "5x CSAA" beschrieben wird, liegt in Rechenaufwand und Bildqualität zwischen 2x MSAA und 4x MSAA. Ein Durchgang wird komplett durchgeführt, vier weitere kümmern sich nur um Überschneidungen an Objektkanten. Das dürfte in der Darstellung gerade bei hohen Pixeldichten dem simplen 2xMSAA von anderen mobilen GPUs immer noch überlegen sein. Insgesamt sehen die 3D-Funktionen des ULP Geforce auf dem Papier so aus, dass Nvidia sein Versprechen der Spiele in Konsolenqualität auf Smartphones erfüllen könnte.

Mit Smartphones wird aber nicht nur gespielt, sondern vor allem im Web gesurft – und hier ist der größte grafische Leistungsfresser Adobes Flash. Ganz gleich ob für Animationen, Spiele oder Videos, Flash benötigt viel Rechenleistung. Deshalb hat Nvidia viele der Bestandteile von Flash über die GPU des Tegra 2 beschleunigt – aber nicht alle. So werden Flash-Animationen teilweise von den OpenGL-Einheiten übernommen und Videos immerhin von den Videoeinheiten decodiert.
Diese Einheiten waren bereits bekannt , sie können mit H.264-Videos auch in Full-HD umgehen. Gerade bei Videos werden für das Auseinandernehmen der Datenströme aber noch die CPU-Kerne gebraucht. Damit dürfte Flash auch auf dem Tegra 2 nicht gerade akkuschonend bleiben.
Bis zu 60 Prozent schneller bei 3D-Spielen
Natürlich hat Nvidia sowohl zur Flash-Beschleunigung als auch zu den 3D-Funktionen mit Spielen Benchmarks vorgelegt. Im Falle von Flash sollen Spiele auf dem Tegra 2 bis zu viermal schneller laufen. Nvidia hat dazu eine Entwicklungsplattform für den Tegra 2 – also nicht etwa das Optimus Speed von LG – mit dem Galaxy S von Samsung verglichen.








Bei 3D-Spielen nach OpenGL ES 2.0 kommen die gleichen Geräte zum Einsatz. Der PowerVR-Kern SGX540 im Galaxy ist hier nur 20 bis 60 Prozent langsamer. Das kann aber auf Handhelds schon den Unterschied zwischen Ruckelei und spielbaren Frameraten ausmachen. Nvidia gibt aber keine absoluten, sondern nur relative Werte an.
Auch bei fordernden Anwendungen wie der Citadel-Demo mit der mobilen Unreal Engine 3 kommt Nvidia nach eigenen Angaben noch auf 28 Prozent höhere Bildwiederholraten. Nvidia weist darauf hin, dass die getesteten Anwendungen noch nicht die erweiterten Funktionen des ULP Geforce verwenden – sie könnten also in angepassten Versionen noch schneller werden.