Adapteva 4.096 Kerne auf einem Chip

Doppelt so viele Rechenwerke wie auf aktuellen GPUs will das Startup Adapteva auf einem Chip unterbringen. Sie sollen eine FPU bilden, die mit 70 Gigaflops pro Watt effizienter als die Konkurrenz von AMD, Intel Tilera und Nvidia ist.

Anzeige

In Zusammenarbeit mit Globalfoundries entwickelt Adapteva seine Multicore-Architektur Epiphany. Dabei werden in einem Mesh, ähnlich Intels SCC, viele sehr kleine RISC-Kerne verknüpft. Jeder Kern besitzt einen kleinen Cache von 32 KByte SRAM.

Mit immerhin 16 Kernen ist das in 65-Nanometer-Technik bereits geschafft, wie aus einem Whitepaper (PDF) von Adapteva hervorgeht. Das Unternehmen zeigt darin Entwicklungsboards, die es auch Lizenznehmern zur Verfügung stellt. Ähnlich wie ARM will Adapteva die Prozessoren nicht selbst herstellen und verkaufen, sondern seine Technologie zur Umsetzung in Produkte anbieten.

  • Der Clock-Tree (Bild: Adapteva)
  • Mesh mit vielen kleinen Kernen (Bild: Adapteva)
  • Die 65nm-CPUs sind schon gebaut, die 28nm-Chips Entwürfe (Bild: Adapteva)
  • Das Testboard der 16-Kern-Version (Bild: Adapteva)
Die 65nm-CPUs sind schon gebaut, die 28nm-Chips Entwürfe (Bild: Adapteva)

Während der 16-Kerner schon "silcon proven" ist, also lauffähig existiert, basieren die Angaben zum größten Chip mit 4.096 Kernen noch auf Simulationen. Im Rechner soll der Prozessor mit dem Namen E4KG4 schon existieren, die Schaltung (Routing) ist Adapteva zufolge fertig.

Bei den Daten zur Effizienz hat das Unternehmen aber offenbar die Auswirkungen von Moores Law beim Schritt von 65 zu 28 Nanometern hochgerechnet. So soll der E4KG4 bei 600 MHz 70 Gigaflops pro Watt erreichen, was effizienter als bei GPUs und anderen Multicores wie denen von Tilera wäre. Dabei erreicht der Chip aber auch über 524 Quadratmillimeter Größe, was bisher nur selten in Serie produziert wurde. Ein Beispiel ist die GPU GT200 (GTX-280) von Nvidia, die im Jahr 2008 ganze 576 Quadratmillimeter erreichte.

Neuer Clock-Tree

Viel Rechenleistung bei wenig Energiebedarf will Adapteva unter anderem durch eine Baumstruktur für die Taktgeber erreichen. Dabei wird an den Chip nur ein globaler Takt angelegt, auf dem Die sitzen aber weitere Taktgeber, die jeweils die benachbarten Kerne synchronisieren. Verzögerungen werden durch die Caches abgefangen. Das beschreibt das Fachblatt Microprocessor Report in einer Analyse der Architektur (PDF), die bei Adapteva zugänglich ist.

Gedacht sind solche Prozessoren vor allem als Beschleuniger für Supercomputer, wie das heute schon mit GPUs geschieht. Für eine Beurteilung der Leistung in der Praxis sind dann aber Benchmarks mit konkreten Anwendungen wie Linpack nötig, Adapteva gibt bisher nur den auch bei ARM-SoCs verwendeten sehr kleinen Benchmark Coremark als Referenz an. Dabei bleibt aber auch offen, ob sich die Werte auf einfache oder doppelte Genauigkeit beziehen.


Crass Spektakel 26. Sep 2012

Ende der 1980er gabs in München eine Firma die relativ preiswerte superparallele Systeme...

delaytime0 20. Mär 2012

ARM macht das relativ geschickt. Sie entwickeln eine CPU-Technik. Diese kann/darf dann...

Kommentieren



Anzeige

  1. Akademischer Mitarbeiter (m/w)
    Hochschule Furtwangen, Furtwangen
  2. Bauingenieur / Bauingenieurin - Baubetrieb
    Ed. Züblin AG, Stuttgart
  3. Teamleiter (m/w) Software-Qualitätsdatenanaly- se
    Synatec GmbH, Stuttgart oder Dingolfing
  4. Trainee für den Bereich IT / Business Processes (m/w)
    DMG MORI SEIKI Services GmbH, Bielefeld

 

Detailsuche


Folgen Sie uns
       


  1. IBM Power8

    Mit 96 Threads pro Sockel gegen Intels Übermacht

  2. Printoo

    Arduino kannste jetzt knicken

  3. Cloud-Dienste

    Streem verspricht unbegrenzten Speicherplatz

  4. Streaming

    HBO-Serien für US-Kunden von Amazon Prime

  5. Theo de Raadt

    OpenSSL ist nicht reparierbar

  6. Xplore XC6 DMSR

    Blendend hell und hart im Nehmen

  7. Programmiersprache

    Go 1.3 kommt für Solaris, Plan 9 und NaCL

  8. Arin

    IPv4-Adressen in Nordamerika nähern sich dem Ende

  9. Flappy 48

    Zahlen statt Vögel

  10. Port 32764

    Netgear will angebliche Router-Lücke schließen



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Radeon R9 295X2 im Test: AMDs Wassermonster für 1.000-Watt-Netzteile
Radeon R9 295X2 im Test
AMDs Wassermonster für 1.000-Watt-Netzteile

Hybridkühlung, 50 Ampere auf der 12-Volt-Schiene - AMDs neue Dual-GPU-Grafikkarte ist ein kompromissloses Monster. In gut ausgestatteten High-End-PCs läuft sie dennoch problemlos und recht leise, und das so schnell, dass auch 4K-Auflösung mit allen Details spielbar wird.

  1. Grafikkarte Radeon R9 295X2 für 1.500 Euro verfügbar
  2. Grafiktreiber von AMD Catalyst 14.4 nicht nur für 295X2 öffentlich verfügbar
  3. Nvidia Maxwell Geforce GTX 750 und GTX 750 Ti im Februar

Windows 8.1 Update 1 im Test: Ein lohnenswertes Miniupdate
Windows 8.1 Update 1 im Test
Ein lohnenswertes Miniupdate

Microsoft geht wieder einen Schritt zurück in die Zukunft. Mit dem Update 1 baut der Konzern erneut Funktionen ein, die vor allem für Mausschubser gedacht sind. Wir haben uns das Miniupdate für Windows 8.1 pünktlich zur Veröffentlichung angesehen.

  1. Microsoft Installationsprobleme beim Windows 8.1 Update 1
  2. Windows 8.1 Update 1 Wieder mehr minimieren und schließen
  3. Microsoft Windows 8.1 Update 1 vorab verfügbar

Digitalkamera: Panono macht Panoramen im Flug
Digitalkamera
Panono macht Panoramen im Flug

Wenn Jonas Pfeil ein Panorama aufnimmt, stellt er nicht Kamera, Stativ und Panoramakopf auf, sondern wirft einen Ball in die Höhe. Um das Panorama anschließend zu betrachten, hantiert er mit einem Tablet. Der Berliner hat Golem.de seine Entwicklung erklärt.

  1. Lytro Illum Neue Lichtfeldkamera für Profis
  2. Nachfolger von Google Glass Google patentiert Kontaktlinsen mit Kameras
  3. Pentax 645Z Mittelformatkamera mit 51 Megapixeln und ISO 204.800

    •  / 
    Zum Artikel