Autonomes Fahren: Waymo gibt Sensordaten für Forscher frei

Nur wenige Firmen haben so viele Daten für das autonome Fahren gesammelt wie Waymo. Googles Schwesterfirma gibt ein Terabyte davon frei - allerdings nicht für den Einsatz in Fahrzeugen.

Artikel veröffentlicht am ,
Waymo stellt gelabelte Verkehrsdaten zur Verfügung.
Waymo stellt gelabelte Verkehrsdaten zur Verfügung. (Bild: Waymo)

Die Alphabet-Tochter Waymo gewährt Forschern einen Einblick in ihre Entwicklung selbstfahrender Autos. Dazu stellt das Unternehmen eine Sammlung mit Sensordaten sowie deren Auswertung zur Verfügung. Unter waymo.com/open können Forscher und Entwickler sich ein Terabyte an Daten herunterladen, die 1.000 Fahrsequenzen von jeweils 20 Sekunden Dauer entsprechen. Bei einer Aufnahmefrequenz von 10 Hertz entspricht dies 200.000 Aufnahmen. Der Automobilzulieferer Aptiv hatte im vergangenen März mit Nuscenes einen vergleichbaren Datensatz veröffentlicht.

Stellenmarkt
  1. IT-Administrator (m/w/d) im Bereich ERP mit PHP-Skills
    EBB Truck-Center GmbH, Baden-Baden
  2. Consultant IT-Controlling (m/w/d)
    Mekyska Management Consultants GmbH, Frankfurt am Main, Pforzheim (Home-Office)
Detailsuche

Die Aufnahmen stammen laut Waymo von fünf verschiedenen Lidar-Typen sowie fünf Kameras und sind synchronisiert. Neben den Originalaufnahmen gibt es auch Datensätze mit klassifizierten Objekten. In den ausgewerteten Daten sind vier Objekttypen klassifiziert: Fahrzeuge, Fußgänger, Fahrradfahrer und Verkehrsschilder. Die Lidar-Daten enthalten zudem 12 Millionen Objekt-Labels (Erläuterung) mit einer sogenannten 3D-Bounding-Box (Begrenzungsquader) und einer Tracking-ID. Die Kameradaten enthalten 1,2 Millionen Begrenzungsrechtecke in 2D mit Tracking-ID. Das heißt, nur 100 der 1.000 Sequenzen enthalten die 2D-Labels.

Kein Einsatz in Fahrzeugen erlaubt

Waymo hat die Daten auf 40 Archivdateien verteilt, die jeweils 25 Gigabyte groß sind. Ausgepackt soll der Datensatz 1 Terabyte groß sein. Darüber hinaus stellt Waymo auf Github noch Code in C++ und Python bereit, um die Daten zu evaluieren. Dabei nutzt das Unternehmen das Framework Tensorflow. Die einzelnen Sequenzen sind etwa 1 Gigabyte groß und im Format .TFrecord abgespeichert.

Laut Waymo ist der "große, vielfältige und hochqualitative Datensatz extrem wertvoll für Forschungszwecke". Eine kommerzielle Nutzung wird in den Lizenzvereinbarungen allerdings untersagt. Doch nicht nur das: Waymo verbietet ausdrücklich die Nutzung der Daten "für den Betrieb von Fahrzeugen". Das heißt, wenn Wissenschaftler an Universitäten oder Forschungsinstituten ihre neuronalen Netze mit den Waymo-Daten trainieren, dürfen sie später die Gewichte (Erläuterung) nicht nutzen, um Testautos damit zu steuern.

Nicht nur Google gibt Daten frei

Golem Akademie
  1. IT-Fachseminare der Golem Akademie
    Live-Workshops zu Schlüsselqualifikationen
  2. 1:1-Videocoaching mit Golem Shifoo
    Berufliche Herausforderungen meistern
  3. Online-Sprachkurse mit Golem & Gymglish
    Kurze Lektionen, die funktionieren
Weitere IT-Trainings

Allerdings ist nicht ganz klar, wie Waymo das kontrollieren will. Wenn neuronale Netze mit verschiedenen Datensätzen trainiert werden, lässt sich später kaum feststellen, welche Daten dafür genutzt wurden. Ebenfalls problematisch: Wer sich als Wissenschaftler die Daten herunterlädt, nimmt damit die Lizenz für seine komplette Organisation an.

Der Autozulieferer Aptiv verwendet für seinen Datensatz die CC-Lizenz BY-NC-SA 4.0, die eine kommerzielle Nutzung ebenfalls ausschließt. Neben Waymo und Aptiv gibt es noch entsprechende Daten von Kitti (PDF), Cityscapes und Apollo/Baidu.

Wird Datenherausgabe zur Pflicht?

Waymo weist darauf hin, dass der Datensatz nicht die vollen Fähigkeiten der Sensorsysteme wiedergebe und nur einem Bruchteil der Daten entspreche, mit denen die selbstfahrenden Systeme trainiert würden. Das Unternehmen hat Anfang März 2019 angekündigt, die selbst entwickelten Lidar-Sensoren künftig zu vermarkten und für andere Anbieter zu produzieren.

Die Sammlung und Auswertung von Verkehrssituationen ist ein zentrales Element bei der Entwicklung selbstfahrender Autos. Die neuronalen Netze werden anhand von klassifizierten Aufnahmen trainiert, damit sie im Straßenverkehr die einzelnen Objekte richtig erkennen können. Die aufgenommenen Bilder müssen dafür zunächst gelabelt werden, damit das neuronale Netz anhand korrekter Zuordnungen lernt, welche Objekte welchem Klassifikator zugeordnet werden sollen.

In der Politik gab es in der Vergangenheit Überlegungen, führende Unternehmen zur Herausgabe ihrer Daten zu zwingen. Damit könnten Firmen wie Google gesetzlich verpflichtet werden, deutlich mehr Daten als die 1.000 Sequenzen für Forschungszwecke zur Verfügung zu stellen. So sagte EU-Wettbewerbskommissarin Margrethe Vestager im Frühjahr: "Anstatt über die Zerschlagung der Unternehmen sollten wir lieber darüber diskutieren, das Rohmaterial aufzuteilen, auf dem ihr Geschäftsmodell aufgebaut ist: Daten. Das könnte für Wettbewerb sorgen."

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Amazon, Gorillas & Co.
Was darf die Gig Economy?

Kündigungen per Bot, GPS-Tracking und mehr: Onlineplattformen machen nicht nur in den USA mit Hire-and-Fire-Praktiken Schlagzeilen. Auch das deutsche Arbeitsrecht schützt nicht überall.
Von Harald Büring

Amazon, Gorillas & Co.: Was darf die Gig Economy?
Artikel
  1. 25 Jahre Independence Day: Ein riesiges Raumschiff und ein riesiger Erfolg
    25 Jahre Independence Day
    Ein riesiges Raumschiff und ein riesiger Erfolg

    "Willkommen auf der Erde!" Roland Emmerichs Independence Day ist ein Klassiker des Action-Kinos und enthält einen der besten Momente der Kinogeschichte.
    Von Peter Osteried

  2. FreeBSD: Netflix streamt mit fast 400 GBit/s pro Server
    FreeBSD
    Netflix streamt mit fast 400 GBit/s pro Server

    Für sein Streaming-Angebot hat Netflix AMD-Hardware und das genutzte FreeBSD über Jahre extrem optimiert. Pläne für mehr gibt es bereits.

  3. Apple: iPhone 13 bereits mit Wartezeit
    Apple
    iPhone 13 bereits mit Wartezeit

    Das neue iPhone 13 kann bestellt werden - die Lieferzeiten liegen aber teilweise bereits bei Ende Oktober. Besser ist die Situation in den Apple Stores.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Neuer MM-Prospekt (u. a. Asus Gaming-Notebook 17" RTX 3050 1.099€) • Samsung 970 Evo Plus 1TB 99€ • Saturn Hits 2021 (u. a. Philips 55" OLED 120Hz 1.849€) • Corsair RGB 16GB Kit 3600MHz 87,90€ • Dualsense Midnight Black + Deathloop 99,99€ • Alternate (u. a. Enermax CPU-Kühler 36,99€) [Werbung]
    •  /