Autonomes Fahren: Waymo gibt Sensordaten für Forscher frei

Nur wenige Firmen haben so viele Daten für das autonome Fahren gesammelt wie Waymo. Googles Schwesterfirma gibt ein Terabyte davon frei - allerdings nicht für den Einsatz in Fahrzeugen.

Artikel veröffentlicht am ,
Waymo stellt gelabelte Verkehrsdaten zur Verfügung.
Waymo stellt gelabelte Verkehrsdaten zur Verfügung. (Bild: Waymo)

Die Alphabet-Tochter Waymo gewährt Forschern einen Einblick in ihre Entwicklung selbstfahrender Autos. Dazu stellt das Unternehmen eine Sammlung mit Sensordaten sowie deren Auswertung zur Verfügung. Unter waymo.com/open können Forscher und Entwickler sich ein Terabyte an Daten herunterladen, die 1.000 Fahrsequenzen von jeweils 20 Sekunden Dauer entsprechen. Bei einer Aufnahmefrequenz von 10 Hertz entspricht dies 200.000 Aufnahmen. Der Automobilzulieferer Aptiv hatte im vergangenen März mit Nuscenes einen vergleichbaren Datensatz veröffentlicht.

Stellenmarkt
  1. IT-Auditor / CISA (m/w/d)
    Becker Büttner Held Rechtsanwälte Wirtschaftsprüfer Steuerberater PartGmbB, München
  2. Scrum Master (m/w/d)
    Scheidt & Bachmann System Technik GmbH, Kiel
Detailsuche

Die Aufnahmen stammen laut Waymo von fünf verschiedenen Lidar-Typen sowie fünf Kameras und sind synchronisiert. Neben den Originalaufnahmen gibt es auch Datensätze mit klassifizierten Objekten. In den ausgewerteten Daten sind vier Objekttypen klassifiziert: Fahrzeuge, Fußgänger, Fahrradfahrer und Verkehrsschilder. Die Lidar-Daten enthalten zudem 12 Millionen Objekt-Labels (Erläuterung) mit einer sogenannten 3D-Bounding-Box (Begrenzungsquader) und einer Tracking-ID. Die Kameradaten enthalten 1,2 Millionen Begrenzungsrechtecke in 2D mit Tracking-ID. Das heißt, nur 100 der 1.000 Sequenzen enthalten die 2D-Labels.

Kein Einsatz in Fahrzeugen erlaubt

Waymo hat die Daten auf 40 Archivdateien verteilt, die jeweils 25 Gigabyte groß sind. Ausgepackt soll der Datensatz 1 Terabyte groß sein. Darüber hinaus stellt Waymo auf Github noch Code in C++ und Python bereit, um die Daten zu evaluieren. Dabei nutzt das Unternehmen das Framework Tensorflow. Die einzelnen Sequenzen sind etwa 1 Gigabyte groß und im Format .TFrecord abgespeichert.

Laut Waymo ist der "große, vielfältige und hochqualitative Datensatz extrem wertvoll für Forschungszwecke". Eine kommerzielle Nutzung wird in den Lizenzvereinbarungen allerdings untersagt. Doch nicht nur das: Waymo verbietet ausdrücklich die Nutzung der Daten "für den Betrieb von Fahrzeugen". Das heißt, wenn Wissenschaftler an Universitäten oder Forschungsinstituten ihre neuronalen Netze mit den Waymo-Daten trainieren, dürfen sie später die Gewichte (Erläuterung) nicht nutzen, um Testautos damit zu steuern.

Nicht nur Google gibt Daten frei

Golem Akademie
  1. IT-Fachseminare der Golem Akademie
    Live-Workshops zu Schlüsselqualifikationen
  2. 1:1-Videocoaching mit Golem Shifoo
    Berufliche Herausforderungen meistern
  3. Online-Sprachkurse mit Golem & Gymglish
    Kurze Lektionen, die funktionieren
Weitere IT-Trainings

Allerdings ist nicht ganz klar, wie Waymo das kontrollieren will. Wenn neuronale Netze mit verschiedenen Datensätzen trainiert werden, lässt sich später kaum feststellen, welche Daten dafür genutzt wurden. Ebenfalls problematisch: Wer sich als Wissenschaftler die Daten herunterlädt, nimmt damit die Lizenz für seine komplette Organisation an.

Der Autozulieferer Aptiv verwendet für seinen Datensatz die CC-Lizenz BY-NC-SA 4.0, die eine kommerzielle Nutzung ebenfalls ausschließt. Neben Waymo und Aptiv gibt es noch entsprechende Daten von Kitti (PDF), Cityscapes und Apollo/Baidu.

Wird Datenherausgabe zur Pflicht?

Waymo weist darauf hin, dass der Datensatz nicht die vollen Fähigkeiten der Sensorsysteme wiedergebe und nur einem Bruchteil der Daten entspreche, mit denen die selbstfahrenden Systeme trainiert würden. Das Unternehmen hat Anfang März 2019 angekündigt, die selbst entwickelten Lidar-Sensoren künftig zu vermarkten und für andere Anbieter zu produzieren.

Die Sammlung und Auswertung von Verkehrssituationen ist ein zentrales Element bei der Entwicklung selbstfahrender Autos. Die neuronalen Netze werden anhand von klassifizierten Aufnahmen trainiert, damit sie im Straßenverkehr die einzelnen Objekte richtig erkennen können. Die aufgenommenen Bilder müssen dafür zunächst gelabelt werden, damit das neuronale Netz anhand korrekter Zuordnungen lernt, welche Objekte welchem Klassifikator zugeordnet werden sollen.

In der Politik gab es in der Vergangenheit Überlegungen, führende Unternehmen zur Herausgabe ihrer Daten zu zwingen. Damit könnten Firmen wie Google gesetzlich verpflichtet werden, deutlich mehr Daten als die 1.000 Sequenzen für Forschungszwecke zur Verfügung zu stellen. So sagte EU-Wettbewerbskommissarin Margrethe Vestager im Frühjahr: "Anstatt über die Zerschlagung der Unternehmen sollten wir lieber darüber diskutieren, das Rohmaterial aufzuteilen, auf dem ihr Geschäftsmodell aufgebaut ist: Daten. Das könnte für Wettbewerb sorgen."

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Thinkpad X1 Extreme Gen 4 im Test
Das beste Notebook in 16 Zoll kommt von Lenovo

Kaum ein Thinkpad hat ein besseres Panel verbaut als das X1 Extreme. Auch generell ist es ein sehr gutes Gerät - wenn Geld keine Rolle spielt.
Ein Test von Oliver Nickel

Thinkpad X1 Extreme Gen 4 im Test: Das beste Notebook in 16 Zoll kommt von Lenovo
Artikel
  1. Geekbench & GFXBench: Erste Benchmarks zeigen starken Apple M1 Max
    Geekbench & GFXBench
    Erste Benchmarks zeigen starken Apple M1 Max

    Das Apple Silicon schneidet gut ab: Der M1 Max legt sich tatsächlich mit einer Geforce RTX 3080 Mobile und den schnellsten Laptop-CPUs an.

  2. God of War: Kriegsgott Kratos kämpft sich auf PCs
    God of War
    Kriegsgott Kratos kämpft sich auf PCs

    Bislang ist God of War nur für Playstation erhältlich, nun kündigt Sony eine PC-Version an - wohl nicht zufällig vor dem Start von Ragnarök.

  3. Microsoft: Android-Apps laufen jetzt auf Windows 11
    Microsoft
    Android-Apps laufen jetzt auf Windows 11

    Microsoft hat das Windows Subsystem für Android offiziell vorgestellt. Vorerst läuft die Technik aber nur in den USA.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • PS5 & Xbox Series X bestellbar • HP Herbst Sale bei NBB: Bis zu 500€ Rabatt auf Gaming-Notebooks, Monitore uvm. • Kingston RGB 32GB Kit 3200 116,90€ • LG OLED48A19LA 756,29€ • Nur noch heute: GP Anniversary Sale • Amazon Music Unltd. 3 Monate gratis • Gutscheinheft bei Saturn [Werbung]
    •  /