• IT-Karriere:
  • Services:

Autonomes Fahren: Waymo gibt Sensordaten für Forscher frei

Nur wenige Firmen haben so viele Daten für das autonome Fahren gesammelt wie Waymo. Googles Schwesterfirma gibt ein Terabyte davon frei - allerdings nicht für den Einsatz in Fahrzeugen.

Artikel veröffentlicht am ,
Waymo stellt gelabelte Verkehrsdaten zur Verfügung.
Waymo stellt gelabelte Verkehrsdaten zur Verfügung. (Bild: Waymo)

Die Alphabet-Tochter Waymo gewährt Forschern einen Einblick in ihre Entwicklung selbstfahrender Autos. Dazu stellt das Unternehmen eine Sammlung mit Sensordaten sowie deren Auswertung zur Verfügung. Unter waymo.com/open können Forscher und Entwickler sich ein Terabyte an Daten herunterladen, die 1.000 Fahrsequenzen von jeweils 20 Sekunden Dauer entsprechen. Bei einer Aufnahmefrequenz von 10 Hertz entspricht dies 200.000 Aufnahmen. Der Automobilzulieferer Aptiv hatte im vergangenen März mit Nuscenes einen vergleichbaren Datensatz veröffentlicht.

Stellenmarkt
  1. Hays AG, Hamburg
  2. AKDB Anstalt für kommunale Datenverarbeitung in Bayern, München, Regensburg

Die Aufnahmen stammen laut Waymo von fünf verschiedenen Lidar-Typen sowie fünf Kameras und sind synchronisiert. Neben den Originalaufnahmen gibt es auch Datensätze mit klassifizierten Objekten. In den ausgewerteten Daten sind vier Objekttypen klassifiziert: Fahrzeuge, Fußgänger, Fahrradfahrer und Verkehrsschilder. Die Lidar-Daten enthalten zudem 12 Millionen Objekt-Labels (Erläuterung) mit einer sogenannten 3D-Bounding-Box (Begrenzungsquader) und einer Tracking-ID. Die Kameradaten enthalten 1,2 Millionen Begrenzungsrechtecke in 2D mit Tracking-ID. Das heißt, nur 100 der 1.000 Sequenzen enthalten die 2D-Labels.

Kein Einsatz in Fahrzeugen erlaubt

Waymo hat die Daten auf 40 Archivdateien verteilt, die jeweils 25 Gigabyte groß sind. Ausgepackt soll der Datensatz 1 Terabyte groß sein. Darüber hinaus stellt Waymo auf Github noch Code in C++ und Python bereit, um die Daten zu evaluieren. Dabei nutzt das Unternehmen das Framework Tensorflow. Die einzelnen Sequenzen sind etwa 1 Gigabyte groß und im Format .TFrecord abgespeichert.

Laut Waymo ist der "große, vielfältige und hochqualitative Datensatz extrem wertvoll für Forschungszwecke". Eine kommerzielle Nutzung wird in den Lizenzvereinbarungen allerdings untersagt. Doch nicht nur das: Waymo verbietet ausdrücklich die Nutzung der Daten "für den Betrieb von Fahrzeugen". Das heißt, wenn Wissenschaftler an Universitäten oder Forschungsinstituten ihre neuronalen Netze mit den Waymo-Daten trainieren, dürfen sie später die Gewichte (Erläuterung) nicht nutzen, um Testautos damit zu steuern.

Nicht nur Google gibt Daten frei

Allerdings ist nicht ganz klar, wie Waymo das kontrollieren will. Wenn neuronale Netze mit verschiedenen Datensätzen trainiert werden, lässt sich später kaum feststellen, welche Daten dafür genutzt wurden. Ebenfalls problematisch: Wer sich als Wissenschaftler die Daten herunterlädt, nimmt damit die Lizenz für seine komplette Organisation an.

Der Autozulieferer Aptiv verwendet für seinen Datensatz die CC-Lizenz BY-NC-SA 4.0, die eine kommerzielle Nutzung ebenfalls ausschließt. Neben Waymo und Aptiv gibt es noch entsprechende Daten von Kitti (PDF), Cityscapes und Apollo/Baidu.

Wird Datenherausgabe zur Pflicht?

Waymo weist darauf hin, dass der Datensatz nicht die vollen Fähigkeiten der Sensorsysteme wiedergebe und nur einem Bruchteil der Daten entspreche, mit denen die selbstfahrenden Systeme trainiert würden. Das Unternehmen hat Anfang März 2019 angekündigt, die selbst entwickelten Lidar-Sensoren künftig zu vermarkten und für andere Anbieter zu produzieren.

Die Sammlung und Auswertung von Verkehrssituationen ist ein zentrales Element bei der Entwicklung selbstfahrender Autos. Die neuronalen Netze werden anhand von klassifizierten Aufnahmen trainiert, damit sie im Straßenverkehr die einzelnen Objekte richtig erkennen können. Die aufgenommenen Bilder müssen dafür zunächst gelabelt werden, damit das neuronale Netz anhand korrekter Zuordnungen lernt, welche Objekte welchem Klassifikator zugeordnet werden sollen.

In der Politik gab es in der Vergangenheit Überlegungen, führende Unternehmen zur Herausgabe ihrer Daten zu zwingen. Damit könnten Firmen wie Google gesetzlich verpflichtet werden, deutlich mehr Daten als die 1.000 Sequenzen für Forschungszwecke zur Verfügung zu stellen. So sagte EU-Wettbewerbskommissarin Margrethe Vestager im Frühjahr: "Anstatt über die Zerschlagung der Unternehmen sollten wir lieber darüber diskutieren, das Rohmaterial aufzuteilen, auf dem ihr Geschäftsmodell aufgebaut ist: Daten. Das könnte für Wettbewerb sorgen."

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Spiele-Angebote
  1. 7,99€
  2. (-91%) 1,20€
  3. 13,49€

Raenef 22. Aug 2019

Da stand Gewichtung nicht für Testautos nutzen... Heißt ich darf das Rezept nicht zum...


Folgen Sie uns
       


Asus-Gaming-Monitor mit 43 Zoll Diagonale - Test

Zwar ist der PG43UQ mit seinen 43 Zoll noch immer ziemlich riesig, er passt aber zumindest noch gut auf den Schreibtisch. Und dort überrascht der Asus-Monitor mit einer guten Farbdarstellung und hoher Helligkeit.

Asus-Gaming-Monitor mit 43 Zoll Diagonale - Test Video aufrufen
    •  /