• IT-Karriere:
  • Services:

Autonomes Fahren: Waymo gibt Sensordaten für Forscher frei

Nur wenige Firmen haben so viele Daten für das autonome Fahren gesammelt wie Waymo. Googles Schwesterfirma gibt ein Terabyte davon frei - allerdings nicht für den Einsatz in Fahrzeugen.

Artikel veröffentlicht am ,
Waymo stellt gelabelte Verkehrsdaten zur Verfügung.
Waymo stellt gelabelte Verkehrsdaten zur Verfügung. (Bild: Waymo)

Die Alphabet-Tochter Waymo gewährt Forschern einen Einblick in ihre Entwicklung selbstfahrender Autos. Dazu stellt das Unternehmen eine Sammlung mit Sensordaten sowie deren Auswertung zur Verfügung. Unter waymo.com/open können Forscher und Entwickler sich ein Terabyte an Daten herunterladen, die 1.000 Fahrsequenzen von jeweils 20 Sekunden Dauer entsprechen. Bei einer Aufnahmefrequenz von 10 Hertz entspricht dies 200.000 Aufnahmen. Der Automobilzulieferer Aptiv hatte im vergangenen März mit Nuscenes einen vergleichbaren Datensatz veröffentlicht.

Stellenmarkt
  1. über duerenhoff GmbH, Wiener Neustadt (Österreich)
  2. Deloitte, Berlin

Die Aufnahmen stammen laut Waymo von fünf verschiedenen Lidar-Typen sowie fünf Kameras und sind synchronisiert. Neben den Originalaufnahmen gibt es auch Datensätze mit klassifizierten Objekten. In den ausgewerteten Daten sind vier Objekttypen klassifiziert: Fahrzeuge, Fußgänger, Fahrradfahrer und Verkehrsschilder. Die Lidar-Daten enthalten zudem 12 Millionen Objekt-Labels (Erläuterung) mit einer sogenannten 3D-Bounding-Box (Begrenzungsquader) und einer Tracking-ID. Die Kameradaten enthalten 1,2 Millionen Begrenzungsrechtecke in 2D mit Tracking-ID. Das heißt, nur 100 der 1.000 Sequenzen enthalten die 2D-Labels.

Kein Einsatz in Fahrzeugen erlaubt

Waymo hat die Daten auf 40 Archivdateien verteilt, die jeweils 25 Gigabyte groß sind. Ausgepackt soll der Datensatz 1 Terabyte groß sein. Darüber hinaus stellt Waymo auf Github noch Code in C++ und Python bereit, um die Daten zu evaluieren. Dabei nutzt das Unternehmen das Framework Tensorflow. Die einzelnen Sequenzen sind etwa 1 Gigabyte groß und im Format .TFrecord abgespeichert.

Laut Waymo ist der "große, vielfältige und hochqualitative Datensatz extrem wertvoll für Forschungszwecke". Eine kommerzielle Nutzung wird in den Lizenzvereinbarungen allerdings untersagt. Doch nicht nur das: Waymo verbietet ausdrücklich die Nutzung der Daten "für den Betrieb von Fahrzeugen". Das heißt, wenn Wissenschaftler an Universitäten oder Forschungsinstituten ihre neuronalen Netze mit den Waymo-Daten trainieren, dürfen sie später die Gewichte (Erläuterung) nicht nutzen, um Testautos damit zu steuern.

Nicht nur Google gibt Daten frei

Allerdings ist nicht ganz klar, wie Waymo das kontrollieren will. Wenn neuronale Netze mit verschiedenen Datensätzen trainiert werden, lässt sich später kaum feststellen, welche Daten dafür genutzt wurden. Ebenfalls problematisch: Wer sich als Wissenschaftler die Daten herunterlädt, nimmt damit die Lizenz für seine komplette Organisation an.

Der Autozulieferer Aptiv verwendet für seinen Datensatz die CC-Lizenz BY-NC-SA 4.0, die eine kommerzielle Nutzung ebenfalls ausschließt. Neben Waymo und Aptiv gibt es noch entsprechende Daten von Kitti (PDF), Cityscapes und Apollo/Baidu.

Wird Datenherausgabe zur Pflicht?

Waymo weist darauf hin, dass der Datensatz nicht die vollen Fähigkeiten der Sensorsysteme wiedergebe und nur einem Bruchteil der Daten entspreche, mit denen die selbstfahrenden Systeme trainiert würden. Das Unternehmen hat Anfang März 2019 angekündigt, die selbst entwickelten Lidar-Sensoren künftig zu vermarkten und für andere Anbieter zu produzieren.

Die Sammlung und Auswertung von Verkehrssituationen ist ein zentrales Element bei der Entwicklung selbstfahrender Autos. Die neuronalen Netze werden anhand von klassifizierten Aufnahmen trainiert, damit sie im Straßenverkehr die einzelnen Objekte richtig erkennen können. Die aufgenommenen Bilder müssen dafür zunächst gelabelt werden, damit das neuronale Netz anhand korrekter Zuordnungen lernt, welche Objekte welchem Klassifikator zugeordnet werden sollen.

In der Politik gab es in der Vergangenheit Überlegungen, führende Unternehmen zur Herausgabe ihrer Daten zu zwingen. Damit könnten Firmen wie Google gesetzlich verpflichtet werden, deutlich mehr Daten als die 1.000 Sequenzen für Forschungszwecke zur Verfügung zu stellen. So sagte EU-Wettbewerbskommissarin Margrethe Vestager im Frühjahr: "Anstatt über die Zerschlagung der Unternehmen sollten wir lieber darüber diskutieren, das Rohmaterial aufzuteilen, auf dem ihr Geschäftsmodell aufgebaut ist: Daten. Das könnte für Wettbewerb sorgen."

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Top-Angebote
  1. (aktuell u. a. Asus XG248Q LED-Monitor 389,00€ (Bestpreis!), Emtec SSD 120 GB 15,79€, Xiaomi...
  2. (u.a. Samsung Galaxy Tab A für 195,00€, Huawei MediaPad M5 Lite für 189,00€, Lenovo Tab E10...
  3. 899,00€ (Bestpreis!)
  4. 99,99€

Raenef 22. Aug 2019

Da stand Gewichtung nicht für Testautos nutzen... Heißt ich darf das Rezept nicht zum...


Folgen Sie uns
       


SSD-Kompendium

Sie werden alle SSDs genannt und doch gibt es gravierende Unterschiede. Golem.de-Hardware-Redakteur Marc Sauter stellt die unterschiedlichen Formfaktoren vor, spricht über Protokolle, die Geschwindigkeit und den Preis.

SSD-Kompendium Video aufrufen
Interview: Die Liebe für den Flight Simulator war immer da
Interview
"Die Liebe für den Flight Simulator war immer da"

Die prozedural erstellte Erde, der Quellcode vom letzten MS-Flugsimulator und eine Gemeinsamkeit mit Star Citizen: Golem.de hat mit Jörg Neumann über Technik und das Fliegen gesprochen. Neumann leitet bei Microsoft die Entwicklung des Flight Simulator.
Ein Interview von Peter Steinlechner

  1. Flug-Simulation Microsoft bereitet Alphatest des Flight Simulator vor
  2. Microsoft Neuer Flight Simulator soll Fokus auf Simulation legen

Cloud Gaming im Test: Leise ruckelt der Stream
Cloud Gaming im Test
Leise ruckelt der Stream

Kurz vor Weihnachten werben Dienste wie Google Stadia und Playstation Now um Kunden - mit noch nicht ganz perfekter Technik. Golem.de hat Cloud Gaming bei mehreren Anbietern ausprobiert und stellt Geschäftsmodelle und Besonderheiten vor.
Von Peter Steinlechner

  1. Apple und Google Die wollen nicht nur spielen
  2. Medienbericht Twitch plant Spielestreaming ab 2020
  3. Spielestreaming Wie archiviert man Games ohne Datenträger?

Smarter Akku-Lautsprecher im Praxistest: Bose zeigt Sonos, wie es geht
Smarter Akku-Lautsprecher im Praxistest
Bose zeigt Sonos, wie es geht

Der Portable Home Speaker ist Boses erster smarter Lautsprecher mit Akkubetrieb. Aus dem kompakten Gehäuse wird ein toller Klang und eine lange Akkulaufzeit geholt. Er kann anders als der Sonos Move sinnvoll als smarter Lautsprecher verwendet werden. Ganz ohne Schwächen ist er aber nicht.
Ein Praxistest von Ingo Pakalski

  1. ANC-Kopfhörer Bose macht die Noise Cancelling Headphones 700 besser
  2. Anti-Schnarch-Kopfhörer Bose stellt Sleepbuds wegen Qualitätsmängeln ein
  3. Noise Cancelling Headphones 700 im Test Boses bester ANC-Kopfhörer sticht Sony vielfach aus

    •  /