Maschinen lesen das Internet
US-Unternehmen entwickelt Internet-Analysewerkzeug für die US-Armee
Das US-Unternehmen BBN Technologies entwickelt im Auftrag der DARPA ein Machinenlesesystem. Es soll automatisch Websites in verschiedenen Sprachen auswerten und die Informationen so aufbereiten, dass Geheimdienstmitarbeiter sie lesen können.
Wie praktisch wäre es, all die Wissensschätze im Netz zu heben, ohne jede Seite, von deren Existenz man nicht einmal weiß, besuchen zu müssen. Das hat sich auch die Defense Advanced Research Projects Agency (DARPA), die Forschungsagentur des US-Verteidigungsministeriums, gedacht und das Machine Reading Program ins Leben gerufen. Ziel ist ein System, das Websites durchsucht und ihre Inhalte so aufbereitet, dass andere Maschinen oder Menschen sie auswerten können.
Die ARPA hat das US-Unternehmen BBN Technologies damit beauftragt, eine solche Netzlesemaschine zu entwickeln. BBN will Techniken entwickeln, die "Beziehungen und Grundsätze direkt aus dem Text extrahieren" und dann "in formale Repräsentationen" übersetzen, die KI-Systeme lesen und verarbeiten können. Das Entwicklungsprogramm ist auf fünf Jahre angelegt.
Mit einem solchen Lesesystem möchte die DARPA automatisch die Aktivitäten von anderen Staaten und Organisationen überwachen. Die Idee ist, dass das Lesesystem Texte aus dem Web analysiert, die Informationen mit vorhandenen Datenbanken oder Ontologien, etwa über terroristische Gruppen, abgleicht und daraus ein Dossier für menschliche Analysten oder KI-Systeme anfertigt. Das System könne aber auch für zivile Zwecke eingesetzt werden, so BBN: In einer Zeit, da Bibliotheken über immer mehr digitale Inhalte verfügen, könnten Wissenschaftler es für umfangreiche historische Forschungen nutzen.
BBN verfügt bereits über Erfahrungen mit der Verarbeitung von natürlicher Sprache: Das Unternehmen hat ein System zur Archivierung von Fernsehprogrammen entwickelt. Das Broadcast Monitoring System zeichnet ausländische Fernsehsendungen auf. Dabei wird der gesprochene Text gleich in Schriftform gewandelt, indiziert und ins Englische übersetzt. So legt das System ein durchsuchbares Archiv mit Fernsehsendungen an.
Ein solches System könne "viele Risiken beseitigen, denen sich unser Militär gegenübersieht, zum Beispiel fehlendes Verständnis für lokale Sitten und Bräuche. Und es würde uns die Fähigkeit verleihen, die weltweiten technischen Entwicklungen ständig im Auge zu behalten", sagte Prem Natarajan, Bereichsleiter für Spracherkennung und -verarbeitung.






Danke, das war toll!!!
Ich hatte mich auch grade gewundert: Wtf soll der Bot im mpeg, avi, $filmformat und png...
Wenn Microsoft den Auftrag hätte, wäre es nichtmal nötig gewesen, es als Ironie zu...
Jeder robot entscheidet selbst, ob er sich an die robots.txt hält oder nicht. Also ist...
Er hat meinen Tag gemacht.
Kommentieren