• IT-Karriere:
  • Services:

Computergestützte Protokollerstellung aus Gesprächen

Forschungsprojekt soll automatische Protokollierung ermöglichen

Computerlinguisten des Heidelberger Forschungsinstituts EML Research forschen an einem System, das in Zukunft automatisch schriftliche Gesprächsprotokolle erstellen kann. Auch Hörfunksendungen sollen mit "DIANA-Summ" (DIalog ANAphors and Summarization) einfacher archiviert werden können.

Artikel veröffentlicht am ,

Für die automatische Zusammenfassung wurde bisher die Wichtigkeit aller Wörter in einem Satz berechnet, für das Protokoll wurden dann die Sätze mit der höchsten Wertung genommen. Die Ergebnisse dieses einfachen statistischen Verfahrens sind dabei nicht immer die besten. Und gerade bei angeregten Diskussionen kann man sich gut vorstellen, dass durchaus unpassendes in den Protokollen landet.

Stellenmarkt
  1. Energie Südbayern GmbH, München
  2. Lufthansa Industry Solutions AS GmbH, Norderstedt

Für die Automatisierung der meist undankbaren Aufgabe der Protokollführung arbeiten nun Computerlinguisten des gemeinnützigen Heidelberger Forschungsinstituts EML Research an neuen Verfahren zur Erkennung von wichtigen Inhalten gesprochener Sprache. Das Projekt DIANA-Summ soll mit intelligenter Software eine automatische Zusammenfassung gesprochener Dialoge ermöglichen.

Die Forscher wollen auch die typischen Probleme der gesprochenen Sprache aufgreifen. Die Unterschiede zur Schriftsprache sind recht deutlich für ein eine Spracherkennung. Diskussionen in denen die Teilnehmer unterbrochen werden, nicht vorhandene Punkte oder Kommata, das oftmals gehörte, aber für den normalen Zuhörer kaum bemerkbare "Äh" sind Hürden die das System zu nehmen hat. Auch muss es in der Lage sein, Verweiswörter (Anaphern oder Pronomen) korrekt wiederzugeben.

Informationen die vor allem aus dem Kontext ersichtlich sind: Wenn er oder sie diese oder jene Tätigkeit ausführt, muss im Protokoll ersichtlich sein, wer denn diejenige Person ist und was eigentlich diese Tätigkeit sein soll. Diese Zusammenhänge, die in einer Diskussion für die Teilnehmer wie selbstverständlich ersichtlich sind, müssen von Computersystemen erfolgreich erkannt werden. Nach der These der Wissenschaftler von EML Research, können Gespräche nicht sinnvoll zusammengefasst werden, solange es nicht möglich ist, die verschiedenen Arten von Pronomen voneinander zu unterschieden und aufzulösen.

Da Computer aber große Schwierigkeiten beim Erkennen von Zusammenhängen haben, ist es ein Ziel, dem Computer beizubringen, Pronomen aus dem Kontext heraus einzuordnen. Möglichst viele Gespräche sollen hier die Grundlage für ein umfassendes Training darstellen, zur Zeit ist es jedoch nicht möglich Computer einfach mit Gesprächen zu konfrontieren.

Am Anfang der Forschung wird eine 72-stündige Aufzeichnung von gesprochenen Dialogen genutzt, die bereits in schriftlicher Form vorliegenden Gespräche sollen so die Grundlage für die Entwicklung bilden. Damit der Computer aus ihnen lernen kann, müssen sie von Hand mit linguistischen und anderen Informationen angereichert werden. Diese Daten gehen dann zurück an das International Computer Science Institute (ICSI) in Berkeley (USA), dem Urheber der Aufzeichnung, wo sie dann auch anderen Computerlinquisten zur Verfügung stehen.

Das zunächst für zwei Jahre von der Deutschen Forschungsgemeinschaft (DFG) geförderte und von dem Sprachwissenschaftler Dr. Michael Strube geleitete Projekt soll zum Abschluss eine Komponente entwickeln, die mit Hilfe einer Spracherkennung die Verschriftlichung der Gespräche erlaubt. Für ein System, das automatische Protokolle erstellen kann, wird es jedoch noch einige Jahre brauchen. [von Andreas Sebayang]

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Hardware-Angebote
  1. täglich neue Deals bei Alternate.de

md7514 13. Apr 2005

Soweit stimme ich zu. Allerdings koennen Sie davon ausgehen, dass entsprechende...


Folgen Sie uns
       


Elektrifizierte Tiefgarage von Netze BW angesehen

Wir haben uns ein Testprojekt für eine elektrifizierte Tiefgarage im baden-württembergischen Tamm zeigen lassen.

Elektrifizierte Tiefgarage von Netze BW angesehen Video aufrufen
Nitropad im Test: Ein sicherer Laptop, der im Alltag kaum nervt
Nitropad im Test
Ein sicherer Laptop, der im Alltag kaum nervt

Das Nitropad schützt vor Bios-Rootkits oder Evil-Maid-Angriffen. Dazu setzt es auf die freie Firmware Coreboot, die mit einem Nitrokey überprüft wird. Das ist im Alltag erstaunlich einfach, nur Updates werden etwas aufwendiger.
Ein Praxistest von Moritz Tremmel und Sebastian Grüner

  1. Nitropad X230 Nitrokey veröffentlicht abgesicherten Laptop
  2. LVFS Coreboot-Updates sollen nutzerfreundlich werden
  3. Linux-Laptop System 76 verkauft zwei Laptops mit Coreboot

Geforce Now im Test: Nvidia nutzt einzigartige CPU und GPU
Geforce Now im Test
Nvidia nutzt einzigartige CPU und GPU

Wer mit Nvidias Geforce Now spielt, bekommt laut Performance Overlay eine RTX 2060c oder RTX 2080c, tatsächlich aber werden eine Tesla RTX T10 als Grafikkarte und ein Intel CC150 als Prozessor verwendet. Die Performance ist auf die jeweiligen Spiele abgestimmt, vor allem mit Raytracing.
Ein Test von Marc Sauter

  1. Cloud Gaming Activision Blizzard zieht Spiele von Geforce Now zurück
  2. Nvidia-Spiele-Streaming Geforce Now kostet 5,49 Euro pro Monat
  3. Geforce Now Nvidias Cloud-Gaming-Dienst kommt noch 2019 für Android

Leistungsschutzrecht: Drei Wörter sollen ...
Leistungsschutzrecht
Drei Wörter sollen ...

Der Vorschlag der Bundesregierung für das neue Leistungsschutzrecht stößt auf Widerstand bei den Verlegerverbänden. Überschriften mit mehr als drei Wörtern und Vorschaubilder sollen lizenzpfichtig sein. Dabei wenden die Verlage einen sehr auffälligen Argumentationstrick an.
Eine Analyse von Friedhelm Greis

  1. Leistungsschutzrecht Memes sollen nur noch 128 mal 128 Pixel groß sein
  2. Leistungsschutzrecht Französische Verlage reichen Beschwerde gegen Google ein
  3. Leistungsschutzrecht Französische Medien beschweren sich über Google

    •  /