Computergestützte Protokollerstellung aus Gesprächen

Forschungsprojekt soll automatische Protokollierung ermöglichen

Computerlinguisten des Heidelberger Forschungsinstituts EML Research forschen an einem System, das in Zukunft automatisch schriftliche Gesprächsprotokolle erstellen kann. Auch Hörfunksendungen sollen mit "DIANA-Summ" (DIalog ANAphors and Summarization) einfacher archiviert werden können.

Artikel veröffentlicht am ,

Für die automatische Zusammenfassung wurde bisher die Wichtigkeit aller Wörter in einem Satz berechnet, für das Protokoll wurden dann die Sätze mit der höchsten Wertung genommen. Die Ergebnisse dieses einfachen statistischen Verfahrens sind dabei nicht immer die besten. Und gerade bei angeregten Diskussionen kann man sich gut vorstellen, dass durchaus unpassendes in den Protokollen landet.

Für die Automatisierung der meist undankbaren Aufgabe der Protokollführung arbeiten nun Computerlinguisten des gemeinnützigen Heidelberger Forschungsinstituts EML Research an neuen Verfahren zur Erkennung von wichtigen Inhalten gesprochener Sprache. Das Projekt DIANA-Summ soll mit intelligenter Software eine automatische Zusammenfassung gesprochener Dialoge ermöglichen.

Die Forscher wollen auch die typischen Probleme der gesprochenen Sprache aufgreifen. Die Unterschiede zur Schriftsprache sind recht deutlich für ein eine Spracherkennung. Diskussionen in denen die Teilnehmer unterbrochen werden, nicht vorhandene Punkte oder Kommata, das oftmals gehörte, aber für den normalen Zuhörer kaum bemerkbare "Äh" sind Hürden die das System zu nehmen hat. Auch muss es in der Lage sein, Verweiswörter (Anaphern oder Pronomen) korrekt wiederzugeben.

Informationen die vor allem aus dem Kontext ersichtlich sind: Wenn er oder sie diese oder jene Tätigkeit ausführt, muss im Protokoll ersichtlich sein, wer denn diejenige Person ist und was eigentlich diese Tätigkeit sein soll. Diese Zusammenhänge, die in einer Diskussion für die Teilnehmer wie selbstverständlich ersichtlich sind, müssen von Computersystemen erfolgreich erkannt werden. Nach der These der Wissenschaftler von EML Research, können Gespräche nicht sinnvoll zusammengefasst werden, solange es nicht möglich ist, die verschiedenen Arten von Pronomen voneinander zu unterschieden und aufzulösen.

Da Computer aber große Schwierigkeiten beim Erkennen von Zusammenhängen haben, ist es ein Ziel, dem Computer beizubringen, Pronomen aus dem Kontext heraus einzuordnen. Möglichst viele Gespräche sollen hier die Grundlage für ein umfassendes Training darstellen, zur Zeit ist es jedoch nicht möglich Computer einfach mit Gesprächen zu konfrontieren.

Am Anfang der Forschung wird eine 72-stündige Aufzeichnung von gesprochenen Dialogen genutzt, die bereits in schriftlicher Form vorliegenden Gespräche sollen so die Grundlage für die Entwicklung bilden. Damit der Computer aus ihnen lernen kann, müssen sie von Hand mit linguistischen und anderen Informationen angereichert werden. Diese Daten gehen dann zurück an das International Computer Science Institute (ICSI) in Berkeley (USA), dem Urheber der Aufzeichnung, wo sie dann auch anderen Computerlinquisten zur Verfügung stehen.

Das zunächst für zwei Jahre von der Deutschen Forschungsgemeinschaft (DFG) geförderte und von dem Sprachwissenschaftler Dr. Michael Strube geleitete Projekt soll zum Abschluss eine Komponente entwickeln, die mit Hilfe einer Spracherkennung die Verschriftlichung der Gespräche erlaubt. Für ein System, das automatische Protokolle erstellen kann, wird es jedoch noch einige Jahre brauchen. [von Andreas Sebayang]

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Verkaufsverbot
Huawei will 50-Cent-Lizenzgebühr pro AVM-Fritzbox

Huawei hat gerichtlich ein gültiges Verkaufsverbot von Fritzboxen mit Wi-Fi 6 und Wi-Fi 7 durchgesetzt. Es geht um Huaweis Patente für den Standard.

Verkaufsverbot: Huawei will 50-Cent-Lizenzgebühr pro AVM-Fritzbox
Artikel
  1. Elektro-SUV: Porsche macht den Macan deutlich aerodynamischer
    Elektro-SUV
    Porsche macht den Macan deutlich aerodynamischer

    Der vollelektrische Porsche Macan soll "in Kürze" in die Produktion gehen. Dazu hat der Sportwagenhersteller neue Details zu dem SUV genannt.

  2. The Lost Crown im Test: Prince of Persia als super spaßiger Sidescroller
    The Lost Crown im Test
    Prince of Persia als super spaßiger Sidescroller

    Kein Prinz als Held, aber sonst königlich: Prince of Persia - The Lost Crown entpuppt sich im Test als rundherum gut gemachtes Abenteuer.
    Von Peter Steinlechner

  3. Future Racing Cable: Modulares USB-Kabel lädt 240 Watt und überträgt 40 GBit/s
    Future Racing Cable
    Modulares USB-Kabel lädt 240 Watt und überträgt 40 GBit/s

    Auf Indiegogo verspricht der Hersteller, dass kein anderes USB-Kabel mehr gebraucht wird. Schließlich sei das Future Racing Cable vielseitig.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • PS5 + Spider-Man 2 569€ • AMD Ryzen 9 5950X 379€ • Switch-Controller 17,84€ • AOC 27" QHD 165Hz 229€ • MindStar: Gigabyte RTX 4070 Ti 819€ • Google -47% • Steelseries -64% • Corsair -39% • Bose -36% • 3 Spiele für 49€ • Gigabyte 27" QHD 240 Hz 399€ • EA-Spiele -66% [Werbung]
    •  /