Computergestützte Protokollerstellung aus Gesprächen

Forschungsprojekt soll automatische Protokollierung ermöglichen

Computerlinguisten des Heidelberger Forschungsinstituts EML Research forschen an einem System, das in Zukunft automatisch schriftliche Gesprächsprotokolle erstellen kann. Auch Hörfunksendungen sollen mit "DIANA-Summ" (DIalog ANAphors and Summarization) einfacher archiviert werden können.

Artikel veröffentlicht am ,

Für die automatische Zusammenfassung wurde bisher die Wichtigkeit aller Wörter in einem Satz berechnet, für das Protokoll wurden dann die Sätze mit der höchsten Wertung genommen. Die Ergebnisse dieses einfachen statistischen Verfahrens sind dabei nicht immer die besten. Und gerade bei angeregten Diskussionen kann man sich gut vorstellen, dass durchaus unpassendes in den Protokollen landet.

Stellenmarkt
  1. Domänenarchitekt (w/m/d) Komposit
    W&W Informatik GmbH, Ludwigsburg
  2. Softwareentwickler (m/w/d) mit Schwerpunkt Regelungstechnik/DSP
    KOSTAL Automobil Elektrik GmbH & Co. KG, Dortmund
Detailsuche

Für die Automatisierung der meist undankbaren Aufgabe der Protokollführung arbeiten nun Computerlinguisten des gemeinnützigen Heidelberger Forschungsinstituts EML Research an neuen Verfahren zur Erkennung von wichtigen Inhalten gesprochener Sprache. Das Projekt DIANA-Summ soll mit intelligenter Software eine automatische Zusammenfassung gesprochener Dialoge ermöglichen.

Die Forscher wollen auch die typischen Probleme der gesprochenen Sprache aufgreifen. Die Unterschiede zur Schriftsprache sind recht deutlich für ein eine Spracherkennung. Diskussionen in denen die Teilnehmer unterbrochen werden, nicht vorhandene Punkte oder Kommata, das oftmals gehörte, aber für den normalen Zuhörer kaum bemerkbare "Äh" sind Hürden die das System zu nehmen hat. Auch muss es in der Lage sein, Verweiswörter (Anaphern oder Pronomen) korrekt wiederzugeben.

Informationen die vor allem aus dem Kontext ersichtlich sind: Wenn er oder sie diese oder jene Tätigkeit ausführt, muss im Protokoll ersichtlich sein, wer denn diejenige Person ist und was eigentlich diese Tätigkeit sein soll. Diese Zusammenhänge, die in einer Diskussion für die Teilnehmer wie selbstverständlich ersichtlich sind, müssen von Computersystemen erfolgreich erkannt werden. Nach der These der Wissenschaftler von EML Research, können Gespräche nicht sinnvoll zusammengefasst werden, solange es nicht möglich ist, die verschiedenen Arten von Pronomen voneinander zu unterschieden und aufzulösen.

Golem Akademie
  1. Penetration Testing Fundamentals: virtueller Zwei-Tage-Workshop
    17.–18. Januar 2022, Virtuell
  2. AZ-104 Microsoft Azure Administrator: virtueller Vier-Tage-Workshop
    13.–16. Dezember 2021, virtuell
Weitere IT-Trainings

Da Computer aber große Schwierigkeiten beim Erkennen von Zusammenhängen haben, ist es ein Ziel, dem Computer beizubringen, Pronomen aus dem Kontext heraus einzuordnen. Möglichst viele Gespräche sollen hier die Grundlage für ein umfassendes Training darstellen, zur Zeit ist es jedoch nicht möglich Computer einfach mit Gesprächen zu konfrontieren.

Am Anfang der Forschung wird eine 72-stündige Aufzeichnung von gesprochenen Dialogen genutzt, die bereits in schriftlicher Form vorliegenden Gespräche sollen so die Grundlage für die Entwicklung bilden. Damit der Computer aus ihnen lernen kann, müssen sie von Hand mit linguistischen und anderen Informationen angereichert werden. Diese Daten gehen dann zurück an das International Computer Science Institute (ICSI) in Berkeley (USA), dem Urheber der Aufzeichnung, wo sie dann auch anderen Computerlinquisten zur Verfügung stehen.

Das zunächst für zwei Jahre von der Deutschen Forschungsgemeinschaft (DFG) geförderte und von dem Sprachwissenschaftler Dr. Michael Strube geleitete Projekt soll zum Abschluss eine Komponente entwickeln, die mit Hilfe einer Spracherkennung die Verschriftlichung der Gespräche erlaubt. Für ein System, das automatische Protokolle erstellen kann, wird es jedoch noch einige Jahre brauchen. [von Andreas Sebayang]

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Resident Evil (1996)
Grauenhaft gut

Resident Evil zeigte vor 25 Jahren, wie Horror im Videospiel auszusehen hat. Wir schauen uns den Klassiker im Golem retro_ an.

Resident Evil (1996): Grauenhaft gut
Artikel
  1. Streaming: Chromecast erhält spezielle Youtube-Fernbedienung
    Streaming
    Chromecast erhält spezielle Youtube-Fernbedienung

    Die Steuerung von Youtube auf einem Chromecast soll mit einer neuen Funktion deutlich komfortabler werden.

  2. Studie: Kinder erhalten Smartphone meist zwischen 6 und 11 Jahren
    Studie
    Kinder erhalten Smartphone meist zwischen 6 und 11 Jahren

    Nur eine sehr geringe Minderheit der Eltern will ihrem Kind erst mit 15 Jahren ein Smartphone zur Verfügung stellen.

  3. Google: Kopfhörer verlieren Google-Assistant-Support auf iPhones
    Google
    Kopfhörer verlieren Google-Assistant-Support auf iPhones

    Wer Google Assistant am Kopfhörer benutzen will, ist künftig auf ein Android-Gerät angewiesen.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Saturn-Advent: Samsung Portable SSD T5 1 TB 84€ • ViewSonic VX2718-2KPC-MHD (WQHD, 165 Hz) 229€ • EPOS Sennheiser GSP 670 199€ • EK Water Blocks Elite Aurum 360 D-RGB All in One 205,89€ • KFA2 Geforce RTX 3070 OC 8 GB 1.019€ • Alternate (u. a. AKRacing Core SX 269,98€) [Werbung]
    •  /