Azure: Microsofts Texterkennung versteht künftig auch Deutsch

Cognitive Services können aus Bildern nicht mehr nur Englisch-Texte extrahieren. Außerdem gibt es eine KI, die bei der Aussprache hilft.

Artikel veröffentlicht am ,
Dabei verstehen sich selbst Deutsche untereinander nicht  immer.
Dabei verstehen sich selbst Deutsche untereinander nicht immer. (Bild: Pixabay.com/CC0 1.0)

Entwicklerteams, die Azure Cognitive Services nutzen, können sich demnächst neue Funktionen anschauen. Microsoft veröffentlicht zur Build 2020 etwa eine Betonungsunterstützung und Sprechererkennung. Ersteres soll die Stimmlage und Betonung von Vortragenden analysieren und Tipps für eine bessere und klarere Aussprache geben. Zweitere Funktion erkennt sprechende Personen innerhalb von Meetingräumen anhand der Richtung des Audiosignals. Das könnte etwa dabei helfen, ein Konferenzsystem mit automatischer Sprechererkennung zu entwickeln.

Stellenmarkt
  1. IT-Anwendungsbetreuer klinische Systeme (m/w/d)
    Helios IT Service GmbH, Zerbst
  2. Produktmanager (m/w/d) FIT-Connect
    Föderale IT-Kooperation (FITKO), Frankfurt am Main
Detailsuche

Einige andere Funktionen wurden in der Vollversion und nicht als Preview angekündigt. Für deutschsprachige Personen interessant sein könnte, dass der Computer-Vision-Dienst Read 3.0 in Zukunft auch in der Lage ist, in Deutsch geschriebene Texte aus Bildern in bearbeitbare Texte umzuwandeln, etwa Überschriften und Bezeichnungen auf gescannten Seiten und Fotos. Read 3.0 versteht zudem Französisch, Portugiesisch, Italienisch und Niederländisch. Englisch und Spanisch waren die ersten unterstützten Sprachen.

Genaueres Text-to-Speech in Azure

Der Speech-to-Text-Dienst soll in einiger Zeit für 27 neue Sprachen erscheinen. Das System soll laut Microsoft als Audiomaterial vorhandene gesprochene Sätze zu 30 Prozent genauer in schriftliche Texte umwandeln können. Verbesserungen gibt es auch bei Neural Text-to-Speech. Dieses versucht, in verschiedenen Stimmlagen und in natürlicher Betonung zu sprechen. Es gibt 15 neue Stimmen in 11 zusätzlichen Sprachen. Dabei soll die Fehlerrate um etwa 50 Prozent bei 13 Sprachen sinken. Zu den von Microsoft unterstützten Sprachen zählen neben Englisch etwa auch Italienisch, Mandarin oder Deutsch.

Cognitive Services sollen sich künftig besser in virtualisierten Umgebungen wie Containern integrieren und trainieren lassen. Zunächst wird dies für die Dienste Language Understanding und Text Analytics verfügbar sein. Ersterer teilt gesprochene Sätze in zusammenhängende Wortgruppen auf, die später von einem Bot für die Kontexterkennung genutzt werden können. Zweiterer Dienst kann Informationen aus unstrukturiertem Text herausfiltern.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Victorian Big Battery
Tesla-Speicher brannte vier Tage lang

Viel Aufwand war nötig, um das brennende Akku-Modul zu löschen.

Victorian Big Battery: Tesla-Speicher brannte vier Tage lang
Artikel
  1. Android: Googles Tensor-SoC ist eine halbe Mogelpackung
    Android
    Googles Tensor-SoC ist eine halbe Mogelpackung

    Für seinen ersten eigenen Smartphone-Chip liefert Google ausschließlich Erwartbares und dämpft damit sämtliche Hoffnungen an besseren Support und gute Linux-Treiber.
    Ein IMHO von Sebastian Grüner

  2. Apple-Tastatur: Magic Keyboard mit Touch ID jetzt ohne iMac erhältlich
    Apple-Tastatur
    Magic Keyboard mit Touch ID jetzt ohne iMac erhältlich

    Apple verkauft das Magic Keyboard mit Fingerabdruckscanner Touch ID nun auch einzeln - mit und ohne Ziffernblock.

  3. Windows 365: Der mietbare Cloud-PC mit Windows kann bestellt werden
    Windows 365
    Der mietbare Cloud-PC mit Windows kann bestellt werden

    Microsoft startet mit Windows 365 und gibt Preise für den Cloud-PC bekannt. Die VMs sollen wie physische Windows-PCs funktionieren.


Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Schnäppchen • Speicherwoche bei Saturn Samsung • C27RG54FQU, 27 Zoll, curved 203,55€ • Bosch Professional Werkzeuge und Messtechnik • Samsung Galaxy Vorbesteller-Aktion • Speicherwoche bei Media Markt • 15% auf Xiaomi-Technik • Hisense UHD-Fernseher • Saturn: 1 Produkt zahlen, 2 erhalten [Werbung]
    •  /