Azure: Microsofts Texterkennung versteht künftig auch Deutsch

Cognitive Services können aus Bildern nicht mehr nur Englisch-Texte extrahieren. Außerdem gibt es eine KI, die bei der Aussprache hilft.

Artikel veröffentlicht am ,
Dabei verstehen sich selbst Deutsche untereinander nicht  immer.
Dabei verstehen sich selbst Deutsche untereinander nicht immer. (Bild: Pixabay.com/CC0 1.0)

Entwicklerteams, die Azure Cognitive Services nutzen, können sich demnächst neue Funktionen anschauen. Microsoft veröffentlicht zur Build 2020 etwa eine Betonungsunterstützung und Sprechererkennung. Ersteres soll die Stimmlage und Betonung von Vortragenden analysieren und Tipps für eine bessere und klarere Aussprache geben. Zweitere Funktion erkennt sprechende Personen innerhalb von Meetingräumen anhand der Richtung des Audiosignals. Das könnte etwa dabei helfen, ein Konferenzsystem mit automatischer Sprechererkennung zu entwickeln.

Stellenmarkt
  1. Applikationsentwickler (m/w/d)
    Propan Rheingas GmbH & Co. KG, Brühl
  2. Product Functional Safety Manager (m/f / diverse)
    Continental AG, Lindau, Ulm, Neu-Ulm
Detailsuche

Einige andere Funktionen wurden in der Vollversion und nicht als Preview angekündigt. Für deutschsprachige Personen interessant sein könnte, dass der Computer-Vision-Dienst Read 3.0 in Zukunft auch in der Lage ist, in Deutsch geschriebene Texte aus Bildern in bearbeitbare Texte umzuwandeln, etwa Überschriften und Bezeichnungen auf gescannten Seiten und Fotos. Read 3.0 versteht zudem Französisch, Portugiesisch, Italienisch und Niederländisch. Englisch und Spanisch waren die ersten unterstützten Sprachen.

Genaueres Text-to-Speech in Azure

Der Speech-to-Text-Dienst soll in einiger Zeit für 27 neue Sprachen erscheinen. Das System soll laut Microsoft als Audiomaterial vorhandene gesprochene Sätze zu 30 Prozent genauer in schriftliche Texte umwandeln können. Verbesserungen gibt es auch bei Neural Text-to-Speech. Dieses versucht, in verschiedenen Stimmlagen und in natürlicher Betonung zu sprechen. Es gibt 15 neue Stimmen in 11 zusätzlichen Sprachen. Dabei soll die Fehlerrate um etwa 50 Prozent bei 13 Sprachen sinken. Zu den von Microsoft unterstützten Sprachen zählen neben Englisch etwa auch Italienisch, Mandarin oder Deutsch.

Cognitive Services sollen sich künftig besser in virtualisierten Umgebungen wie Containern integrieren und trainieren lassen. Zunächst wird dies für die Dienste Language Understanding und Text Analytics verfügbar sein. Ersterer teilt gesprochene Sätze in zusammenhängende Wortgruppen auf, die später von einem Bot für die Kontexterkennung genutzt werden können. Zweiterer Dienst kann Informationen aus unstrukturiertem Text herausfiltern.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Halbleiterfertigung
Keine modernen Belichtungsmaschinen mehr für China

Maschinen für EUV-Belichtung darf ASML bereits nicht mehr nach China exportieren, auch der Zugang zu älteren DUV-Anlagen soll gekappt werden.

Halbleiterfertigung: Keine modernen Belichtungsmaschinen mehr für China
Artikel
  1. Fake-Polizei-Anrufe: Bundesnetzagentur meldet starken Anstieg von Beschwerden
    Fake-Polizei-Anrufe
    Bundesnetzagentur meldet starken Anstieg von Beschwerden

    Seit März wachsen die Beschwerden stark an, weil Betrüger automatische Ansage von Polizei, BKA, Interpol oder Europol versenden. Dabei täuschen sie echte Telefonnummern vor.

  2. Games with Gold: Die Xbox-360-Neuauflagen sind alle
    Games with Gold
    Die Xbox-360-Neuauflagen sind alle

    Ab Oktober 2022 ist Schluss mit weiteren Xbox-360-Spielen in Spieleabos von Microsoft. Grund ist schlicht eine natürliche Grenze.

  3. Kryptowinter: Auch Bitcoin-Minern droht die Zahlungsunfähigkeit
    Kryptowinter
    Auch Bitcoin-Minern droht die Zahlungsunfähigkeit

    Nicht nur Bitcoin-Verleiher gehen in der Krise pleite. Auch professionelle Krypto-Mining-Unternehmen kämpfen um ihre Liquidität.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Red Friday: Mega-Rabatt-Aktion bei Media Markt • PS5 bestellbar • EVGA RTX 3090 günstig wie nie: 1.649€ • MindStar (MSI RTX 3060 429€, MSI 31,5“ WQHD 165Hz 369€) • Samsung QLED 85" günstig wie nie: 1.732,72€ • Alternate (Tower & CPU-Kühler) • Der beste 2.000€-Gaming-PC [Werbung]
    •  /