• IT-Karriere:
  • Services:

Lex, Polly und Rekognition: Amazon integriert Alexa-KI in sein Cloud-Angebot

Mit dem eigenen Rechner oder Telefon sprechen, die Geräte geben ihre Antworten ebenso gesprochen aus: Diese Funktionen können Entwickler künftig mit Hilfe der KI in der Amazon-Cloud umsetzen. Eine Bilderkennung kann ebenfalls genutzt werden.

Artikel veröffentlicht am ,
Die Amazon-Cloud kann genutzt werden, um Bildinhalte zu erkennen.
Die Amazon-Cloud kann genutzt werden, um Bildinhalte zu erkennen. (Bild: Amazon)

In unserem Test von Amazons digitalem Sprachassistenten Alexa mit dem Gerät Echo funktionierte der Dienst schon so gut, dass wir uns sogar beim Dankesagen erwischt haben. Die zugrundeliegenden KI-Techniken von Alexa bietet Amazon künftig auch in seinem eigenen Cloud-Angebot der Web Services an.

Spracherkennung und -synthese

Stellenmarkt
  1. Schwarz Dienstleistung KG, Raum Neckarsulm
  2. CREATON GmbH, Wertingen

Mit Hilfe von Amazon Lex können Entwickler Anwendungen erstellen, die Sprachbefehle von Nutzern verstehen können. Der Dienst soll es ermöglichen, sogenannte Bots zu programmieren, die sämtliche Bestandteile einer Konversation enthalten. Die dazu notwendigen Sprachmodelle sollen automatisch erzeugt werden. Neben der Integration in Messenger wie jenen von Facebook, könnten mit Lex aber auch Web-Anwendungen gebaut werden oder Apps und Geräte, die wie Echo auf Befehle des Nutzers warten.

Damit die so erstellten Programme auch natürlich antworten können, bietet Amazon mit Polly zudem einen ausgefeilten Text-to-Speech-Dienst an. Das Team habe dabei besonders auf spezielle Eigenheiten der Sprachsynthese geachtet, etwa die unterschiedliche Aussprache von Worten, die gleich geschrieben werden.

Über die Speech Synthesis Markup Language (SSML) lässt sich das System außerdem um Informationen erweitern wie etwa einen Sprachwechsel innerhalb eines Textes. Damit könnte zum Beispiel verhindert werden, dass englische Wörter auf Deutsch ausgesprochen werden. Entwickler können für Polly aus 47 männlichen und weiblichen Stimmen in 24 Sprachen wählen. Amazon will die Vielfalt hier noch deutlich erhöhen.

Bilderkennung mit Deep Learning

Ein gutes KI-Angebot muss darüber hinaus aber auch eine Bilderkennung enthalten, wofür Amazon seinen Dienst Rekognition anbietet. Dieser basiert auf Deep-Learning-Modellen, die Amazon bereits angelernt und trainiert hat, sodass Rekognition direkt für eine Klassifizierung von Bildern genutzt werden kann. Das komplizierte und aufwändige Aufsetzen eines neuronalen Netzwerkes sowie die Trainingsphase entfallen also völlig.

Zu gegebenen Aufnahmen liefert Rekognition zu bestimmten Kategorien, wie etwa Tier oder Hund, eine dazugehörige prozentuale Wahrscheinlichkeit, was Entwickler dann weiter nutzen können. Ebenso kann der Dienst dazu genutzt werden, Gesichter in Bildern zu erkennen oder dasselbe Gesicht in mehreren Bildern wiederzufinden.

Lex steht zunächst nur in der Region US-East (Northern Virginia) zur Verfügung, Polly und Rekognition darüber hinaus auch in den Regionen US-West (Oregon) und Europa (Dublin).

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Spiele-Angebote
  1. 4,99€
  2. (-79%) 21,00€
  3. (u. a. Far Cry 5 für 14,99€, Far Cry New Dawn für 17,99€, Far Cry für 3,99€)

bernd71 02. Dez 2016

Artikel gelesen? Neu ist das Amazon seinen Text/Bild Erkennung und Ausgabe für...

HorkheimerAnders 01. Dez 2016

Ach dieser loyale Blick... Hunde sind schon was tolles :) Wobei der hier sicher ab und...


Folgen Sie uns
       


Datenbasierte Archäologie im DAI

Idai World ist ein System, um archäologische Daten aufzubereiten und online zugänglich zu machen. Benjamin Ducke vom Deutschen Archäologischen Institut stellt es vor.

Datenbasierte Archäologie im DAI Video aufrufen
Geforce Now im Test: Nvidia nutzt einzigartige CPU und GPU
Geforce Now im Test
Nvidia nutzt einzigartige CPU und GPU

Wer mit Nvidias Geforce Now spielt, bekommt laut Performance Overlay eine RTX 2060c oder RTX 2080c, tatsächlich aber werden eine Tesla RTX T10 als Grafikkarte und ein Intel CC150 als Prozessor verwendet. Die Performance ist auf die jeweiligen Spiele abgestimmt, vor allem mit Raytracing.
Ein Test von Marc Sauter

  1. Cloud Gaming Activision Blizzard zieht Spiele von Geforce Now zurück
  2. Nvidia-Spiele-Streaming Geforce Now kostet 5,49 Euro pro Monat
  3. Geforce Now Nvidias Cloud-Gaming-Dienst kommt noch 2019 für Android

Videostreaming: Was an Prime Video und Netflix nervt
Videostreaming
Was an Prime Video und Netflix nervt

Eine ständig anders sortierte Watchlist, ein automatisch startender Stream oder fehlende Markierungen für Aboinhalte: Oft sind es nur Kleinigkeiten, die den Spaß am Streaming vermiesen - eine Hassliste.
Ein IMHO von Ingo Pakalski

  1. WhatsOnFlix Smartphone-App für bessere Verwaltung der Netflix-Inhalte
  2. Netflix Staffel-2-Trailer zeigt Cyberpunk-Welt von Altered Carbon
  3. Videostreaming Netflix musste Night of the Living Dead entfernen

Leistungsschutzrecht: Drei Wörter sollen ...
Leistungsschutzrecht
Drei Wörter sollen ...

Der Vorschlag der Bundesregierung für das neue Leistungsschutzrecht stößt auf Widerstand bei den Verlegerverbänden. Überschriften mit mehr als drei Wörtern und Vorschaubilder sollen lizenzpfichtig sein. Dabei wenden die Verlage einen sehr auffälligen Argumentationstrick an.
Eine Analyse von Friedhelm Greis

  1. Leistungsschutzrecht Memes sollen nur noch 128 mal 128 Pixel groß sein
  2. Leistungsschutzrecht Französische Verlage reichen Beschwerde gegen Google ein
  3. Leistungsschutzrecht Französische Medien beschweren sich über Google

    •  /