Abo
  • IT-Karriere:

Lex, Polly und Rekognition: Amazon integriert Alexa-KI in sein Cloud-Angebot

Mit dem eigenen Rechner oder Telefon sprechen, die Geräte geben ihre Antworten ebenso gesprochen aus: Diese Funktionen können Entwickler künftig mit Hilfe der KI in der Amazon-Cloud umsetzen. Eine Bilderkennung kann ebenfalls genutzt werden.

Artikel veröffentlicht am ,
Die Amazon-Cloud kann genutzt werden, um Bildinhalte zu erkennen.
Die Amazon-Cloud kann genutzt werden, um Bildinhalte zu erkennen. (Bild: Amazon)

In unserem Test von Amazons digitalem Sprachassistenten Alexa mit dem Gerät Echo funktionierte der Dienst schon so gut, dass wir uns sogar beim Dankesagen erwischt haben. Die zugrundeliegenden KI-Techniken von Alexa bietet Amazon künftig auch in seinem eigenen Cloud-Angebot der Web Services an.

Spracherkennung und -synthese

Stellenmarkt
  1. Sedus Stoll AG, Dogern
  2. SCHOTT Schweiz AG, St. Gallen (Schweiz)

Mit Hilfe von Amazon Lex können Entwickler Anwendungen erstellen, die Sprachbefehle von Nutzern verstehen können. Der Dienst soll es ermöglichen, sogenannte Bots zu programmieren, die sämtliche Bestandteile einer Konversation enthalten. Die dazu notwendigen Sprachmodelle sollen automatisch erzeugt werden. Neben der Integration in Messenger wie jenen von Facebook, könnten mit Lex aber auch Web-Anwendungen gebaut werden oder Apps und Geräte, die wie Echo auf Befehle des Nutzers warten.

Damit die so erstellten Programme auch natürlich antworten können, bietet Amazon mit Polly zudem einen ausgefeilten Text-to-Speech-Dienst an. Das Team habe dabei besonders auf spezielle Eigenheiten der Sprachsynthese geachtet, etwa die unterschiedliche Aussprache von Worten, die gleich geschrieben werden.

Über die Speech Synthesis Markup Language (SSML) lässt sich das System außerdem um Informationen erweitern wie etwa einen Sprachwechsel innerhalb eines Textes. Damit könnte zum Beispiel verhindert werden, dass englische Wörter auf Deutsch ausgesprochen werden. Entwickler können für Polly aus 47 männlichen und weiblichen Stimmen in 24 Sprachen wählen. Amazon will die Vielfalt hier noch deutlich erhöhen.

Bilderkennung mit Deep Learning

Ein gutes KI-Angebot muss darüber hinaus aber auch eine Bilderkennung enthalten, wofür Amazon seinen Dienst Rekognition anbietet. Dieser basiert auf Deep-Learning-Modellen, die Amazon bereits angelernt und trainiert hat, sodass Rekognition direkt für eine Klassifizierung von Bildern genutzt werden kann. Das komplizierte und aufwändige Aufsetzen eines neuronalen Netzwerkes sowie die Trainingsphase entfallen also völlig.

Zu gegebenen Aufnahmen liefert Rekognition zu bestimmten Kategorien, wie etwa Tier oder Hund, eine dazugehörige prozentuale Wahrscheinlichkeit, was Entwickler dann weiter nutzen können. Ebenso kann der Dienst dazu genutzt werden, Gesichter in Bildern zu erkennen oder dasselbe Gesicht in mehreren Bildern wiederzufinden.

Lex steht zunächst nur in der Region US-East (Northern Virginia) zur Verfügung, Polly und Rekognition darüber hinaus auch in den Regionen US-West (Oregon) und Europa (Dublin).



Anzeige
Top-Angebote
  1. 5,55€
  2. (u. a. GRAND THEFT AUTO V: PREMIUM ONLINE EDITION 13,99€, Shadows: Awakening 12,50€)
  3. (aktuell u. a. Monitore, Mäuse, CPUs)
  4. mit Gutschein: NBBCORSAIRPSP19

bernd71 02. Dez 2016

Artikel gelesen? Neu ist das Amazon seinen Text/Bild Erkennung und Ausgabe für...

HorkheimerAnders 01. Dez 2016

Ach dieser loyale Blick... Hunde sind schon was tolles :) Wobei der hier sicher ab und...


Folgen Sie uns
       


Die Commodore-264er-Reihe angesehen

Unschlagbar günstig, unfassbar wenig RAM - der C16 konnte in vielen Belangen nicht mit dem populären C64 mithalten.

Die Commodore-264er-Reihe angesehen Video aufrufen
5G-Report: Nicht jedes Land braucht zur Frequenzvergabe Auktionen
5G-Report
Nicht jedes Land braucht zur Frequenzvergabe Auktionen

Die umstrittene Versteigerung von 5G-Frequenzen durch die Bundesnetzagentur ist zu Ende. Die Debatte darüber, wie Funkspektrum verteilt werden soll, geht weiter. Wir haben uns die Praxis in anderen Ländern angeschaut.
Ein Bericht von Stefan Krempl

  1. Sindelfingen Mercedes und Telefónica Deutschland errichten 5G-Netz
  2. iPhone-Modem Apple will Intels deutsches 5G-Team übernehmen
  3. Bundesnetzagentur Mobilfunkbetreiber vermissen Chefplaner bei 5G-Auktion

WD Blue SN500 ausprobiert: Die flotte günstige Blaue
WD Blue SN500 ausprobiert
Die flotte günstige Blaue

Mit der WD Blue SN500 bietet Western Digital eine spannende NVMe-SSD an: Das M.2-Kärtchen basiert auf einem selbst entwickelten Controller und eigenem Flash-Speicher. Das Resultat ist ein schnelles, vor allem aber günstiges Modell als bessere Alternative zu Sata-SSDs.
Von Marc Sauter

  1. WD Black SN750 ausprobiert Direkt hinter Samsungs SSDs
  2. WD Black SN750 Leicht optimierte NVMe-SSD mit 2 TByte
  3. Ultrastar DC ME200 Western Digital baut PCIe-Arbeitsspeicher mit 4 TByte

Ada und Spark: Mehr Sicherheit durch bessere Programmiersprachen
Ada und Spark
Mehr Sicherheit durch bessere Programmiersprachen

Viele Sicherheitslücken in Software sind auf Programmierfehler zurückzuführen. Diese Fehler lassen sich aber vermeiden - und zwar unter anderem durch die Wahl einer guten Programmiersprache. Ada und Spark gehören dazu, leider sind sie immer noch wenig bekannt.
Von Johannes Kanig

  1. Das andere How-to Deutsch lernen für Programmierer
  2. Programmiersprachen, Pakete, IDEs So steigen Entwickler in Machine Learning ein
  3. Software-Entwickler Welche Programmiersprache soll ich lernen?

    •  /