Abo
  • Services:
Anzeige
Die Amazon-Cloud kann genutzt werden, um Bildinhalte zu erkennen.
Die Amazon-Cloud kann genutzt werden, um Bildinhalte zu erkennen. (Bild: Amazon)

Lex, Polly und Rekognition: Amazon integriert Alexa-KI in sein Cloud-Angebot

Die Amazon-Cloud kann genutzt werden, um Bildinhalte zu erkennen.
Die Amazon-Cloud kann genutzt werden, um Bildinhalte zu erkennen. (Bild: Amazon)

Mit dem eigenen Rechner oder Telefon sprechen, die Geräte geben ihre Antworten ebenso gesprochen aus: Diese Funktionen können Entwickler künftig mit Hilfe der KI in der Amazon-Cloud umsetzen. Eine Bilderkennung kann ebenfalls genutzt werden.

In unserem Test von Amazons digitalem Sprachassistenten Alexa mit dem Gerät Echo funktionierte der Dienst schon so gut, dass wir uns sogar beim Dankesagen erwischt haben. Die zugrundeliegenden KI-Techniken von Alexa bietet Amazon künftig auch in seinem eigenen Cloud-Angebot der Web Services an.

Anzeige

Spracherkennung und -synthese

Mit Hilfe von Amazon Lex können Entwickler Anwendungen erstellen, die Sprachbefehle von Nutzern verstehen können. Der Dienst soll es ermöglichen, sogenannte Bots zu programmieren, die sämtliche Bestandteile einer Konversation enthalten. Die dazu notwendigen Sprachmodelle sollen automatisch erzeugt werden. Neben der Integration in Messenger wie jenen von Facebook, könnten mit Lex aber auch Web-Anwendungen gebaut werden oder Apps und Geräte, die wie Echo auf Befehle des Nutzers warten.

Damit die so erstellten Programme auch natürlich antworten können, bietet Amazon mit Polly zudem einen ausgefeilten Text-to-Speech-Dienst an. Das Team habe dabei besonders auf spezielle Eigenheiten der Sprachsynthese geachtet, etwa die unterschiedliche Aussprache von Worten, die gleich geschrieben werden.

Über die Speech Synthesis Markup Language (SSML) lässt sich das System außerdem um Informationen erweitern wie etwa einen Sprachwechsel innerhalb eines Textes. Damit könnte zum Beispiel verhindert werden, dass englische Wörter auf Deutsch ausgesprochen werden. Entwickler können für Polly aus 47 männlichen und weiblichen Stimmen in 24 Sprachen wählen. Amazon will die Vielfalt hier noch deutlich erhöhen.

Bilderkennung mit Deep Learning

Ein gutes KI-Angebot muss darüber hinaus aber auch eine Bilderkennung enthalten, wofür Amazon seinen Dienst Rekognition anbietet. Dieser basiert auf Deep-Learning-Modellen, die Amazon bereits angelernt und trainiert hat, sodass Rekognition direkt für eine Klassifizierung von Bildern genutzt werden kann. Das komplizierte und aufwändige Aufsetzen eines neuronalen Netzwerkes sowie die Trainingsphase entfallen also völlig.

Zu gegebenen Aufnahmen liefert Rekognition zu bestimmten Kategorien, wie etwa Tier oder Hund, eine dazugehörige prozentuale Wahrscheinlichkeit, was Entwickler dann weiter nutzen können. Ebenso kann der Dienst dazu genutzt werden, Gesichter in Bildern zu erkennen oder dasselbe Gesicht in mehreren Bildern wiederzufinden.

Lex steht zunächst nur in der Region US-East (Northern Virginia) zur Verfügung, Polly und Rekognition darüber hinaus auch in den Regionen US-West (Oregon) und Europa (Dublin).


eye home zur Startseite
bernd71 02. Dez 2016

Artikel gelesen? Neu ist das Amazon seinen Text/Bild Erkennung und Ausgabe für...

HorkheimerAnders 01. Dez 2016

Ach dieser loyale Blick... Hunde sind schon was tolles :) Wobei der hier sicher ab und...



Anzeige

Stellenmarkt
  1. thyssenkrupp AG, Essen
  2. Deutsche Bundesbank, Frankfurt am Main
  3. Ratbacher GmbH, Stuttgart
  4. saracus consulting GmbH, Münster, Baden-Dätwill (Schweiz)


Anzeige
Hardware-Angebote
  1. täglich neue Deals
  2. 444,00€ + 4,99€ Versand

Folgen Sie uns
       


  1. Amazon Channels

    Prime Video erhält Pay-TV-Plattform mit Live-Fernsehen

  2. Bayerischer Rundfunk

    Fernsehsender wollen über 5G ausstrahlen

  3. Kupfer

    Nokia hält Terabit DSL für überflüssig

  4. Kryptowährung

    Bitcoin notiert auf neuem Rekordhoch

  5. Facebook

    Dokumente zum Umgang mit Sex- und Gewaltinhalten geleakt

  6. Arduino Cinque

    RISC-V-Prozessor und ESP32 auf einem Board vereint

  7. Schatten des Krieges angespielt

    Wir stürmen Festungen! Mit Orks! Und Drachen!

  8. Skills

    Amazon lässt Alexa natürlicher klingen

  9. Cray

    Rechenleistung von Supercomputern in der Cloud mieten

  10. Streaming

    Sky geht gegen Stream4u.tv und Hardwareanbieter vor



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Yodobashi und Bic Camera: Im Rausch der Netzwerkkabel
Yodobashi und Bic Camera
Im Rausch der Netzwerkkabel
  1. Sicherheitslücke Fehlerhaft konfiguriertes Git-Verzeichnis bei Redcoon
  2. Preisschild Media Markt nennt 7.998-Euro-Literpreis für Druckertinte

Vernetzte Hörgeräte und Hearables: Ich filter mir die Welt widdewiddewie sie mir gefällt
Vernetzte Hörgeräte und Hearables
Ich filter mir die Welt widdewiddewie sie mir gefällt
  1. The Dash Pro Bragis Drahtlos-Ohrstöpsel können jetzt auch übersetzen
  2. Beddit Apple kauft Schlaf-Tracker-Hersteller
  3. Smartwatch Huawei Watch bekommt Android Wear 2.0

In eigener Sache: Die Quanten kommen!
In eigener Sache
Die Quanten kommen!
  1. id Software "Global Illumination ist derzeit die größte Herausforderung"
  2. In eigener Sache Golem.de führt kostenpflichtige Links ein
  3. In eigener Sache Golem.de sucht Marketing Manager (w/m)

  1. Fake News?

    Friedhelm | 01:43

  2. Re: Hmmm, kommt dann Methadon für alle?

    Garius | 01:39

  3. Re: Fußball!

    Garius | 01:32

  4. Re: Relevanz

    Spawn182 | 01:31

  5. Re: Die Bandbreite ist eine Sache, die Latenz...

    GenXRoad | 01:08


  1. 00:01

  2. 18:45

  3. 16:35

  4. 16:20

  5. 16:00

  6. 15:37

  7. 15:01

  8. 13:34


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel