Lex, Polly und Rekognition: Amazon integriert Alexa-KI in sein Cloud-Angebot

Mit dem eigenen Rechner oder Telefon sprechen, die Geräte geben ihre Antworten ebenso gesprochen aus: Diese Funktionen können Entwickler künftig mit Hilfe der KI in der Amazon-Cloud umsetzen. Eine Bilderkennung kann ebenfalls genutzt werden.

Artikel veröffentlicht am ,
Die Amazon-Cloud kann genutzt werden, um Bildinhalte zu erkennen.
Die Amazon-Cloud kann genutzt werden, um Bildinhalte zu erkennen. (Bild: Amazon)

In unserem Test von Amazons digitalem Sprachassistenten Alexa mit dem Gerät Echo funktionierte der Dienst schon so gut, dass wir uns sogar beim Dankesagen erwischt haben. Die zugrundeliegenden KI-Techniken von Alexa bietet Amazon künftig auch in seinem eigenen Cloud-Angebot der Web Services an.

Spracherkennung und -synthese

Stellenmarkt
  1. Full Stack Java Software Developer (m/w/d)
    NOVENTI Health SE, Lübeck (Home-Office möglich)
  2. Senior Software Developer (m/w/d)
    unimed Abrechnungsservice für Kliniken und Chefärzte GmbH, deutschlandweit (Home-Office)
Detailsuche

Mit Hilfe von Amazon Lex können Entwickler Anwendungen erstellen, die Sprachbefehle von Nutzern verstehen können. Der Dienst soll es ermöglichen, sogenannte Bots zu programmieren, die sämtliche Bestandteile einer Konversation enthalten. Die dazu notwendigen Sprachmodelle sollen automatisch erzeugt werden. Neben der Integration in Messenger wie jenen von Facebook, könnten mit Lex aber auch Web-Anwendungen gebaut werden oder Apps und Geräte, die wie Echo auf Befehle des Nutzers warten.

Damit die so erstellten Programme auch natürlich antworten können, bietet Amazon mit Polly zudem einen ausgefeilten Text-to-Speech-Dienst an. Das Team habe dabei besonders auf spezielle Eigenheiten der Sprachsynthese geachtet, etwa die unterschiedliche Aussprache von Worten, die gleich geschrieben werden.

Über die Speech Synthesis Markup Language (SSML) lässt sich das System außerdem um Informationen erweitern wie etwa einen Sprachwechsel innerhalb eines Textes. Damit könnte zum Beispiel verhindert werden, dass englische Wörter auf Deutsch ausgesprochen werden. Entwickler können für Polly aus 47 männlichen und weiblichen Stimmen in 24 Sprachen wählen. Amazon will die Vielfalt hier noch deutlich erhöhen.

Bilderkennung mit Deep Learning

Golem Akademie
  1. Webentwicklung mit React and Typescript: virtueller Fünf-Halbtage-Workshop
    6.–10. Dezember 2021, Virtuell
  2. Penetration Testing Fundamentals: virtueller Zwei-Tage-Workshop
    17.–18. Januar 2022, Virtuell
Weitere IT-Trainings

Ein gutes KI-Angebot muss darüber hinaus aber auch eine Bilderkennung enthalten, wofür Amazon seinen Dienst Rekognition anbietet. Dieser basiert auf Deep-Learning-Modellen, die Amazon bereits angelernt und trainiert hat, sodass Rekognition direkt für eine Klassifizierung von Bildern genutzt werden kann. Das komplizierte und aufwändige Aufsetzen eines neuronalen Netzwerkes sowie die Trainingsphase entfallen also völlig.

Zu gegebenen Aufnahmen liefert Rekognition zu bestimmten Kategorien, wie etwa Tier oder Hund, eine dazugehörige prozentuale Wahrscheinlichkeit, was Entwickler dann weiter nutzen können. Ebenso kann der Dienst dazu genutzt werden, Gesichter in Bildern zu erkennen oder dasselbe Gesicht in mehreren Bildern wiederzufinden.

Lex steht zunächst nur in der Region US-East (Northern Virginia) zur Verfügung, Polly und Rekognition darüber hinaus auch in den Regionen US-West (Oregon) und Europa (Dublin).

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Bildbearbeitungstool bei Github
Triangula und die Schönheit der Mathematik

Helferlein Triangula ist ein gelungenes Tool, um Bilder kunstvoll in Polygone zu zerlegen. Mit einem weiteren Tool können sie als Platzhalter auf Webseiten eingesetzt werden.
Von Kristof Zerbe

Bildbearbeitungstool bei Github: Triangula und die Schönheit der Mathematik
Artikel
  1. Giga Factory Berlin: Warum Tesla auf über eine Milliarde Euro verzichten musste
    Giga Factory Berlin
    Warum Tesla auf über eine Milliarde Euro verzichten musste

    Tesla kann die Milliarde Euro Förderung für die Akkufabrik Grünheide nicht beantragen - weil es sonst zu Verzögerungen beim Einsatz neuer Technik käme.

  2. Elektroauto: Mercedes EQS 350 als Basisversion mit 90-kWh-Akku bestellbar
    Elektroauto
    Mercedes EQS 350 als Basisversion mit 90-kWh-Akku bestellbar

    Die Luxuslimousine Mercedes EQS kostet weniger als 100.000 Euro. Im EQS 350 steckt ein Akku mit 90 kWh, bei den Spitzenmodellen sind es 108 kWh.

  3. Doppelbildschirm: Kickstarterprojekt Slide brauchte 6 Jahre bis zum Erfolg
    Doppelbildschirm
    Kickstarterprojekt Slide brauchte 6 Jahre bis zum Erfolg

    Das Kickstarter-Projekt Slidenjoy kann nach 6 Jahren seinen Doppelbildschirm Slide für Notebooks ausliefern.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Heute ist Cyber Monday • Ryzen 7 5800X 348€ • WD Blue SN550 2 TB ab 149€ • LG UltraGear 34GP950G-B 999€ • SanDisk Ultra 3D 500 GB M.2 44€ • Boxsets (u. a. Game of Thrones Blu-ray 79,97€) • Samsung Galaxy S21 128GB 777€ • Premium-Laptops • Cooler Master V850 Platinum 189,90€ [Werbung]
    •  /