• IT-Karriere:
  • Services:

Linux: Siri bekommt Open-Source-Konkurrenz

Sirius erkennt Fotos und versteht gesprochene Fragen wie "Wo steht dieses Gebäude?". Es soll eine Linux-Alternative zu virtuellen Assistenten wie Apples Siri sein.

Artikel veröffentlicht am , Patrick Beuth/Zeit Online
Apples Siri auf einem iPhone 4S - nur einer von mehreren virtuellen Assistenten für Mobiltelefone
Apples Siri auf einem iPhone 4S - nur einer von mehreren virtuellen Assistenten für Mobiltelefone (Bild: Oli Scarff/Getty Images)

Apple hat Siri. Google hat Google Now. Microsoft hat Cortana. Blackberry hat seinen Assistant. Und Linux? Bekommt Sirius. Damit in Zukunft wirklich jeder mit seinem Computer reden kann.

Stellenmarkt
  1. Goldbeck GmbH, Bielefeld
  2. HAWK Hochschule für angewandte Wissenschaft und Kunst, Göttingen

Mit Sirius wollen Forscher am Clarity Lab der Universität von Michigan eine Open-Source-Alternative zu den proprietären virtuellen Assistenten der Branchengrößen schaffen. Sie testen Sirius derzeit auf dem Betriebssystem Ubuntu, es lässt sich aber auch auf anderen Linux-Distributionen installieren.

Bisher ist Sirius nur eine Kombination aus Sprach-, Bild- und Texterkennung mit beschränkten Ressourcen: Die Demoversion erkennt Sprachbefehle und Fotos, verarbeitet Fragen der Nutzer in der Cloud und antwortet. Einzige Wissensquelle ist derzeit eine statische Version der Wikipedia. Nutzer können Sirius zum Beispiel ein Foto des Empire State Building zeigen und fragen: "Wo steht dieses Gebäude?" Sirius erkennt das Foto und zerlegt die Frage in Schlüsselworte, die Antwort gibt eine männliche, ziemlich automatenhafte Stimme.

Im Vergleich zu den Fähigkeiten der etablierten virtuellen Assistenten wirkt das auf den ersten Blick rudimentär. Zwar bieten die etablierten Systeme bisher keine integrierte Bilderkennung, dafür können sie weit kompliziertere Aufgaben lösen. Google Now etwa ist mit diversen Google-Apps wie Wetter und Kalender verzahnt und kann seine Nutzer selbsttätig darauf hinweisen, dass sie aufgrund eines Verkehrsstaus früher als geplant zu einem Termin aufbrechen sollten.

Die Forscher des Clarity Lab hoffen, dass andere Universitäten oder Unternehmen und Privatpersonen Sirius weiterentwickeln und in neue Geräte integrieren. Sie gehen davon aus, dass Wearables und das Internet der Dinge dazu führen werden, dass Sprachsteuerung immer wichtiger wird, weil sich diese neuen Geräte nur bedingt oder gar nicht über Tastaturen oder Touch- und Wischgesten bedienen lassen.

Die zunehmende Anzahl vernetzter Geräte wird eine Reihe von Verteilungskämpfen zur Folge haben: Wessen Betriebssystem und wessen Cloud-Infrastruktur werden den Markt dominieren? Wessen Standards zur Kommunikation zwischen den Sensoren und Geräten werden sich durchsetzen? Und offenbar auch: Wessen Stimme wird die meisten Fragen der Nutzer beantworten? Die von Siri, die von Cortana oder doch eine, die zu keinem der großen US-Unternehmen gehört?

Der Quellcode von Sirius steht auf Github bereit. Schon jetzt beruht das System auf Bausteinen mehrerer Hochschulen, die Technik für die Spracherkennung zum Beispiel stammt von der Carnegie Mellon University, Microsoft und der RWTH Aachen. Gefördert wird das Projekt auch von Google, der Defense Advanced Research Projects Agency (Darpa) und der National Science Foundation (NSF). Sirius ist deshalb noch keine hübsche, einfach zu installierende und bedienende App, sondern ein Sammelsurium aus Paketen, die technisch versierte Nutzer von Hand kompilieren müssen.

Cortana und der deutsche Humor

In vielerlei Hinsicht steht Sirius also noch ganz am Anfang seiner Entwicklung, während die großen Unternehmen ihre virtuellen Assistenten immer weiter verfeinern. Google und Microsoft zum Beispiel verrieten in dieser Woche auf der Search Marketing Expo in München, was ihre Assistenten bald können sollen. So werde Google Now künftig Standortdaten nutzen, um den Kontext einer Nutzerfrage zu erkennen, berichtet Heise Online. Außerdem, so hatte Google auf dem SXSW-Festival in Austin bekanntgegeben, werde Google die API von Google Now öffnen. Dann können Drittentwickler die Daten aus ihren Apps in Google Now einspeisen und das Werkzeug damit sehr viel mächtiger machen, als es bisher ist.

Wenn Microsoft im Sommer sein neues Betriebssystem Windows 10 auf den Markt bringt, wird Cortana integriert sein und damit auf Desktop-PCs funktionieren. Das Unternehmen bringt seinem System derzeit Deutsch bei. Ziel ist es, dass Nutzer dem System vertrauen und ihm etwas über sich verraten, sagte Microsoft-Manager Marcus Ash Golem.de. Nur was sie freiwillig preisgeben, solle Cortana auswerten dürfen.

Wie viel Humor die deutsche Cortana bekommen soll, stehe allerdings noch nicht fest, sagte Ash. Während US-Nutzer freche Antworten auf Scherzfragen wie "Willst du mich heiraten" erwarten würden und damit auch gut umgehen könnten, wisse Microsoft nicht, wie die Deutschen darauf reagieren würden. Deshalb wolle Microsoft das System zunächst sehr konservativ gestalten. So natürlich die Mensch-Maschine-Kommunikation auch werden muss, um akzeptiert zu werden - allzu menschlich darf sie zumindest hierzulande nicht werden, glaubt Microsoft.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • ohne Tracking
  • mit ausgeschaltetem Javascript


Anzeige
Spiele-Angebote
  1. (-56%) 17,50€
  2. 4,99€
  3. 4,99€
  4. (-49%) 8,50€

nf1n1ty 12. Apr 2018

Dann bin ich doch nicht der letzte, der diese Form der Scham verspürt. Danke! :D

1ynx 22. Mär 2015

Bei mir läufts inzwischen. Fehlt nurnoch der Wiki-Dump den ich mir gerade lade...

floriq 22. Mär 2015

und die bieten wesentlich mehr als nur nen Cloud-Service für open source Spracherkennung ...

Anonymer Nutzer 22. Mär 2015

Ja, genauso wie Linux Windows platt gemacht hat.

Anonymer Nutzer 22. Mär 2015

Er meint, dass es da wohl eine Klage wegen Verwechslungsgefahr geben wird.


Folgen Sie uns
       


Oneplus 7T - Fazit

Das Oneplus 7T ist der Nachfolger des Oneplus 7 - und hat einige interessante Hardware-Upgrades bekommen. Im Test von Golem.de schneidet das Smartphone entsprechend gut ab.

Oneplus 7T - Fazit Video aufrufen
Frauen in der IT: Ist Logik von Natur aus Männersache?
Frauen in der IT
Ist Logik von Natur aus Männersache?

Wenn es um die Frage geht, warum es immer noch so wenig Frauen in der IT gibt, kommt früher oder später das Argument, dass Frauen nicht eben zur Logik veranlagt seien. Kann die niedrige Zahl von Frauen in dieser Branche tatsächlich mit der Biologie erklärt werden?
Von Valerie Lux

  1. IT-Jobs Gibt es den Fachkräftemangel wirklich?
  2. Arbeit im Amt Wichtig ist ein Talent zum Zeittotschlagen
  3. IT-Freelancer Paradiesische Zustände

Amazon Echo Studio im Test: Homepod-Bezwinger begeistert auch als Fire-TV-Lautsprecher
Amazon Echo Studio im Test
Homepod-Bezwinger begeistert auch als Fire-TV-Lautsprecher

Mit dem Echo Studio bringt Amazon seinen teuersten Alexa-Lautsprecher auf den Markt. Dennoch ist er deutlich günstiger als Apples Homepod, liefert aber einen besseren Klang. Und das ist längst nicht alles.
Ein Test von Ingo Pakalski

  1. Amazons Heimkino-Funktion Echo-Lautsprecher drahtlos mit Fire-TV-Geräten verbinden
  2. Echo Flex Amazons preiswertester Alexa-Lautsprecher
  3. Amazons Alexa-Lautsprecher Echo Dot hat ein LED-Display - Echo soll besser klingen

Surface Laptop 3 (15 Zoll) im Test: Das 15-Zoll-Macbook mit Windows 10 und Ryzen
Surface Laptop 3 (15 Zoll) im Test
Das 15-Zoll-Macbook mit Windows 10 und Ryzen

Was passiert, wenn ein 13-Zoll-Notebook ein 15-Zoll-Panel erhält? Es entsteht der Surface Laptop 3. Er ist leicht, sehr gut verarbeitet und hat eine exzellente Tastatur. Das bereitet aber nur Freude, wenn wir die wenigen Anschlüsse und den recht kleinen Akku verkraften können.
Ein Test von Oliver Nickel

  1. Surface Laptop 3 mit 15 Zoll Microsoft könnte achtkernigen Ryzen verbauen

    •  /