Abo
  • Services:

Linux: Siri bekommt Open-Source-Konkurrenz

Sirius erkennt Fotos und versteht gesprochene Fragen wie "Wo steht dieses Gebäude?". Es soll eine Linux-Alternative zu virtuellen Assistenten wie Apples Siri sein.

Artikel veröffentlicht am , Patrick Beuth/Zeit Online
Apples Siri auf einem iPhone 4S - nur einer von mehreren virtuellen Assistenten für Mobiltelefone
Apples Siri auf einem iPhone 4S - nur einer von mehreren virtuellen Assistenten für Mobiltelefone (Bild: Oli Scarff/Getty Images)

Apple hat Siri. Google hat Google Now. Microsoft hat Cortana. Blackberry hat seinen Assistant. Und Linux? Bekommt Sirius. Damit in Zukunft wirklich jeder mit seinem Computer reden kann.

Stellenmarkt
  1. Aenova Group, Wolfratshausen
  2. B&R Industrial Automation GmbH, Essen

Mit Sirius wollen Forscher am Clarity Lab der Universität von Michigan eine Open-Source-Alternative zu den proprietären virtuellen Assistenten der Branchengrößen schaffen. Sie testen Sirius derzeit auf dem Betriebssystem Ubuntu, es lässt sich aber auch auf anderen Linux-Distributionen installieren.

Bisher ist Sirius nur eine Kombination aus Sprach-, Bild- und Texterkennung mit beschränkten Ressourcen: Die Demoversion erkennt Sprachbefehle und Fotos, verarbeitet Fragen der Nutzer in der Cloud und antwortet. Einzige Wissensquelle ist derzeit eine statische Version der Wikipedia. Nutzer können Sirius zum Beispiel ein Foto des Empire State Building zeigen und fragen: "Wo steht dieses Gebäude?" Sirius erkennt das Foto und zerlegt die Frage in Schlüsselworte, die Antwort gibt eine männliche, ziemlich automatenhafte Stimme.

Im Vergleich zu den Fähigkeiten der etablierten virtuellen Assistenten wirkt das auf den ersten Blick rudimentär. Zwar bieten die etablierten Systeme bisher keine integrierte Bilderkennung, dafür können sie weit kompliziertere Aufgaben lösen. Google Now etwa ist mit diversen Google-Apps wie Wetter und Kalender verzahnt und kann seine Nutzer selbsttätig darauf hinweisen, dass sie aufgrund eines Verkehrsstaus früher als geplant zu einem Termin aufbrechen sollten.

Die Forscher des Clarity Lab hoffen, dass andere Universitäten oder Unternehmen und Privatpersonen Sirius weiterentwickeln und in neue Geräte integrieren. Sie gehen davon aus, dass Wearables und das Internet der Dinge dazu führen werden, dass Sprachsteuerung immer wichtiger wird, weil sich diese neuen Geräte nur bedingt oder gar nicht über Tastaturen oder Touch- und Wischgesten bedienen lassen.

Die zunehmende Anzahl vernetzter Geräte wird eine Reihe von Verteilungskämpfen zur Folge haben: Wessen Betriebssystem und wessen Cloud-Infrastruktur werden den Markt dominieren? Wessen Standards zur Kommunikation zwischen den Sensoren und Geräten werden sich durchsetzen? Und offenbar auch: Wessen Stimme wird die meisten Fragen der Nutzer beantworten? Die von Siri, die von Cortana oder doch eine, die zu keinem der großen US-Unternehmen gehört?

Der Quellcode von Sirius steht auf Github bereit. Schon jetzt beruht das System auf Bausteinen mehrerer Hochschulen, die Technik für die Spracherkennung zum Beispiel stammt von der Carnegie Mellon University, Microsoft und der RWTH Aachen. Gefördert wird das Projekt auch von Google, der Defense Advanced Research Projects Agency (Darpa) und der National Science Foundation (NSF). Sirius ist deshalb noch keine hübsche, einfach zu installierende und bedienende App, sondern ein Sammelsurium aus Paketen, die technisch versierte Nutzer von Hand kompilieren müssen.

Cortana und der deutsche Humor

In vielerlei Hinsicht steht Sirius also noch ganz am Anfang seiner Entwicklung, während die großen Unternehmen ihre virtuellen Assistenten immer weiter verfeinern. Google und Microsoft zum Beispiel verrieten in dieser Woche auf der Search Marketing Expo in München, was ihre Assistenten bald können sollen. So werde Google Now künftig Standortdaten nutzen, um den Kontext einer Nutzerfrage zu erkennen, berichtet Heise Online. Außerdem, so hatte Google auf dem SXSW-Festival in Austin bekanntgegeben, werde Google die API von Google Now öffnen. Dann können Drittentwickler die Daten aus ihren Apps in Google Now einspeisen und das Werkzeug damit sehr viel mächtiger machen, als es bisher ist.

Wenn Microsoft im Sommer sein neues Betriebssystem Windows 10 auf den Markt bringt, wird Cortana integriert sein und damit auf Desktop-PCs funktionieren. Das Unternehmen bringt seinem System derzeit Deutsch bei. Ziel ist es, dass Nutzer dem System vertrauen und ihm etwas über sich verraten, sagte Microsoft-Manager Marcus Ash Golem.de. Nur was sie freiwillig preisgeben, solle Cortana auswerten dürfen.

Wie viel Humor die deutsche Cortana bekommen soll, stehe allerdings noch nicht fest, sagte Ash. Während US-Nutzer freche Antworten auf Scherzfragen wie "Willst du mich heiraten" erwarten würden und damit auch gut umgehen könnten, wisse Microsoft nicht, wie die Deutschen darauf reagieren würden. Deshalb wolle Microsoft das System zunächst sehr konservativ gestalten. So natürlich die Mensch-Maschine-Kommunikation auch werden muss, um akzeptiert zu werden - allzu menschlich darf sie zumindest hierzulande nicht werden, glaubt Microsoft.



Anzeige
Top-Angebote
  1. 119,90€
  2. für 1.124€ statt 1.319€
  3. und zusätzlich eine Prämie erhalten (u. a. Amazon-Gutschein, 30€ Barprämie oder Scythe Mugen 5...

nf1n1ty 12. Apr 2018

Dann bin ich doch nicht der letzte, der diese Form der Scham verspürt. Danke! :D

1ynx 22. Mär 2015

Bei mir läufts inzwischen. Fehlt nurnoch der Wiki-Dump den ich mir gerade lade...

floriq 22. Mär 2015

und die bieten wesentlich mehr als nur nen Cloud-Service für open source Spracherkennung ...

Anonymer Nutzer 22. Mär 2015

Ja, genauso wie Linux Windows platt gemacht hat.

Anonymer Nutzer 22. Mär 2015

Er meint, dass es da wohl eine Klage wegen Verwechslungsgefahr geben wird.


Folgen Sie uns
       


Xbox E3 2018 Pressekonferenz - Golem.de Live

Große Gefühle beim E3-2018-Livestream von Microsoft: Erlebt mit uns die Ankündigungen von Halo Infinite, Gears 5, Sekiro, Cyberpunk 2077 und vielem mehr.

Xbox E3 2018 Pressekonferenz - Golem.de Live Video aufrufen
Razer Blade 15 im Test: Schlanker 15,6-Zöller für Gamer gefällt uns
Razer Blade 15 im Test
Schlanker 15,6-Zöller für Gamer gefällt uns

Das Razer Blade 15 ist ein gutes Spiele-Notebook mit flottem Display und schneller Geforce-Grafikeinheit. Anders als im 14-Zoll-Formfaktor ist bei den 15,6-Zoll-Modellen die Konkurrenz aber deutlich größer.
Ein Test von Marc Sauter

  1. Gaming-Notebook Razer packt Hexacore und Geforce GTX 1070 ins Blade 15
  2. Razer Blade 2017 im Test Das beste Gaming-Ultrabook nun mit 4K

Hasskommentare: Wie würde es im Netz aussehen, wenn es uns nicht gäbe?
Hasskommentare
"Wie würde es im Netz aussehen, wenn es uns nicht gäbe?"

Hannes Ley hat vor rund anderthalb Jahren die Online-Initiative #ichbinhier gegründet. Die Facebook-Gruppe schreibt Erwiderungen auf Hasskommentare und hat mittlerweile knapp 40.000 Mitglieder. Im Interview mit Golem.de erklärt Ley, wie er die Idee aus dem Netz in die echte Welt bringen will.
Ein Interview von Jennifer Fraczek

  1. Nutzungsrechte Einbetten von Fotos muss nicht verhindert werden
  2. Bundesnetzagentur UKW-Abschaltung abgewendet
  3. Drupalgeddon 2 115.000 Webseiten mit Drupallücken übernommen

Blackberry Key2 im Test: Ordentliches Tastatur-Smartphone mit zu vielen Schwächen
Blackberry Key2 im Test
Ordentliches Tastatur-Smartphone mit zu vielen Schwächen

Zwei Hauptkameras, 32 Tasten und viele Probleme: Beim Blackberry Key2 ist vieles besser als beim Keyone, unfertige Software macht dem neuen Tastatur-Smartphone aber zu schaffen. Im Testbericht verraten wir, was uns gut und was uns gar nicht gefallen hat.
Ein Test von Tobias Czullay

  1. Blackberry Key2 im Hands On Smartphone bringt verbesserte Tastatur und eine Dual-Kamera
  2. Blackberry Motion im Test Langläufer ohne Glanz

    •  /