• IT-Karriere:
  • Services:

Linux: Siri bekommt Open-Source-Konkurrenz

Sirius erkennt Fotos und versteht gesprochene Fragen wie "Wo steht dieses Gebäude?". Es soll eine Linux-Alternative zu virtuellen Assistenten wie Apples Siri sein.

Artikel veröffentlicht am , Patrick Beuth/Zeit Online
Apples Siri auf einem iPhone 4S - nur einer von mehreren virtuellen Assistenten für Mobiltelefone
Apples Siri auf einem iPhone 4S - nur einer von mehreren virtuellen Assistenten für Mobiltelefone (Bild: Oli Scarff/Getty Images)

Apple hat Siri. Google hat Google Now. Microsoft hat Cortana. Blackberry hat seinen Assistant. Und Linux? Bekommt Sirius. Damit in Zukunft wirklich jeder mit seinem Computer reden kann.

Stellenmarkt
  1. Bundesanstalt für Landwirtschaft und Ernährung, Bonn
  2. Franke Coffee Systems GmbH, Gruensfeld

Mit Sirius wollen Forscher am Clarity Lab der Universität von Michigan eine Open-Source-Alternative zu den proprietären virtuellen Assistenten der Branchengrößen schaffen. Sie testen Sirius derzeit auf dem Betriebssystem Ubuntu, es lässt sich aber auch auf anderen Linux-Distributionen installieren.

Bisher ist Sirius nur eine Kombination aus Sprach-, Bild- und Texterkennung mit beschränkten Ressourcen: Die Demoversion erkennt Sprachbefehle und Fotos, verarbeitet Fragen der Nutzer in der Cloud und antwortet. Einzige Wissensquelle ist derzeit eine statische Version der Wikipedia. Nutzer können Sirius zum Beispiel ein Foto des Empire State Building zeigen und fragen: "Wo steht dieses Gebäude?" Sirius erkennt das Foto und zerlegt die Frage in Schlüsselworte, die Antwort gibt eine männliche, ziemlich automatenhafte Stimme.

Im Vergleich zu den Fähigkeiten der etablierten virtuellen Assistenten wirkt das auf den ersten Blick rudimentär. Zwar bieten die etablierten Systeme bisher keine integrierte Bilderkennung, dafür können sie weit kompliziertere Aufgaben lösen. Google Now etwa ist mit diversen Google-Apps wie Wetter und Kalender verzahnt und kann seine Nutzer selbsttätig darauf hinweisen, dass sie aufgrund eines Verkehrsstaus früher als geplant zu einem Termin aufbrechen sollten.

Golem Akademie
  1. Ansible Fundamentals: Systemdeployment & -management
    26.-30. April 2021, online
  2. OpenShift Installation & Administration
    14.-16. Juni 2021, online
Weitere IT-Trainings

Die Forscher des Clarity Lab hoffen, dass andere Universitäten oder Unternehmen und Privatpersonen Sirius weiterentwickeln und in neue Geräte integrieren. Sie gehen davon aus, dass Wearables und das Internet der Dinge dazu führen werden, dass Sprachsteuerung immer wichtiger wird, weil sich diese neuen Geräte nur bedingt oder gar nicht über Tastaturen oder Touch- und Wischgesten bedienen lassen.

Die zunehmende Anzahl vernetzter Geräte wird eine Reihe von Verteilungskämpfen zur Folge haben: Wessen Betriebssystem und wessen Cloud-Infrastruktur werden den Markt dominieren? Wessen Standards zur Kommunikation zwischen den Sensoren und Geräten werden sich durchsetzen? Und offenbar auch: Wessen Stimme wird die meisten Fragen der Nutzer beantworten? Die von Siri, die von Cortana oder doch eine, die zu keinem der großen US-Unternehmen gehört?

Der Quellcode von Sirius steht auf Github bereit. Schon jetzt beruht das System auf Bausteinen mehrerer Hochschulen, die Technik für die Spracherkennung zum Beispiel stammt von der Carnegie Mellon University, Microsoft und der RWTH Aachen. Gefördert wird das Projekt auch von Google, der Defense Advanced Research Projects Agency (Darpa) und der National Science Foundation (NSF). Sirius ist deshalb noch keine hübsche, einfach zu installierende und bedienende App, sondern ein Sammelsurium aus Paketen, die technisch versierte Nutzer von Hand kompilieren müssen.

Cortana und der deutsche Humor

In vielerlei Hinsicht steht Sirius also noch ganz am Anfang seiner Entwicklung, während die großen Unternehmen ihre virtuellen Assistenten immer weiter verfeinern. Google und Microsoft zum Beispiel verrieten in dieser Woche auf der Search Marketing Expo in München, was ihre Assistenten bald können sollen. So werde Google Now künftig Standortdaten nutzen, um den Kontext einer Nutzerfrage zu erkennen, berichtet Heise Online. Außerdem, so hatte Google auf dem SXSW-Festival in Austin bekanntgegeben, werde Google die API von Google Now öffnen. Dann können Drittentwickler die Daten aus ihren Apps in Google Now einspeisen und das Werkzeug damit sehr viel mächtiger machen, als es bisher ist.

Wenn Microsoft im Sommer sein neues Betriebssystem Windows 10 auf den Markt bringt, wird Cortana integriert sein und damit auf Desktop-PCs funktionieren. Das Unternehmen bringt seinem System derzeit Deutsch bei. Ziel ist es, dass Nutzer dem System vertrauen und ihm etwas über sich verraten, sagte Microsoft-Manager Marcus Ash Golem.de. Nur was sie freiwillig preisgeben, solle Cortana auswerten dürfen.

Wie viel Humor die deutsche Cortana bekommen soll, stehe allerdings noch nicht fest, sagte Ash. Während US-Nutzer freche Antworten auf Scherzfragen wie "Willst du mich heiraten" erwarten würden und damit auch gut umgehen könnten, wisse Microsoft nicht, wie die Deutschen darauf reagieren würden. Deshalb wolle Microsoft das System zunächst sehr konservativ gestalten. So natürlich die Mensch-Maschine-Kommunikation auch werden muss, um akzeptiert zu werden - allzu menschlich darf sie zumindest hierzulande nicht werden, glaubt Microsoft.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Spiele-Angebote
  1. 2,99€
  2. 36,99€
  3. 2,79€

nf1n1ty 12. Apr 2018

Dann bin ich doch nicht der letzte, der diese Form der Scham verspürt. Danke! :D

1ynx 22. Mär 2015

Bei mir läufts inzwischen. Fehlt nurnoch der Wiki-Dump den ich mir gerade lade...

floriq 22. Mär 2015

und die bieten wesentlich mehr als nur nen Cloud-Service für open source Spracherkennung ...

Anonymer Nutzer 22. Mär 2015

Ja, genauso wie Linux Windows platt gemacht hat.

Anonymer Nutzer 22. Mär 2015

Er meint, dass es da wohl eine Klage wegen Verwechslungsgefahr geben wird.


Folgen Sie uns
       


Programm für IT-Jobeinstieg: Hoffen auf den Klebeeffekt
Programm für IT-Jobeinstieg
Hoffen auf den Klebeeffekt

Aktuell ist der Jobeinstieg für junge Ingenieure und Informatiker schwer. Um ihnen zu helfen, hat das Land Baden-Württemberg eine interessante Idee: Es macht sich selbst zur Zeitarbeitsfirma.
Ein Bericht von Peter Ilg

  1. Arbeitszeit Das Sechs-Stunden-Experiment bei Sipgate
  2. Neuorientierung im IT-Job Endlich mal machen!
  3. IT-Unternehmen Die richtige Software für ein Projekt finden

Weclapp-CTO Ertan Özdil: Wir dürfen nicht in Schönheit und Perfektion untergehen!
Weclapp-CTO Ertan Özdil
"Wir dürfen nicht in Schönheit und Perfektion untergehen!"

Der CTO von Weclapp träumt von smarter Software, die menschliches Eingreifen in der nächsten ERP-Generation reduziert. Deutschen Perfektionismus hält Ertan Özdil aber für gefährlich.
Ein Interview von Maja Hoock


    Fiat 500 als E-Auto im Test: Kleinstwagen mit großem Potenzial
    Fiat 500 als E-Auto im Test
    Kleinstwagen mit großem Potenzial

    Fiat hat einen neuen 500er entwickelt. Der Kleine fährt elektrisch - und zwar richtig gut.
    Ein Test von Peter Ilg

    1. Vierradlenkung Elektrischer GMC Hummer SUV fährt im Krabbengang seitwärts
    2. MG Cyberster MG B Roadster mit Lasergürtel und Union Jack
    3. Elektroauto E-Auto-Prämie übersteigt in 2021 schon Vorjahressumme

      •  /