Linux: Siri bekommt Open-Source-Konkurrenz

Sirius erkennt Fotos und versteht gesprochene Fragen wie "Wo steht dieses Gebäude?". Es soll eine Linux-Alternative zu virtuellen Assistenten wie Apples Siri sein.

Artikel veröffentlicht am , Patrick Beuth/Zeit Online
Apples Siri auf einem iPhone 4S - nur einer von mehreren virtuellen Assistenten für Mobiltelefone
Apples Siri auf einem iPhone 4S - nur einer von mehreren virtuellen Assistenten für Mobiltelefone (Bild: Oli Scarff/Getty Images)

Apple hat Siri. Google hat Google Now. Microsoft hat Cortana. Blackberry hat seinen Assistant. Und Linux? Bekommt Sirius. Damit in Zukunft wirklich jeder mit seinem Computer reden kann.

Stellenmarkt
  1. Programmierer für Lack- und Sealingroboter (m/w/d)
    Dürr Systems AG, Bremen
  2. IT-Anwendungsbetreuer (m/w/d) Krankenhausträgergesellscha- ft
    Knappschaft Kliniken Service GmbH, Gelsenkirchen
Detailsuche

Mit Sirius wollen Forscher am Clarity Lab der Universität von Michigan eine Open-Source-Alternative zu den proprietären virtuellen Assistenten der Branchengrößen schaffen. Sie testen Sirius derzeit auf dem Betriebssystem Ubuntu, es lässt sich aber auch auf anderen Linux-Distributionen installieren.

Bisher ist Sirius nur eine Kombination aus Sprach-, Bild- und Texterkennung mit beschränkten Ressourcen: Die Demoversion erkennt Sprachbefehle und Fotos, verarbeitet Fragen der Nutzer in der Cloud und antwortet. Einzige Wissensquelle ist derzeit eine statische Version der Wikipedia. Nutzer können Sirius zum Beispiel ein Foto des Empire State Building zeigen und fragen: "Wo steht dieses Gebäude?" Sirius erkennt das Foto und zerlegt die Frage in Schlüsselworte, die Antwort gibt eine männliche, ziemlich automatenhafte Stimme.

Im Vergleich zu den Fähigkeiten der etablierten virtuellen Assistenten wirkt das auf den ersten Blick rudimentär. Zwar bieten die etablierten Systeme bisher keine integrierte Bilderkennung, dafür können sie weit kompliziertere Aufgaben lösen. Google Now etwa ist mit diversen Google-Apps wie Wetter und Kalender verzahnt und kann seine Nutzer selbsttätig darauf hinweisen, dass sie aufgrund eines Verkehrsstaus früher als geplant zu einem Termin aufbrechen sollten.

Golem Akademie
  1. Einführung in die Programmierung mit Rust: virtueller Fünf-Halbtage-Workshop
    21.–25. März 2022, Virtuell
  2. Jira für Systemadministratoren: virtueller Zwei-Tage-Workshop
    24.–25. Januar 2022, virtuell
Weitere IT-Trainings

Die Forscher des Clarity Lab hoffen, dass andere Universitäten oder Unternehmen und Privatpersonen Sirius weiterentwickeln und in neue Geräte integrieren. Sie gehen davon aus, dass Wearables und das Internet der Dinge dazu führen werden, dass Sprachsteuerung immer wichtiger wird, weil sich diese neuen Geräte nur bedingt oder gar nicht über Tastaturen oder Touch- und Wischgesten bedienen lassen.

Die zunehmende Anzahl vernetzter Geräte wird eine Reihe von Verteilungskämpfen zur Folge haben: Wessen Betriebssystem und wessen Cloud-Infrastruktur werden den Markt dominieren? Wessen Standards zur Kommunikation zwischen den Sensoren und Geräten werden sich durchsetzen? Und offenbar auch: Wessen Stimme wird die meisten Fragen der Nutzer beantworten? Die von Siri, die von Cortana oder doch eine, die zu keinem der großen US-Unternehmen gehört?

Der Quellcode von Sirius steht auf Github bereit. Schon jetzt beruht das System auf Bausteinen mehrerer Hochschulen, die Technik für die Spracherkennung zum Beispiel stammt von der Carnegie Mellon University, Microsoft und der RWTH Aachen. Gefördert wird das Projekt auch von Google, der Defense Advanced Research Projects Agency (Darpa) und der National Science Foundation (NSF). Sirius ist deshalb noch keine hübsche, einfach zu installierende und bedienende App, sondern ein Sammelsurium aus Paketen, die technisch versierte Nutzer von Hand kompilieren müssen.

Cortana und der deutsche Humor

In vielerlei Hinsicht steht Sirius also noch ganz am Anfang seiner Entwicklung, während die großen Unternehmen ihre virtuellen Assistenten immer weiter verfeinern. Google und Microsoft zum Beispiel verrieten in dieser Woche auf der Search Marketing Expo in München, was ihre Assistenten bald können sollen. So werde Google Now künftig Standortdaten nutzen, um den Kontext einer Nutzerfrage zu erkennen, berichtet Heise Online. Außerdem, so hatte Google auf dem SXSW-Festival in Austin bekanntgegeben, werde Google die API von Google Now öffnen. Dann können Drittentwickler die Daten aus ihren Apps in Google Now einspeisen und das Werkzeug damit sehr viel mächtiger machen, als es bisher ist.

Wenn Microsoft im Sommer sein neues Betriebssystem Windows 10 auf den Markt bringt, wird Cortana integriert sein und damit auf Desktop-PCs funktionieren. Das Unternehmen bringt seinem System derzeit Deutsch bei. Ziel ist es, dass Nutzer dem System vertrauen und ihm etwas über sich verraten, sagte Microsoft-Manager Marcus Ash Golem.de. Nur was sie freiwillig preisgeben, solle Cortana auswerten dürfen.

Wie viel Humor die deutsche Cortana bekommen soll, stehe allerdings noch nicht fest, sagte Ash. Während US-Nutzer freche Antworten auf Scherzfragen wie "Willst du mich heiraten" erwarten würden und damit auch gut umgehen könnten, wisse Microsoft nicht, wie die Deutschen darauf reagieren würden. Deshalb wolle Microsoft das System zunächst sehr konservativ gestalten. So natürlich die Mensch-Maschine-Kommunikation auch werden muss, um akzeptiert zu werden - allzu menschlich darf sie zumindest hierzulande nicht werden, glaubt Microsoft.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


nf1n1ty 12. Apr 2018

Dann bin ich doch nicht der letzte, der diese Form der Scham verspürt. Danke! :D

1ynx 22. Mär 2015

Bei mir läufts inzwischen. Fehlt nurnoch der Wiki-Dump den ich mir gerade lade...

floriq 22. Mär 2015

und die bieten wesentlich mehr als nur nen Cloud-Service für open source Spracherkennung ...

Anonymer Nutzer 22. Mär 2015

Ja, genauso wie Linux Windows platt gemacht hat.

Anonymer Nutzer 22. Mär 2015

Er meint, dass es da wohl eine Klage wegen Verwechslungsgefahr geben wird.



Aktuell auf der Startseite von Golem.de
Bundesservice Telekommunikation  
Ist eine scheinexistente Behörde für Wikipedia relevant?

Die IT-Sicherheitsexpertin Lilith Wittmann hat eine dubiose Bundesbehörde ohne Budget entdeckt. Reicht das für einen Wikipedia-Artikel?

Bundesservice Telekommunikation: Ist eine scheinexistente Behörde für Wikipedia relevant?
Artikel
  1. Elektroauto: VW e-Up ab Mitte Februar wieder bestellbar
    Elektroauto
    VW e-Up ab Mitte Februar wieder bestellbar

    Der e-Up gehörte 2021 zu den meistgekauften Elektroautos. Nun will VW den Kleinwagen wieder verfügbar machen.

  2. Bitcoin, Ethereum: Was steuerlich bei Kryptowährungen gilt
    Bitcoin, Ethereum
    Was steuerlich bei Kryptowährungen gilt

    Kryptowährungen wie Bitcoin sind unter Anlegern beliebt - doch wie muss man die Gewinne eigentlich versteuern?

  3. Neues Geschäftsmodell: Luca-App plant flexible Abos und will Preise senken
    Neues Geschäftsmodell
    Luca-App plant flexible Abos und will Preise senken

    Angesichts drohender Kündigungen will die Luca-App den Bundesländern entgegenkommen.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Bosch Professional zu Bestpreisen • WSV bei MediaMarkt • Asus Vivobook Flip 14" 8GB 512GB SSD 567€ • Philips OLED 65" Ambilight 1.699€ • RX 6900 16GB 1.489€ • Samsung QLED-TVs günstiger • Asus Gaming-Notebook 17“ R9 RTX3060 1.599€ • Seagate 20TB SATA HDD [Werbung]
    •  /