• IT-Karriere:
  • Services:

Linux: Siri bekommt Open-Source-Konkurrenz

Sirius erkennt Fotos und versteht gesprochene Fragen wie "Wo steht dieses Gebäude?". Es soll eine Linux-Alternative zu virtuellen Assistenten wie Apples Siri sein.

Artikel veröffentlicht am , Patrick Beuth/Zeit Online
Apples Siri auf einem iPhone 4S - nur einer von mehreren virtuellen Assistenten für Mobiltelefone
Apples Siri auf einem iPhone 4S - nur einer von mehreren virtuellen Assistenten für Mobiltelefone (Bild: Oli Scarff/Getty Images)

Apple hat Siri. Google hat Google Now. Microsoft hat Cortana. Blackberry hat seinen Assistant. Und Linux? Bekommt Sirius. Damit in Zukunft wirklich jeder mit seinem Computer reden kann.

Stellenmarkt
  1. Roche Diagnostics Automation Solutions GmbH, Kornwestheim
  2. dmTECH GmbH, Karlsruhe

Mit Sirius wollen Forscher am Clarity Lab der Universität von Michigan eine Open-Source-Alternative zu den proprietären virtuellen Assistenten der Branchengrößen schaffen. Sie testen Sirius derzeit auf dem Betriebssystem Ubuntu, es lässt sich aber auch auf anderen Linux-Distributionen installieren.

Bisher ist Sirius nur eine Kombination aus Sprach-, Bild- und Texterkennung mit beschränkten Ressourcen: Die Demoversion erkennt Sprachbefehle und Fotos, verarbeitet Fragen der Nutzer in der Cloud und antwortet. Einzige Wissensquelle ist derzeit eine statische Version der Wikipedia. Nutzer können Sirius zum Beispiel ein Foto des Empire State Building zeigen und fragen: "Wo steht dieses Gebäude?" Sirius erkennt das Foto und zerlegt die Frage in Schlüsselworte, die Antwort gibt eine männliche, ziemlich automatenhafte Stimme.

Im Vergleich zu den Fähigkeiten der etablierten virtuellen Assistenten wirkt das auf den ersten Blick rudimentär. Zwar bieten die etablierten Systeme bisher keine integrierte Bilderkennung, dafür können sie weit kompliziertere Aufgaben lösen. Google Now etwa ist mit diversen Google-Apps wie Wetter und Kalender verzahnt und kann seine Nutzer selbsttätig darauf hinweisen, dass sie aufgrund eines Verkehrsstaus früher als geplant zu einem Termin aufbrechen sollten.

Die Forscher des Clarity Lab hoffen, dass andere Universitäten oder Unternehmen und Privatpersonen Sirius weiterentwickeln und in neue Geräte integrieren. Sie gehen davon aus, dass Wearables und das Internet der Dinge dazu führen werden, dass Sprachsteuerung immer wichtiger wird, weil sich diese neuen Geräte nur bedingt oder gar nicht über Tastaturen oder Touch- und Wischgesten bedienen lassen.

Die zunehmende Anzahl vernetzter Geräte wird eine Reihe von Verteilungskämpfen zur Folge haben: Wessen Betriebssystem und wessen Cloud-Infrastruktur werden den Markt dominieren? Wessen Standards zur Kommunikation zwischen den Sensoren und Geräten werden sich durchsetzen? Und offenbar auch: Wessen Stimme wird die meisten Fragen der Nutzer beantworten? Die von Siri, die von Cortana oder doch eine, die zu keinem der großen US-Unternehmen gehört?

Der Quellcode von Sirius steht auf Github bereit. Schon jetzt beruht das System auf Bausteinen mehrerer Hochschulen, die Technik für die Spracherkennung zum Beispiel stammt von der Carnegie Mellon University, Microsoft und der RWTH Aachen. Gefördert wird das Projekt auch von Google, der Defense Advanced Research Projects Agency (Darpa) und der National Science Foundation (NSF). Sirius ist deshalb noch keine hübsche, einfach zu installierende und bedienende App, sondern ein Sammelsurium aus Paketen, die technisch versierte Nutzer von Hand kompilieren müssen.

Cortana und der deutsche Humor

In vielerlei Hinsicht steht Sirius also noch ganz am Anfang seiner Entwicklung, während die großen Unternehmen ihre virtuellen Assistenten immer weiter verfeinern. Google und Microsoft zum Beispiel verrieten in dieser Woche auf der Search Marketing Expo in München, was ihre Assistenten bald können sollen. So werde Google Now künftig Standortdaten nutzen, um den Kontext einer Nutzerfrage zu erkennen, berichtet Heise Online. Außerdem, so hatte Google auf dem SXSW-Festival in Austin bekanntgegeben, werde Google die API von Google Now öffnen. Dann können Drittentwickler die Daten aus ihren Apps in Google Now einspeisen und das Werkzeug damit sehr viel mächtiger machen, als es bisher ist.

Wenn Microsoft im Sommer sein neues Betriebssystem Windows 10 auf den Markt bringt, wird Cortana integriert sein und damit auf Desktop-PCs funktionieren. Das Unternehmen bringt seinem System derzeit Deutsch bei. Ziel ist es, dass Nutzer dem System vertrauen und ihm etwas über sich verraten, sagte Microsoft-Manager Marcus Ash Golem.de. Nur was sie freiwillig preisgeben, solle Cortana auswerten dürfen.

Wie viel Humor die deutsche Cortana bekommen soll, stehe allerdings noch nicht fest, sagte Ash. Während US-Nutzer freche Antworten auf Scherzfragen wie "Willst du mich heiraten" erwarten würden und damit auch gut umgehen könnten, wisse Microsoft nicht, wie die Deutschen darauf reagieren würden. Deshalb wolle Microsoft das System zunächst sehr konservativ gestalten. So natürlich die Mensch-Maschine-Kommunikation auch werden muss, um akzeptiert zu werden - allzu menschlich darf sie zumindest hierzulande nicht werden, glaubt Microsoft.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Hardware-Angebote
  1. täglich neue Deals bei Alternate.de
  2. (reduzierte Überstände, Restposten & Co.)

nf1n1ty 12. Apr 2018

Dann bin ich doch nicht der letzte, der diese Form der Scham verspürt. Danke! :D

1ynx 22. Mär 2015

Bei mir läufts inzwischen. Fehlt nurnoch der Wiki-Dump den ich mir gerade lade...

floriq 22. Mär 2015

und die bieten wesentlich mehr als nur nen Cloud-Service für open source Spracherkennung ...

Anonymer Nutzer 22. Mär 2015

Ja, genauso wie Linux Windows platt gemacht hat.

Anonymer Nutzer 22. Mär 2015

Er meint, dass es da wohl eine Klage wegen Verwechslungsgefahr geben wird.


Folgen Sie uns
       


Die Evolution des Microsoft Flugsimulator (1982-2020)

Die Entwicklung des Flugsimulator zeigt die beeindruckenden Fortschritte der Spielegrafik in den letzten Jahrzehnten.

Die Evolution des Microsoft Flugsimulator (1982-2020) Video aufrufen
Coronavirus und Karaoke: Gesang mit Klang trotz Gesichtsvorhang
Coronavirus und Karaoke
Gesang mit Klang trotz Gesichtsvorhang

Karaokebars sind gefährliche Coronavirus-Infektionsherde. Damit den Menschen in Japan nicht ihr Hobby genommen wird, gibt es nun ein System, das auch mit Mundschutz gute Sounds produzieren soll.
Ein Bericht von Felix Lill

  1. Corona Gewerkschaft sieht Schulen schlecht digital ausgestattet
  2. Corona Telekom und SAP sollen europaweite Warn-Plattform bauen
  3. Universal Kinofilme kommen früher ins Netz

Pixel 4a im Test: Google macht das Pixel kleiner und noch günstiger
Pixel 4a im Test
Google macht das Pixel kleiner und noch günstiger

Google macht mit dem Pixel 4a einiges anders als beim 3a - und eine Menge richtig, unter anderem beim Preis. Im Herbst sollen eine 5G-Version und das Pixel 5 folgen.
Ein Test von Tobias Költzsch

  1. Smartphone Google stellt das Pixel 4 ein
  2. Android Googles Dateimanager erlaubt PIN-geschützten Ordner
  3. Google Internes Dokument weist auf faltbares Pixel hin

Threat-Actor-Expertin: Militärisch, stoisch, kontrolliert
Threat-Actor-Expertin
Militärisch, stoisch, kontrolliert

Sandra Joyces Fachgebiet sind Malware-Attacken. Sie ist Threat-Actor-Expertin - ein Job mit viel Stress und Verantwortung. Wenn sie eine Attacke einem Land zuschreibt, sollte sie besser sicher sein.
Ein Porträt von Maja Hoock

  1. Emotet Die Schadsoftware Trickbot warnt vor sich selbst
  2. Loveletter Autor des I-love-you-Virus wollte kostenlos surfen
  3. DNS Gehackte Router zeigen Coronavirus-Warnung mit Schadsoftware

    •  /