Offline geht nix
Ist unser Smartphone offline, funktioniert mit Gemini entsprechend gar nichts. Wir können dann auch keine Funktionen ausführen, die zuvor vom Google Assistant erledigt wurden, etwa das Stellen eines Timers. Schon für die Erkennung unserer Spracheingaben benötigt Gemini eine Internetverbindung – ohne die geht nix. Der Vorteil dieser Auslagerung in die Cloud ist, dass auch weniger leistungsfähige Smartphones Gemini verwenden können. Der Nachteil ist, dass alle Daten über Server bei Google laufen.
Wer die fehlenden Funktionen wie das Starten von Routinen und das Setzen von Tasks vermisst, kann in den Einstellungen der Gemini-App auch wieder zum Google Assistant zurückwechseln. Gemini läuft dann nur noch in der App, auf das Hey-Google-Kommando meldet sich dann wieder der gewohnte Assistant. Wir sind allerdings bei Gemini geblieben, auch weil Google die KI gut in das Android-System einbindet.
So lassen sich beispielsweise Bildschirminhalte einfach in die multimodale KI-Suche einbinden. Rufen wir Gemini per Sprachkommando auf, während wir eine Anwendung geöffnet haben, bekommen wir automatisch den Vorschlag, einen Screenshot des aktuellen Bildschirms in unsere Frage einzubinden. Dann können wir unsere eigentlich Frage ergänzen und bekommen eine Antwort, die den Screenshot mit einschließt.
Einbindung ins Android-System ist praktisch
Mit diesem System können wir beispielsweise den Text einer E-Mail als Screenshot einfügen und Gemini bitten, eine Antwort zu schreiben. Das funktioniert in unseren Tests gut, wenn wir die KI beispielsweise darum bitten, eine positive Antwort zu formulieren. Gemini kann aber natürlich nicht unseren Schreibstil imitieren, weswegen einer Person, die häufiger mit uns Kontakt hat, sofort auffallen dürfte, dass die Antwort nicht von uns stammt. Das System an sich funktioniert aber, Gemini schreibt in unseren Tests keinen Quatsch.
Bei Internetseiten ermittelt Gemini direkt die Webadresse und lässt es nicht auf dem kleinen Ausschnitt des Screenshots beruhen. Wir können die KI per Sprachkommando aufrufen, eine Webseite einfügen und beispielsweise um die Zusammenfassung eines Artikels bitten. Auch das funktioniert in unseren Tests gut und ist etwas komfortabler als das manuelle Kopieren und Einfügen der Webadresse, wie wir es bei Copilot machen müssten.
Auf die gleiche Art und Weise können wir auch Übersetzungen von Internetseiten in Auftrag geben. Diese gibt Gemini allerdings auch nur in Form einer Zusammenfassung aus. Wollen wir eine direkte Übersetzung des gesamten Texts, müssen wir dies wie bisher über die Übersetzungsfunktion des Browsers erledigen.
Interessant ist die Verknüpfung von Gemini mit Google Workspace, also dem Google-Konto der Nutzer. Dann kann der KI-Assistent auf Inhalte von E-Mails in Gmail oder auch auf Dokumente bei Google Docs zugreifen. Wir können dann beispielsweise per Sprachkommando nach einem anstehenden Termin fragen, der sich in einer E-Mail bei Gmail befindet. Die Verknüpfung mit den Daten der anderen Google-Dienste funktioniert allerdings aktuell nur auf Englisch – an dieser Stelle lässt sich gut erkennen, dass die Gemini-App eigentlich noch nicht in Deutschland gestartet ist.
Auch die Gemini-App neigt zu Fantasien
Fragen wir beispielsweise nach E-Mail-Inhalten in Gmail, erklärte Gemini zunächst nur, wie wir in der Gmail-App nach Inhalten suchen können – quasi eine neutrale Antwort mit dem Eingeständnis, an dieser Stelle nicht weiterhelfen zu können. Mittlerweile ist Gemini aber soweit, sich Quatsch auszudenken. So erfindet die KI bei der Frage nach einer Reise einen komplett fiktiven Reiseplan, inklusive falschen Daten, falschem Hotel, einem Flug, den es nicht gibt, sowie einer Stadtführung, die wir nicht gebucht haben.
Anders als bei der Frage auf Englisch wird uns auch nicht die Verbindung zu Workspace angezeigt. Diese dürfte bei einer offiziellen Einführung der Gemini-App in Deutschland wohl auch bei deutschsprachigen Anfragen erfolgen – solange dies nicht der Fall ist, sollten derartige Sprachbefehle nur auf Englisch durchgeführt werden.
In unserem Test haben wir festgestellt, dass die Qualität der Ergebnisse bei Anfragen nach Gmail- oder Docs-Inhalten von kleinsten Nuancen bei den Fragen abhängt. Mitunter bekamen wir bei fast identischen Anfragen sehr ausführliche Antworten mit vielen korrekten Details, mal sehr knappe Antworten ohne viel Inhalt. Hier lohnt es sich, die Fragen sehr genau zu stellen.
Wie auch mit der Copilot-App können wir mit Gemini auf dem Smartphone Dinge fotografieren und Fragen dazu stellen. Auch an dieser Stelle stießen wir auf das bei generativen KIs bekannte Problem, dass sie sich bei Nichtwissen gerne mal Sachen ausdenken. Besonders interessant war das, als wir eine Flasche Vita Cola fotografiert haben.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
| Gemini-App im Test: Taugt Googles KI-App Gemini als Sprachassistent? | Die wunderliche Geschichte der Vita Cola |










Pixel 6 Pro funktioniert ebenfalls einwandfrei. Nach dem Umschalten auf Englisch einmal...
Das mit Google Home/Nest/Mini würde mich auch interessieren! Habe dazu nirgends Infos...
Nein, es sind vielleicht noch 5% der Antworten halluziniert.
Kommentieren