Copilot Vision in Edge: Microsofts KI kann jetzt den Inhalt von Webseiten sehen

Microsoft hat ein neues Feature für Microsoft Edge veröffentlicht. Copilot Vision analysiert die angezeigten Webseiteninhalte und soll sie einordnen und zusammenfassen können. Das können etwa Kochrezepte, News-Artikel oder Jobinserate sein. Mustafa Suleyman, Chef von Microsoft AI, hat das Feature in einem Post auf Bluesky vorgestellt(öffnet im neuen Fenster) .
"Das Feature kann sprichwörtlich sehen, was auf dem Bildschirm angezeigt wird" , schreibt der Manager. Allerdings müssen sich User dafür zuvor anmelden und die Funktion freischalten. Anschließend hat die KI, die in Microsofts Cloud gehostet wird, Zugriff auf angezeigte Inhalte. Sie kann so etwa Rezensionen zusammenfassen oder Ratschläge beim Onlineshopping geben - beispielsweise welcher Stoff zu welchem Outfit passen könnte.
Daten werden nicht gespeichert
Die KI soll auch einzelne Elemente auf dem Bildschirm markieren können. Richtige Klicks kann sie allerdings nicht durchführen. Sie kann also auch nicht automatisch auf angezeigte Links klicken oder andere Steuerungen des Computers übernehmen. "Copilot Vision ist hier, um Antworten auf Fragen zu geben, nicht um selbständig Aktionen durchzuführen" , schreibt Microsoft in einem Blog-Post(öffnet im neuen Fenster) . Außerdem sollen nur Interaktionen der Software aufgezeichnet werden. Die KI behält kein Gedächtnis davon, was auf dem Bildschirm bei vorangegangenen Sitzungen angezeigt wurde.
Diese bildschirmanalysierende KI kann teilweise auch betriebssystemweit genutzt werden. Allerdings ist dafür ein Copilot-Pro-Abonnement(öffnet im neuen Fenster) erforderlich. Das kostet 22 Euro pro Monat und Account. Die KI kann dann etwa Hilfestellungen in Programmen wie Word oder Photoshop geben. Auch hier sollen keine angezeigten Daten gespeichert werden.