Microsoft bringt eine spannende Neuerung in seinen Edge-Browser: Copilot Vision ist da!
Wie genau verändert diese Funktion unser Nutzererlebnis im Web?
Microsofts KI-Chef Mustafa Suleyman zeigte sich begeistert auf Bluesky: Die neue Copilot Vision-Funktion ist jetzt für den Browser Edge verfügbar. Was auf den ersten Blick futuristisch klingt, ist eine gezielte Erweiterung – Copilot kann sehen, was Nutzer auf bestimmten Webseiten sehen.
Aktiviert werden muss die Funktion manuell über das kleine Brillen-Symbol neben dem Copilot-Mikrofon. Standardmäßig bleibt sie ausgeschaltet, vermutlich auch als Reaktion auf die Datenschutzbedenken, die Microsofts vorherige Funktion „Recall“ ausgelöst hatte.
Copilot Vision funktioniert aktuell nur auf ausgewählten Plattformen wie Wikipedia, Amazon, OpenTable und TripAdvisor – wobei einige dieser Partnerseiten in der EU nicht verfügbar sind. Dennoch: Nutzer können direkt mit der KI über das interagieren, was auf ihrem Bildschirm zu sehen ist, ohne etwas kopieren oder aufwendig erklären zu müssen.
Auch andere Branchengrößen wie Google, OpenAI und Meta statten ihre KI-Dienste zunehmend mit „Augen“ aus. Googles Gemini Live etwa erkennt nicht nur Displayinhalte, sondern nutzt auch die Smartphone-Kamera für seine Analysen. OpenAI bietet ähnliche Features im Advanced Voice Mode, während Meta dank smarter Ray-Ban-Brillen sogar die reale Umgebung auswertet.
Bei Microsoft gibt es erste Tests für Windows-Insider: Copilot Vision kann hier auch Inhalte aus geöffneten Dateien und Browserfenstern erfassen. Die Funktion startet zunächst exklusiv in den USA, während eine weltweit verfügbare, KI-gestützte Sucherweiterung bereits auf dem Weg ist.