OpenAI hat nachgelegt.
Was steckt hinter dem Upgrade für den Operator-Agenten – und wie verbessert es die Navigation durch das Internet?
Verbesserte Web-Intelligenz für Operator
Der Operator-Agent von OpenAI, bekannt als Computer-Using Agent (CUA), wird jetzt noch leistungsfähiger: Dank des neuen o3-Modells arbeitet er strukturierter, zielgerichteter und effektiver im Web. Während bisher GPT-4o zum Einsatz kam, basiert die neue Version nun vollständig auf der weiterentwickelten o3-Architektur. Nutzerinnen und Nutzer von ChatGPT Pro weltweit können das Upgrade bereits als Forschungsvorschau testen – in der API bleibt GPT-4o allerdings weiterhin aktiv.
Das Besondere am CUA: Er bedient Webseiten wie ein Mensch – scrollt, klickt und füllt Felder aus. Ziel ist es, komplexe Aufgaben automatisiert zu lösen, ohne dass der Mensch eingreifen muss. Seit Januar 2025 ist diese Funktion im Testeinsatz, nun kommt mit o3 ein entscheidender Qualitätssprung.
Was kann das o3-Modell besser?
Im Zentrum der Verbesserungen steht die Interaktion mit Webseiten: Der Agent versteht Inhalte präziser, trifft bessere Entscheidungen und strukturiert seine Ausgaben deutlich klarer. In Benchmarks wie OSWorld und WebArena erzielt das neue Modell Top-Ergebnisse. Auch bei Nutzertests zu Antwortqualität liegt es klar vor dem bisherigen GPT-4o-Operator.
Sicherheitsorientiertes Finetuning inklusive
OpenAI hat das neue Modell nicht einfach nur leistungsstärker gemacht, sondern auch auf Sicherheit getrimmt. Spezielle Trainingsdaten helfen dem Agenten, in bestimmten Situationen angemessen zu reagieren – etwa bei unerwarteten Webinhalten oder betrügerischen Formularen. Dabei ist wichtig zu wissen: Obwohl das Modell die Programmierfähigkeiten der o3-Reihe erbt, besitzt der Operator keinen Zugriff auf Coding-Umgebungen oder Terminals. Das reduziert mögliche Risiken.
Dennoch bleiben Herausforderungen: Da der Agent Webseiten ähnlich wie Prompts interpretiert, besteht weiterhin ein Restrisiko durch manipulierte Inhalte – beispielsweise Phishing-Seiten, die ihn zu ungewollten Handlungen verleiten könnten.