Google treibt die KI-Entwicklung für Programmierer weiter voran.
Doch wie viel Mehrwert bietet Gemini Pro 2.5 im echten Entwickleralltag?
Die „I/O Edition“ des Sprachmodells Gemini 2.5 Pro wurde pünktlich zur Entwicklerkonferenz Google I/O vorgestellt. Mit ihr will Google vor allem Web-Entwicklerinnen und Entwickler begeistern, die auf präzise Code-Unterstützung und smarte Automatisierung setzen. Der Fokus liegt auf der Frontend-Entwicklung und komplexen Aufgaben wie agentenbasierten Workflows.
Laut Google setzt Gemini 2.5 Pro neue Maßstäbe im Benchmark WebDev Arena. Die Bewertung menschlicher Tester bescheinigt dem Modell höchste Qualität in Design und Funktion. Kein Wunder also, dass Start-ups wie Cognition und Replit es bereits einsetzen, um eigenständig programmierende Code-Agenten zu entwickeln.
Neues Terrain: Video und visuelle Daten im Codefluss
Ein echtes Highlight ist die Fähigkeit zur Videoanalyse. Mit stolzen 84,8 % im VideoMME-Test kann Gemini Code aus Videoinhalten generieren – etwa interaktive Lernplattformen aus YouTube-Clips, inklusive Benutzungsoberfläche und didaktischem Konzept. Auch aus Bildern lassen sich direkt Visualisierungen ableiten.
Ein weiteres Feature: die Unterstützung bei typischen Entwickleraufgaben. Wer etwa Design-Dateien analysieren und CSS anpassen muss, bekommt Hilfe von Gemini 2.5 Pro – bis hin zur vollständigen Integration neuer Features, wie dem Einfügen eines Videoplayers im Gemini-95-Stil.
Beispiel gefällig? Die neue Diktier-App demonstriert eindrucksvoll, wie schnell kreative Ideen in lauffähige Software überführt werden können. Sie glänzt mit animierten Mikrofonwellen, responsivem Layout und eleganten Hover-Effekten – umgesetzt fast wie von Zauberhand.
Verfügbarkeit und Leistung
Gemini 2.5 Pro lässt sich direkt über die Gemini-API im Google AI Studio oder über Vertex AI nutzen. Wer die ältere Version im Einsatz hat, wird automatisch aktualisiert – ganz ohne Aufpreis. Neben einer gesenkten Fehlerquote bei Funktionsaufrufen punktet das Modell auch mit einer höheren Auslösegenauigkeit für Funktionstrigger.
Das neue Modell ist Googles bisher stärkstes multimodales System – es verarbeitet neben Text auch Bilder, Videos, Audiodaten und Code. Gerade bei anspruchsvollen Denkaufgaben und der Entwicklung komplexer Web-Anwendungen spielt Gemini 2.5 Pro seine Stärken voll aus.