Google macht mit seinem neuen KI-Flaggschiff Gemini 2.5 Pro mächtig Eindruck. Das Modell punktet nicht nur in anspruchsvollen Benchmarks, sondern wird überraschend günstig angeboten. Was steckt hinter diesem Erfolg?
Fortschritt durch Verfügbarkeit und Leistung
Alphabet-CEO Sundar Pichai beschreibt Gemini 2.5 Pro als das intelligenteste und gefragteste Modell von Google – und das spiegelt sich auch in der Nachfrage wider: Im aktuellen Monat ist diese um über 80 Prozent gestiegen, sowohl im Google AI Studio als auch über die Gemini API.
Seit dieser Woche ist Gemini 2.5 Pro mit höheren Nutzungslimits in einer öffentlichen Vorschau verfügbar – inklusive kostenfreiem Zugang im „Free Tier“. Nutzer des Gemini Web-Chats können weiterhin das 2.5 Pro Experimental-Modell verwenden, das die gleiche Leistung bietet. Google plant weitere Ankündigungen zur Konferenz Google Cloud Next ’25, die am 9. April beginnt.
Ein Modell für alle Preisklassen
Auch preislich setzt Google mit Gemini 2.5 Pro neue Maßstäbe. Die API wird in gestaffelten Preismodellen angeboten:
- Bei Prompts bis zu 200.000 Tokens kostet die Eingabe $1,25 pro Million Tokens, die Ausgabe $10.
- Für größere Prompts steigen die Preise auf $2,50 für die Eingabe und $15 für die Ausgabe pro Million Tokens.
Bemerkenswert: Die Grounding-Funktion mit Google-Suche bleibt bis zu 500 Anfragen pro Tag kostenfrei, während im Paid Tier 1.500 weitere Anfragen frei sind. Zusätzliche Anfragen kosten $35 pro 1.000 Anfragen.
Daten aus kostenfreiem Zugang dürfen von Google für KI-Training verwendet werden, aus dem Bezahlmodell hingegen nicht. Verglichen mit konkurrierenden Modellen wie Claude 3.7 Sonnet bleibt Gemini 2.5 Pro dennoch deutlich günstiger – bei gleicher oder besserer Leistung.
Überragende Leistung in Benchmarks
Im GPQA-Diamond-Benchmark, der besonders schwierige Multiple-Choice-Fragen aus Biologie, Chemie und Physik enthält, erreicht Gemini 2.5 Pro eine Punktzahl von 84 Prozent. Das ist deutlich besser als der Durchschnittswert menschlicher Experten, der bei rund 70 Prozent liegt.
Obwohl Google keine technischen Details zur Architektur, den verwendeten Trainingsdaten oder dem Rechenaufwand veröffentlicht, bestätigt das Forschungskollektiv EpochAI die außergewöhnlichen Ergebnisse. Aufgrund niedriger Rate-Limits konnte das Modell jedoch nur eingeschränkt getestet werden.
Auch im anspruchsvollen „Humanity’s Last Exam“ überzeugt Gemini 2.5 Pro mit einem Bestwert von 18,8 Prozent – höher als alle anderen Modelle ohne zusätzliche Werkzeuge.
Beeindruckende Ergebnisse im IQ-Test
In einem wöchentlich durchgeführten IQ-Test auf trackingAI.org erreicht das Gemini 2.5 Pro Modell einen durchschnittlichen IQ-Wert von etwa 130. Zum Vergleich: Der Median der getesteten Sprachmodelle liegt zwischen 90 und 110.
Der Test basiert auf einer verbalen Version des norwegischen Mensa-IQ-Tests. Interessanterweise erfolgen die Tests im Offline-Modus, sodass die Fragen nicht Teil der Trainingsdaten des Modells sind. Falls eine Frage nicht beantwortet wird, kann diese bis zu zehnmal wiederholt werden.
Lob aus der Entwickler-Community
Das Modell erhält nicht nur in Tests, sondern auch von Experten viel Anerkennung. Informatiker François Chollet verwendet Gemini 2.5 Pro als tägliches Arbeitsmodell und bezeichnet es als das beste Modell für fast alle Aufgaben – mit Ausnahme der Bildgenerierung, bei der es dennoch ebenfalls überzeugt.
Investor Martin Casado nutzt das Modell vor allem für Codierungsaufgaben. Peter Yang hebt Gemini 2.5 Pro als das derzeit beste Modell für Programmieraufgaben hervor, während der japanische KI-Forscher Shane Gu das herausragende Kosten-Nutzen-Verhältnis lobt.