xAI bringt ein neues Modell, das fast genauso leistungsfähig ist wie Grok 4 – aber mit deutlich weniger Rechenaufwand. Doch kann Effizienz wirklich den Unterschied machen?
Mit Grok 4 Fast verfolgt Elon Musks KI-Unternehmen einen klaren Kurs: Mehr Leistung bei weniger Verbrauch. Laut xAI benötigt das Modell rund 40 % weniger Rechenleistung als Grok 4 – und senkt dadurch die Kosten pro Aufgabe drastisch, in manchen Fällen sogar um bis zu 98 %. In Benchmarks wie GPQA Diamond oder AIME 2025 erzielt Grok 4 Fast Werte, die sich mit Grok 4 oder sogar GPT-5 messen lassen. Besonders bei komplexen Aufgaben zeigt sich die Stärke: Weniger „Thinking Tokens“, aber ähnliche Qualität.
Spannend ist auch die Architektur. Statt verschiedene Modelle für kurze Antworten und tiefes Reasoning zu kombinieren, vereint Grok 4 Fast beides. Gesteuert wird das Verhalten über den Systemprompt. Dazu kommt die Fähigkeit, externe Tools einzusetzen – von Webbrowser bis Codeausführung. In Benchmarks wie BrowseComp und X Bench Deepsearch liegt Grok 4 Fast sogar vor seinem großen Bruder, und im LMArena-Search-Ranking schlägt es OpenAIs o3-websearch.
Für Entwickler bietet xAI zwei Varianten an: eine Version für reasoning-lastige Aufgaben und eine für schnelle Antworten. Beide kommen mit einem enormen Kontextfenster von bis zu 2 Millionen Tokens. Preislich bewegt sich das Ganze zwischen 0,05 $ und 1 $ pro Million Tokens – und wer schnell ist, kann Grok 4 Fast aktuell sogar kostenfrei über OpenRouter oder Vercel ausprobieren.