KI wird schlauer – aber warum wird sie für App-Anbieter gleichzeitig zur Kostenfalle?
Viele kleine Anbieter von KI-Anwendungen stehen derzeit unter Druck: Obwohl die Preise pro Token bei großen Sprachmodellen wie GPT gesunken sind, steigen die Gesamtkosten. Grund dafür sind die neuen Reasoning-Modelle, die mehr Rechenschritte ausführen, Antworten doppelt prüfen, Webabfragen starten oder sogar kleine Programme schreiben. Diese zusätzliche „Denkarbeit“ verursacht eine deutlich höhere Token-Nutzung. Während ein einfacher Chat nur wenige hundert Token beansprucht, können komplexe Aufgaben bis zu einer Million Token verschlingen.
Besonders hart trifft es Coding-Tools wie Cursor oder Replit. Beide Anbieter mussten ihre Preise anpassen, da viele Nutzer ihr Monatsbudget inzwischen innerhalb weniger Tage verbrauchen. Trotz Margen von über 80 Prozent sorgt dies für Unmut in der Community – ein spürbarer Wechsel zu günstigeren Alternativen ist bislang aber ausgeblieben.
Eine mögliche Lösung sehen Experten im Einsatz „einfacherer“ Modelle. Diese erledigen Standardaufgaben nicht nur schneller und günstiger, sondern liefern in manchen Szenarien sogar bessere Resultate. Preislich macht sich das deutlich bemerkbar: Während OpenAIs GPT-5 Nano nur rund zehn US-Cent pro Million Token kostet, schlägt das Spitzenmodell GPT-5 mit über drei Dollar zu Buche.
