Die Entwicklung überrascht: Statt günstiger wird der Einsatz moderner KI-Modelle für viele Firmen teurer. Doch warum ist das so – und welche Auswege gibt es?
Immer mehr Anbieter von KI-Anwendungen spüren die steigenden Kosten. Zwar sind die Preise pro Token – also pro kleinster Recheneinheit – laut Wall Street Journal gefallen, doch die Gesamtausgaben steigen. Grund sind die neuen sogenannten Reasoning-Modelle. Sie sind so konzipiert, dass sie intensiver nachdenken: Antworten mehrfach überprüfen, Webrecherchen durchführen oder sogar kleine Programme schreiben. Das klingt beeindruckend, verursacht aber einen enormen Mehraufwand an Rechenoperationen.
Eine einfache Chatbot-Anfrage verbraucht nur wenige Hundert Token. Bei komplexeren Aufgaben können es schnell Hunderttausende oder sogar Millionen sein. Besonders stark betroffen sind Anbieter von Coding-KI-Tools wie Cursor oder Replit. Dort mussten die Preise angepasst werden, weil manche Nutzer ihr Monatsguthaben schon nach wenigen Tagen ausgeschöpft hatten. Trotzdem bleiben die Margen hoch – zum Teil über 80 Prozent. Noch ist keine massive Abwanderung von Kunden zu beobachten, auch wenn Diskussionen in Foren zunehmen.
Eine denkbare Lösung: Für einfache Aufgaben kleinere, günstigere Modelle einsetzen. Denn nicht jede Anfrage braucht die volle Power eines GPT-5. So kostet das kompakte GPT-5 Nano nur rund 10 Cent pro einer Million Token, während das Spitzenmodell GPT-5 mit über drei Dollar zu Buche schlägt. Für viele Unternehmen könnte hier ein smarter Spagat zwischen Leistungsfähigkeit und Kostenkontrolle liegen.
