Google macht leistungsstarke KI-Modelle noch zugänglicher – mit beeindruckenden Preissenkungen und erweiterten Sprachfähigkeiten.
Google hat eine erhebliche Preissenkung für sein beliebtes KI-Modell Gemini 1.5 Flash angekündigt, das insbesondere für Anwendungen mit hohen Anforderungen an Geschwindigkeit und geringe Latenz genutzt wird. Die Kosten für Eingabe-Token wurden um beeindruckende 78 Prozent auf 0,075 US-Dollar pro Million Token gesenkt. Auch die Kosten für Output-Token wurden um 71 Prozent reduziert, sodass diese nun bei 0,30 US-Dollar pro Million Token liegen – dies gilt für Prompts, die weniger als 128.000 Token umfassen.
Diese Preissenkungen betreffen nicht nur kürzere Prompts, sondern erstrecken sich auch auf längere Anfragen und das Caching. Damit reagiert Google auf die wachsende Nachfrage nach schnellen und effizienten KI-Lösungen in Bereichen wie Kategorisierung, Zusammenfassungen und multimodalem Verstehen.
Zusätzlich zu den Preisreduktionen hat Google das Sprachverständnis der Gemini 1.5 Pro- und Flash-Modelle auf über 100 Sprachen ausgeweitet. Entwickler weltweit können nun in ihrer bevorzugten Sprache arbeiten und von den erweiterten Funktionen profitieren. Besonders hervorzuheben ist die erweiterte Unterstützung für das Fine-Tuning von Modellen. Entwickler haben nun über die Gemini-API und Google AI Studio die Möglichkeit, Basismodelle durch die Bereitstellung zusätzlicher Daten an spezifische Aufgaben anzupassen. Dies führt nicht nur zu einer Reduzierung der Kontextgröße von Prompts, sondern verbessert auch die Genauigkeit und senkt gleichzeitig die Latenz und Kosten. Ein weiteres Highlight ist die verbesserte Fähigkeit der Gemini-Modelle, PDFs durch die native multimodale Verarbeitung zu verstehen. Dies bedeutet, dass Texte, Bilder und andere visuelle Inhalte innerhalb eines PDFs nahtlos verarbeitet werden können – eine Funktion, die für viele Entwickler von großem Nutzen sein wird.