Die neueste Innovation von OpenAI, GPT-4o, wurde am 13. Mai 2024 während eines Live-Events präsentiert und sorgt für Aufsehen in der Tech-Welt.
GPT-4o, von OpenAI als Omnimodell für Künstliche Intelligenz bezeichnet, vereint Audio, Text und Vision auf eine einzigartige, native Weise. Mira Murati, die CTO von OpenAI, erläuterte, dass GPT-4o künftig sowohl in ChatGPT als auch über API verfügbar sein wird. Dies verspricht eine erhebliche Verbesserung in Bezug auf Latenz und Kosteneffizienz, da es nicht mehr nötig ist, verschiedene Modelle miteinander kommunizieren zu lassen.
Mit GPT-4o können Nutzer ihre Smartphone-Kamera verwenden, um Fragen zu stellen, einfache Mathematikaufgaben auf Papier zu überprüfen oder sich über den Sinn von Code-Schnipseln zu unterhalten. Darüber hinaus kann das Modell Emotionen in Live-Selfies erkennen und bietet somit vielseitige Einsatzmöglichkeiten. Auch die Desktop-Anwendung von ChatGPT wird erneuert, um die wachsende Anzahl an Funktionen besser zu unterstützen und gleichzeitig eine natürliche Bedienung zu gewährleisten.
Ein weiteres Highlight ist, dass GPT-4o Text- und Bildfunktionen sofort zur Verfügung stellt. Es wird kostenfrei nutzbar sein, jedoch können ChatGPT Plus-Nutzer fünfmal mehr Nachrichten pro Tag verarbeiten. In den kommenden Wochen wird der Sprachmodus von GPT-4o als Alpha-Version für Plus-Nutzer verfügbar gemacht. Entwickler können über die API auf GPT-4o als Text- und Bildmodell zugreifen, das doppelt so schnell ist, die Hälfte kostet und ein fünffach höheres Rate-Limit bietet als GPT-4 Turbo.
Eine spannende neue Funktion sind provisorische Chats, die nicht im Verlauf angezeigt und nicht für das Training der KI-Modelle verwendet werden, aber aus Sicherheitsgründen 30 Tage lang von OpenAI aufbewahrt werden. Während OpenAI mit der Einführung von GPT-4o für Schlagzeilen sorgt, bleibt die Tech-Welt gespannt auf die neuesten Ankündigungen von Google, da die hauseigene Messe Google I/O am 14. Mai 2024 stattfindet und reichlich KI-News verspricht.