Kling AI sorgt mit Video O1 für Aufsehen – ein Modell, das verschiedenste Aufgaben der Videogenerierung und -bearbeitung unter einem Dach vereint. Doch was bedeutet das konkret für Anwender?
Video O1 ist mehr als ein weiteres KI-Modell für kurze Clips. Es bringt unterschiedliche Ansätze der Bild-, Text- und Videobearbeitung in einem einzigen System zusammen. Besonders bemerkenswert ist die Fähigkeit, mehrere Veränderungen gleichzeitig umzusetzen. Während man bei anderen Tools oft verschiedene Schritte kombinieren muss, lassen sich hier Subjekte, Hintergründe, Stile oder Farbstimmungen in einem Prompt anpassen. Das eröffnet kreative Spielräume und spart Zeit.
Das Modell versteht bis zu sieben Eingaben parallel – seien es Referenzbilder, Videodateien, Szenen oder einfache Textbefehle. Dadurch wirken Bearbeitungen deutlich natürlicher. Ob Figuren ergänzt, Passanten entfernt oder Tageslicht in Dämmerung verwandelt werden sollen: Die KI setzt Eingriffe um, ohne dass manuell maskiert oder mit Keyframes gearbeitet werden muss. Besonders für Content-Produzenten kann das ein echter Effizienzgewinn sein.
Technisch bleibt Kling an einigen Stellen vage, verweist aber auf einen multimodalen Transformer und eine eigene „Multimodale Visual Language“. Diese soll dabei helfen, komplexe Eingaben zu strukturieren und Videoinhalte konsistent zu interpretieren – ein klarer Hinweis darauf, wohin sich Generative Video AI weiterbewegen könnte: hin zu Systemen, die nicht nur generieren, sondern verstehen.
Kling positioniert sich zudem selbstbewusst gegenüber Wettbewerbern. Interne Vergleiche sollen zeigen, dass Video O1 Bildreferenzen besser umsetzt als Googles Veo 3.1 und bei Video-Transformationen klar vor Runway Aleph liegt. Externe Bestätigungen fehlen, doch das Rennen im Videomarkt wird ohnehin von schnellem Fortschritt geprägt. Runway hat fast zeitgleich Gen-4.5 vorgestellt, und auch OpenAI, Google und Midjourney arbeiten an hochperformanten Modellen. Dazu kommt zunehmender Druck durch kosteneffiziente chinesische Anbieter.
Video O1 ist ab sofort über die Weboberfläche verfügbar und dürfte vor allem bei Kreativschaffenden, Marketing-Teams und Start-ups Interesse wecken, die komplexe Videobearbeitung ohne tiefes Fachwissen benötigen.
