KI-Enthusiasten aufgepasst: Es gibt ein neues KI-Videomodell in der Stadt, und es heißt Kling. Entwickelt von den Jungs von Kuaishou, einer chinesischen Videoplattform, dieses kleine Juwel verspricht, Sora, der OpenAI-Kreatur, die kürzlich existierte, das Leben schwer zu machen Er machte viele Schlagzeilen.
Kling scheint alles zu haben, was es braucht, um der neue König der KI-Videos zu werden: längere Generationen, flüssigere Bewegungen, bessere Interpretation von Eingabeaufforderungen und sogar Sequenzen mit mehreren Einstellungen. Kurz gesagt: Wenn Sora bereits beeindruckend war, könnte Kling KI-generierte Videos auf ein ganz neues Niveau heben.
Kling gegen Sora, es ist bereits ein Kampf der Titanen
Wenn man über Video-KI spricht, kommt man nicht umhin, an Sora zu denken, das von OpenAI entwickelte Modell, das bei seiner Ankündigung für Aufsehen sorgte. Mit seiner Fähigkeit, realistische Videos zu erstellen und Benutzeranweisungen getreu zu befolgen, scheint Sora dazu bestimmt zu sein, die Welt der auf Videos angewendeten künstlichen Intelligenz zu revolutionieren. Tatsächlich sogar die Ästhetik dieser Jahre. Oder vielleicht sollte ich „scheinbar“ sagen: Mit der Ankunft von Kling könnten die Karten auf dem Tisch neu gemischt werden.
Natürlich scheinen die beiden Modelle auf den ersten Blick viele Gemeinsamkeiten zu haben. Beide basieren auf Architekturen Transformator und sind in der Lage, ausgehend von einfachen Textbeschreibungen qualitativ hochwertige Videos zu erstellen. Aber gerade wenn man ins Detail geht, scheint Kling mehrere Vorteile zu haben.
Nach Angaben von Kuaishou ist Kling tatsächlich in der Lage, KI-Videos mit einer Länge von bis zu zwei Minuten, in 1080p und mit 30 Bildern pro Sekunde zu erstellen. Eine bemerkenswerte Kapazität, die die von Sora übertrifft und den Weg für ein breites Anwendungsspektrum ebnet, von der Erstellung von Inhalten für soziale Medien bis hin zur Produktion von Werbe- oder Unterhaltungsfilmen. Und das ist nicht alles.
Physik ist kein Problem mehr
Chinas Text-zu-Video-Modell scheint seinen Entwicklern zufolge auch hervorragend darin zu sein, die Physik der realen Welt zu simulieren, ein Aspekt, mit dem aktuelle KI-Videomodelle Schwierigkeiten haben. Die von Kling generierten KI-Videos zeigen eine große Bewegungsflüssigkeit und eine realistische Interaktion zwischen Objekten und Umgebungen, was das Seherlebnis noch überzeugender macht.
Hinzu kommt Klings Fähigkeit, fortschrittliche 3D-Rekonstruktionen von Gesichtern und Körpern durchzuführen und so die Ausdruckskraft und Bewegung der Gliedmaßen in den erstellten Videos zu verbessern. Ein technisches Detail, das den Unterschied ausmachen kann, wenn es darum geht, komplexe Charaktere oder Situationen zu erschaffen.
Eine Frage der Verbreitung
Trotz der recht interessanten Prämissen heißt Klings wahre Bedrohung für Sora jedoch „Verfügbarkeit“. Während sich das Modell von OpenAI noch in der Testphase befindet und nur einer kleinen Gruppe von Entwicklern und Forschern zugänglich ist, scheint Kling für ein breiteres Publikum bereit zu sein.
Tatsächlich hat Kuaishou eine Warteliste für Benutzer eröffnet, die daran interessiert sind, sein neues Modell auszuprobieren. Ein Ansatz, der es Kling ermöglichen könnte, schnell an Boden zu gewinnen, eine Benutzerbasis aufzubauen und wertvolles Feedback zu sammeln, während Sora in den Laboren von OpenAI eingesperrt bleibt.
Video-KI, der Kampf beginnt
Natürlich ist es noch zu früh, einen Sieger dieser Herausforderung zu küren. OpenAI verfügt über einen gefestigten Ruf und ein erstklassiges Forscherteam. ehrgeizige „Kannibalen“. was in den kommenden Monaten für Überraschungen sorgen könnte. Und dann ist die Vorsicht von OpenAI bei der Veröffentlichung von Sora für die breite Öffentlichkeit verständlich: Das Unternehmen möchte sicherstellen, dass das Modell bereit ist und nicht für böswillige Zwecke oder zur Verbreitung von Fehlinformationen verwendet werden kann.
Andererseits scheint Kuaishou entschlossen zu sein, Kling auf die Weltbühne zu bringen. Das chinesische Unternehmen hat bereits die Fähigkeit unter Beweis gestellt, in seinem Heimatmarkt eine erfolgreiche Videoplattform zu betreiben, und verfügt möglicherweise über die Ressourcen und Erfahrung, die für eine schnelle Skalierung erforderlich sind.
Ein Skrupel, von dem wir nicht wissen, wie lange Kling noch aufrechterhalten will. Und es geht nicht nur um Kling: Das KI-Videorennen hat gerade erst begonnen. Da neue Modelle auf den Markt kommen und die Forschung ständig voranschreitet, können wir mit Videos rechnen zunehmend länger, realistisch und beeindruckend in den kommenden Jahren.
Video-KI, die Auswirkungen auf die Branche
Doch was bedeutet das alles für die Videobranche? Die Einführung von Tools wie Kling und Sora könnte die Art und Weise, wie Inhalte erstellt und produziert werden, revolutionieren. Stellen Sie sich vor, Sie könnten ein generieren gesamter Werbespot oder ein animierter Kurzfilm, der mit einer einfachen Textbeschreibung beginnt. Oder Sie können Ihre Videos mit realistischen Charakteren füllen, ohne dass Schauspieler oder teure Motion-Capture-Sitzungen erforderlich sind.
Das wirft natürlich auch Fragen nach der Zukunft einiger kreativer Berufe auf. Werden KI-Modelle Künstler, Animatoren und Regisseure ersetzen? Wahrscheinlich nicht, zumindest nicht kurzfristig. Aber diese Technologien könnten in ihren Händen zu einem leistungsstarken Werkzeug werden, das es ihnen ermöglicht, zu experimentieren, Ideen schnell zu prototypisieren und die Grenzen der Kreativität zu erweitern.
Ganz gleich, ob Kling, Sora oder noch ein anderes Model als Anführer hervorgeht, die Zukunft von KI-generierten Videos sieht verrückt aus.