DALL-E 2, die KI, die alles schafft, was Sie wollen: Sie fragen, es zeichnet

7. April 2022

Technologie

Du fragst, sie zeichnet: Die zweite Version von DALL-E verblüfft mit der Fähigkeit, Sprache zu interpretieren und in Bilder umzuwandeln.

Ich weiß, wir waren alle von etwas anderem abgelenkt: im Januar 2021 OpenAI, das von Elon Musk gegründete und von Microsoft unterstützte Unternehmen, hat sein bisher ehrgeizigstes Projekt gestartet: ein maschinelles Lernsystem namens DALL-E .

Was macht diese künstliche Intelligenz? Kurz gesagt: Es produziert Bilder ausgehend von einer einfachen Textbeschreibung. Ein Beispiel? Schreiben Sie „ein Kamel mit einem Buch als Hut“ oder „eine Krawatte aus Gabeln“ und er zeichnet, erschafft, kurz: er zieht ein Bild heraus.

Jetzt hat Open AI die zweite Version von DALL-E vorgestellt, und es wurde verdammt ernst: Die Auflösung ist viel besser und die Produktionszeit viel kürzer geworden. Eine typische exponentielle Dynamik, an die uns künstliche Intelligenzen gewöhnt haben und uns vor allem gewöhnen werden. Auch weil, wenn Sie sich erinnern, der Leiter von Open AI gerade sagte, dass diese Maschinen vielleicht (vielleicht) sie werden empfindungsfähig.

zieht — eine Schüssel Suppe, die wie ein Monster aussieht, aus Wolle - OpenAI

Ein bisschen Wall-E, ein bisschen Dali

Die DALL-E-Version eins (ein Kofferwort aus „Dali“ als Künstlerin und „WALL-E“ als animierte Disney-Figur) war in der Lage, Bilder zu erzeugen und verschiedene Fotos zu einer Collage zusammenzufügen, die Perspektiven bot. und das Abziehen von Elementen eines Bildes selbst, zum Beispiel Schattierungseffekte.

Ein super guter Designer, der alle Bilder der Welt zur Verfügung hat, der Anfragen interpretiert und sofort zeichnet.

„Im Gegensatz zu einer 3D-Rendering-Engine, die präzise Eingaben erfordert, ist DALL-E oft in der Lage, die Lücken zu füllen, wenn die Bildunterschrift impliziert, dass das Bild ein bestimmtes Element enthalten soll, das nicht ausdrücklich angegeben ist“, schrieb das Team im vergangenen Jahr im Open AI-Blog.

von e3 zeichne was du willst — 35-mm-Makrofilmfoto einer großen Familie von Mäusen mit Hüten am Kamin - OpenAI

Wie funktioniert eine bedarfsgesteuerte KI?

DALL-E sollte kein kommerzielles Produkt sein, und das OpenAI-Team entschied, dass es das Beste wäre. Die Forscher "hinderten" ihn beispielsweise daran, Bilder mit sexuellem oder politischem Hintergrund zu erstellen, um zu verhindern, dass das System zur Generierung von Desinformationen verwendet wird. Dasselbe gilt für bestimmte Namen: unmöglich, ihn zu fragen, „zeichne Frank Sinatra beim Tennisspielen mit einem Eisbären“.

DALL-E 1 nutzt im Wesentlichen den unglaublichen GPT-3-Sprachinterpreter (hier spreche ich ausführlicher darüber, falls es dich interessiert) und zeichnet, was es mehr versteht als was es „spürt“.

KI zeichnet alles — Teddybären mischen funkelnde Chemikalien wie verrückte Wissenschaftler - OpenAI

Im Gegensatz zur ersten Version, die für alle auf der OpenAI-Website verfügbar war, steht diese nur einer begrenzten Anzahl von Partnern zum Testen zur Verfügung: Ich warte einige Tage auf eine Antwort von OpenAI, um der Gruppe beizutreten.

Ich werde dich wissen lassen, was dieses Gör mich anzieht!

Gianluca Riccio, Kreativdirektorin von Melancia adv, Texterin und Journalistin. Es ist Teil des italienischen Instituts für Zukunft, der World Future Society und H+. Seit 2006 leitet er Futuroprossimo.it, die italienische Ressource für Zukunftsforschung.

Um über Forschungen, Entdeckungen und Erfindungen zu berichten, Kontaktieren Sie die Redaktion! Folgen Sie Futuro Prossimo auf WhatsApp: exklusive Neuigkeiten und Updates (kostenlos).

FP über Fatto Quotidiano
Alberto Robiati und Gianluca Riccio führen die Leser durch Zukunftsszenarien: die Chancen, Risiken und Möglichkeiten, die wir haben, um ein mögliches Morgen zu schaffen.

Zum gleichen Thema:

Das Letzte

DALL-E 2, die KI, die alles schafft, was Sie wollen: Sie fragen, es zeichnet

Technologie

Teilen

Ich weiß, wir waren alle von etwas anderem abgelenkt: im Januar 2021 OpenAI, das von Elon Musk gegründete und von Microsoft unterstützte Unternehmen, hat sein bisher ehrgeizigstes Projekt gestartet: ein maschinelles Lernsystem namens DALL-E .

Ein bisschen Wall-E, ein bisschen Dali

Wie funktioniert eine bedarfsgesteuerte KI?

Ich werde dich wissen lassen, was dieses Gör mich anzieht!

Mysteriöse supermächtige KI erscheint und verschwindet sofort: Handelt es sich um einen GPT-5-Test?

Autonome Waffen, Wiener Konferenz: „Jetzt handeln, um die Menschheit zu schützen“

Arthrose: AI-Bluttest schlägt Röntgenstrahlen und sagt sie 10 Jahre früher voraus

Mysteriöse supermächtige KI erscheint und verschwindet sofort: Handelt es sich um einen GPT-5-Test?

Vaulted Deep: Injizieren Sie organischen Abfall in den Boden, um CO2 einzufangen

99 % erneuerbare Energien und wilde Wälder: Was ist das Geheimnis von Costa Rica?

Umwelttechnischer Durchbruch: Kunststoff geschaffen, der sich dank spezieller Sporen selbst zerstört

Auge in Auge mit einem Neandertaler: das unglaubliche Gesicht von Shanidar Z