Von Dall-E bis Midjourney: Diese Text-zu-Bild-KIs erobern das Netz

Dall-E und Dall-E 2 sind die von OpenAI entwickelten KI-Modelle, die aus Textbeschreibungen äußerst realistische Bilder erzeugen können. Diese Modelle wurden anhand riesiger Datenmengen trainiert, um zu verstehen, wie verschiedene Objekte in unterschiedlichen Kontexten aussehen, sodass sie auf der Grundlage einer vorgegebenen Aufforderung einzigartige Bilder erstellen können.

Der Name “DALL” ist von den Werken des spanischen surrealistischen Künstlers Salvador Dalí abgeleitet, der dafür bekannt war, dass er traumartige Bilder schuf und Elemente nahtlos ineinander übergehen ließ. Der Buchstabe “E” steht für Encoder, da das System einen fortschrittlichen Deep-Learning-Algorithmus namens GPT-3 nutzt, dessen Encoder-Modul separat vortrainiert wird, bevor es mit anderer Computer-Vision-Software gekoppelt wird.

Midjourney hat ebenfalls eine ähnliche Software entwickelt – mit der Mission zur Erweiterung menschlicher Vorstellungskraft durch generierte Bilder mithilfe eines Programms für künstliche Intelligenz (KI). Die Innovation soll neue Wege bieten, um Ideen zu kreieren und auszudrücken sowie den Zugang zur KI-Kunst zugänglich machen – nur einige Zeilen Text genügen dazu.

Weiterlesen: https://t3n.de/news/dall-e-midjourney-diese-erobern-1497260/