Für alle Leute die ähnlich gut malen und zeichnen können wie ich, die aber trotzdem ab und zu kreative Ergüsse zu Papier oder sonst wohin bringen möchten, hat uns die KI-Welt die Bildgenerierung geschenkt. Letzte Woche bin ich ja schon auf das Tool Midjourney eingegangen, da das aktuell das meistgenutzte Tool für wirklich gute Bildgenerierung ist. Heute werfen wir ein Blick auf einen Konkurrenten der, welch Überraschung, aus der Feder von OpenAI stammt: Dall-E 3.
Wieso Dall-E?
Wie der Name schon suggeriert handelt es sich hier bereits um die dritte Version des Bilderstellungstools, die beiden vorherigen sind vermutlich den wenigsten bekannt gewesen. Da Dall-E wie Chat-GPT von OpenAI stammt, teilen sie sich schon einmal die Benutzeroberfläche, das bedeutet man kann das Ganze aus dem Webbrowser bedienen und muss nicht mit einem externen Programm wie Discord arbeiten. So weit, so Vorteil für Dall-E.

Der zweite Vorteil ist, das ChatGPT für das Brainstorming genutzt werden kann, wenn man eine grundsätzliche Idee hat und diese verfeinern will oder auch etwas komplett Neues benötigt. Dazu versucht Dall-E, egal ob aus einem simplen Satz oder einer sehr detaillierten Beschreibung, ein möglichst detailliertes Bild zu erstellen. Zudem kann, auch wenn hier immer noch große Probleme herrschen, das Tool erheblich besser mit Text umgehen, der in das Bild integriert werden soll, als Midjourney. Immerhin hat es bei meinen Versuchen in ca. 25% der Fälle geklappt einen korrekten Text in das Bild zu integrieren. Midjourney hat das kein einziges Mal hinbekommen…. Also so gar nicht. Auch das Problem der Hände mit zu vielen Fingern etc. hat Dall-E sehr gut im Griff. Das kam bei meinen Tests nur ein einziges Mal vor und war so geschickt getarnt dass ich zählen musste weil es auf den ersten Blick nicht aufgefallen ist.
Dall-E 3 ist in das Bezahlabo von ChatGPT integriert und somit nur für Abonnenten der beiden Modelle ChatGPT Plus und ChatGPT Enterprise zugänglich. Eigentlich, doch dazu später mehr. OpenAI verspricht, dass das neue Tool deutlich besser mit differenzierten und fein abgestimmten Bildbeschreibungen umgehen kann als der Vorgänger. Die Einbindung von ChatGPT-4, ermöglicht es dem Tool sehr genau auf die Wünsche des Users einzugehen und diese umzusetzen. So sollen, laut Entwickler, „Bilder entstehen die sehr nah an die Vorstellung der User heranreichen“.
Der Nachteil von Dall-E?
WIe oben schon erwähnt, steht Dall-E 3 nur den Abonnenten der Bezahlversion von ChatGPT zur Verfügung. Und wie scho oben erwähnt gilt eben das nicht endgültig: Wer ein Microsoft-Konto sein eigen nennt, kann über den Bing Image Creator auf Dall-E 3 zugreifen. 15 Bilder pro Monat lassen sich damit kostenfrei und schnell erstellen, danach gibts nur noch die langsame Variante und wenn mal viel los ist, erfährt man selbstverständlich auch nicht unbedingt eine Priorisierung.

Für meine Begriffe ist Midjourney wesentlich besser darin Bilder zu erstellen die wirklich wie Fotos aussehen. Natürlich kann auch Dall-E Bilder erstellen die wirklich gut gemacht sind und auch fotorealistisch aussehen, aber man kann immer sehen dass alles am PC erstellt wurde. Möglicherweise habe ich auch nur noch nicht den richtigen Prompt dafür gefunden. Zudem lässt Dall-E es nicht zu Werke im Stil noch lebender Künstler zu erstellen, auch die Erstellung von Adult Content soll nicht möglich sein. Bilder die gewaltverherrlichend oder auf Hass aufgebaut sind sollen ebenfalls unterbunden werden, inwieweit das tatsächlich funktioniert, werden wir im Laufe der Zeit sehen. Das ist selbstverständlich auch kein Nachteil.
Am Ende des Tages muss natürlich jedes selbst entscheiden was besser zu ihm passt, mir jedenfalls gefällt die meiste Zeit Dall-E aufgrund der Bedienbarkeit besser. Allerdings nutze ich auch Midjourney, aber nur um Bilder zu erstellen die möglichst fotorealistisch sind. Bei allen anderen Arten von Bild sehe ich kaum einen Unterschied zwischen den beiden Tools weshalb ich Dall-E im Regelfall den Vortritt gebe, eben wegen der Bedienbarkeit. Wenn man nur ab und zu zum Spaß Bilder generieren möchte, würde ich auf jeden Fall Dall-E den Vorzug geben, auch weil es über den Bing Image Creator kostenlos ist. Sollte das Ganze professioneller aufgezogen werden und man regelmäßig Bilder erstellen, ist Midjourney aber eine durchaus ernst zu nehmende Alternative abhängig von der Art der Bilder die man erstellen möchte.