Neues Jahr, neues Glück…. Nach meinen wohlverdienten Weihnachtsferien bin ich nun wieder zurück um euch mit neuen Posts zum Thema KI zu unterhalten und zu informieren. Eine der wahrscheinlich am meisten genutzten Anwendungen von KI, insbesondere generativer KI, ist die Bilderstellung. Und wenn man über Bilderstellung mit KI spricht kann man Midjourney nicht außen vor lassen.

Wer hat Sie noch nicht gesehen? Bilder vom Papst im weißen Daunenmantel, Merkel und Obama beim Joggen am Strand und Rave-Partys in Hogwarts. Alles sieht super real aus, selten findet man kleine Fehler. Und alles mit Midjourney erstellt. Vorweg, ich bin kein großer Fan von Midjourney, aber die Ergebnisse sind beeindruckend.

Midjourney hat zwei Nachteile …

Um die Nachteile gleich vorweg zu nehmen: Midjourney gibt es nicht als kostenlose Version, bei der man sein künstlerisches Schaffen auf wenige Werke pro Monat oder Woche beschränken muss, sondern ausschließlich als Bezahlversion. Die Kosten reichen hierbei von 8 $ pro Monat (für den Basic Plan bei jährlicher Zahlweise) bis hin zu 120 $ pro Monat (für den Mega Plan bei monatlicher Bezahlweise) Die Unterschiede bei den Abos liegen hauptsächlich darin wie viele Jobs man gleichzeitig ausführen lassen kann bzw. wieviel man in die Queue hängen kann. Außer beim Basic Plan hat man unbegrenzt Zugriff auf die Relax GPU Time, Fast GPU Time ist bei allen Plänn in irgendeiner Weise begrenzt. Man muss also schon sehr viel damit arbeiten damit sich die Investition lohnt. Zudem sind die Rechte am Bild bei Firmenaccounts, die den Basic oder Standard Plan nutzen und mehr als 1.000.000 $ Umsatz machen, sehr eingeschränkt. Um sämtliche Bildrechte zu erhalten muss dann ein Pro oder Mega Plan abonniert werden. Ein weiterer, und aus meiner Sicht sehr gravierender, Nachteil ist die Bedienbarkeit. Midjourney kann nur über Discord genutzt werden. Discord ist ein Messaging Dienst für Instant Messaging, Chats, Sprach- und Videokonferenzen der hauptsächlich in der Videospielcommunity genutzt wird. Die Benutzung von Discord benötigt an und für sich schon einige Einarbeitungszeit, insbesondere wenn man sich vorher noch nicht damit auseinander gesetzt hat. Hier hat die Konkurrenz in punkto Bedienbarkeit eindeutig die Nase vorn. Aber das ist nur meine persönliche Meinung.

Zudem kann Midjourney keine Texte verarbeiten, das bedeutet man kann keine Texte in die Bilder (bspw. in Sprechblasen oder auf Schildern) einsetzen lassen. Bei allen meinen Versuchen ist das gnadenlos schief gegangen. Auch hier gibt es Konkurrenzprodukte die das sehr viel besser können.

aber natürlich auch Vorteile…

Nun aber zu den Vorteilen von Midjourney: Die Erstellung von Bildern funktioniert wirklich problemlos und die Ergebnisse können sich mehr als nur sehen lassen. In punkto Qualität ist man hier auf jeden Fall ganz vorne mit dabei. Insbesondere bei der Darstellung real existierender Personen oder auch bei Filmcharakteren erhält man hier sehr viel bessere Ergebnisse als bei anderen KI´s. Auch die Darstellung von Händen und Fingern, die oftmals Probleme aufwirft (zu viele Finger, bei verschränkten Händen kann nicht erkennen wo die eine Hand anfängt und die andere aufhört etc.), ist hier in den allermeisten Fällen korrekt. Auch die Anlehnung an bestimmte Kunststile von berühmten Künstlern oder auch die „Verschiebung“ von Filmcharakteren in andere Filme oder auch Videospiele ist etwas was gerne gemacht wird und ebenfalls sehr gut funktioniert. Bei der Erstellung von fotorealistischen Bildern, insbesondere mit existenten Personen, kommt man an Midjourney nicht vorbei.

Zudem kann man sämtliche Prompts von den anderen Usern im Channel sehen und das dazugehörige Ergebnis. So kann man sich eine Menge abschauen, da dort sehr viele Leute unterwegs sind die sich mit dem Tool und seinen Prompts wirklich extrem gut auskennen. Wichtig ist hierbei natürlich, wie bei jeder generativen KI, dass der Prompt möglichst präzise und ausführlich beschreibt welches Ergebnis man haben möchte. Natürlich kann es spannend sein zu sehen was die KI aus relativ vagen Angaben bastelt, wenn man aber eine bestimmte Vorstellung hat muss man dieser auch präzise ausformulieren. Dazu gehören bspw. das zentrale Element des Bildes, die Darstellung(Porträt, Ganzkörperaufnahme etc.), der Hintergrund (wie soll er aussehen, was soll zu sehen sein), der Stil des Bildes (fotorealistisch, Ölgemälde, Zeichung, Namen von Künstlern in deren Stil das Bild erstellt werden soll). Außerdem ist es möglich eigene Bilder in den Prompt zu integrieren um die Stilrichtung, in die das Bild gehen soll, zu verdeutlichen. Auch bei dieser KI ist es wichtig, Wörter die keine zusätzlichen Informationen enthalten zu streichen. Es ist also nicht notwendig Füllwörter zu verwenden.

Alternativen?

Ich weiß, auf den ersten Blick sieht es aus als würde ich hier mehr Wert auf die Nachteile legen weil ich das Tool persönlich nicht leiden kann. Der längere Text ergibt sich aber hauptsächlich aus den Preisinfos. Midjourney ist eine grandiose Bilderstellungs-KI, man muss nur die Bedienweise mögen. Ich persönlich bin damit nicht so gut klar gekommen, grundsätzlich fand ich aber die Ergebnisse richtig super. Wenn man, wie ich, sich nicht in Discord einarbeiten oder einen Account dort erstellen will, gibt es durchaus noch Alternativen zu Midjourney, bspw. Dall-E, Stable Diffusion oder Leonardo.ai . Zu denen werde ich in nächster Zeit auch noch einiges schreiben. Solltet ihr noch mehr Infos zu Midjourney oder auch der Bedienung davon wollen, schreibt es mir gerne in die Kommentare.

Schreibe einen Kommentar