AI Anwendungssoftware

DALL-E 2: Ist es das Ende der Künstler?

Künstliche Intelligenz erfährt gerade den Höhepunkt des Hypes. Tatsächlich ist sie bereits ein fester Bestandteil in unserem Alltagsleben, beispielsweise durch digitale Sprachassistenten oder die Gesichtserkennung am Smartphone. Derzeit sorgt sie insbesondere durch das Aufkommen neuer Programme für Aufsehen. Inzwischen gibt es zahlreiche KI-Software auf dem Markt, die viele Lebens- und Arbeitsbereiche beeinflussen. So auch das Programm DALL-E 2, welches besonders Kunst- und Technikinteressierte anspricht.

Maximilian Schmidt

CEO

28.07.2023
Lesezeit: 8 Minuten
759 Views

Mit dem KI-basierten Programm können im Handumdrehen vielfältige Bilder generiert werden. Nutzer müssen lediglich Stichpunkte eingeben, die der Bildgenerator im Anschluss visualisiert. Obwohl die Software auf den ersten Blick verlockend klingt, birgt sie Schattenseiten. Besonders unter Künstlern sorgt sie für Aufregung: Werden ihre Arbeiten nun von KI-Systemen übernommen? Wie gut ist DALL-E 2 im Bereich der Kunst und was ist weiterhin zu erwarten? Welche Möglichkeiten und Gefahren bringt sie mit sich?

Abb 01_Die Technologie braucht keine Leinwände mehr

Die Technologie braucht keine Leinwände mehr. Alles findet über das Internet statt. Werden bald auch Künstler nicht mehr gebraucht?

DALL-E 2: Der Kreativität sind keine Grenzen gesetzt

Was einst Zukunftsmusik war, ist heute Realität. Künstliche Intelligenz ermöglicht es, Gedanken visualisieren zu lassen. Dabei kann die Vorstellung beliebig bizarr sein – ein Frosch im Weltall, Basketball spielende Kängurus oder ein Astronaut, der auf dem Mond ein Pferd reitet. Mit dem Programm DALL-E 2 können Nutzer neue Welten erschaffen – und das nur in wenigen Sekunden.

Auf der Website des KI-Tools können Nutzer Anfragen zur Bildgenerierung stellen. Sobald man das gewünschte Bild mit wenigen Stichpunkten beschrieben hat, fängt das Programm an, Bilder zu generieren. Alternativ kann man auch ein eigenes Bild hochladen, mit dem DALL-E 2 arbeiten soll. In der Regel dauert die Bilderstellung wenige Sekunden bis maximal zwei Minuten. Die Stichpunkte müssen in keinem Fall in Bezug zueinanderstehen. Letztlich ist es jedem Nutzer freigestellt, in welchem Stil er sich das Bild wünscht: Das Bild kann einen hyperrealistischen Stil annehmen, einem Ölgemälde ähneln, den Stil eines berühmten Künstlers widerspiegeln oder in 3-D-Rendering visualisiert werden.

Bereits vor der Einführung von DALL-E 2 existierten einige KI-Bildgeneratoren. Was DALL-E 2 von anderen Programmen abhebt, ist die Tatsache, dass es sich einer Datenbank von mehr als Millionen Bildern bedient. Es arbeitet nicht lediglich mit Collagen, sondern kreiert neue Bilder von Grund auf. Die KI hinter dem Programm ist anhand der eingeschleusten Datenmenge in der Lage, neue Inhalte zu entwickeln, die den trainierten Daten ähneln, aber nicht identisch sind. So wird es beispielsweise mit Millionen Bildern, die mit dem Begriff „Hund“ gekennzeichnet wurden, trainiert und kann im Anschluss Pixel in Form eines vollständig neuen Hundes zusammenstellen. Dieser wäre dem Datensatz ähnlich genug, sodass der Betrachter keine Probleme haben würde, den Hund im Bild zu erkennen.

Dennoch ist das Programm noch lange nicht makellos. KI weist noch immer einige Schwierigkeiten auf, wie beispielsweise das Rendern von menschlichen Händen. Körperproportionen sind oft nicht stimmig und das Tool generiert Schriftzüge, die keinen Sinn ergeben.

Letztlich ist das Programm nicht vollständig kostenlos, denn die Anzahl an Bildern, die jeder Nutzer generieren kann, ist begrenzt. So erhält man zu Beginn 50 Credits für 50 Recherchen. Sobald diese Credits aufgebraucht wurden, stehen jedem Nutzer 15 weitere Credits pro Monat zur Verfügung. Möchte man eine höhere Anzahl an Credits besitzen, muss man diese erwerben.

Der nächste Schritt für DALL-E 2 & Co. ist Animation

Mit der Erstellung von Bildern durch KI wurde nur der erste Meilenstein gesetzt. Im weiteren Verlauf ist zu erwarten, dass Text-zu-Bild-Generatoren auch in der Lage sein werden, Videos zu generieren. Und tatsächlich haben bereits die ersten Versuche gestartet: Ähnlich wie bei dem Programm DALL-E 2 möchte das Unternehmen Meta mit der KI-Software „Make-A-Video“ Animationen, die auf Texten basieren, erstellen. Auch hier sollen Nutzer sogenannte „prompts“, also Beschreibungen, eingeben.

Im Anschluss kreiert das Programm vier verschiedene Optionen als Videos. Es kann Videos in drei verschiedenen Stilen erstellen: surreal, realistisch und stilisiert. Die Software befindet sich derzeit noch in der Testphase. Die ersten Ergebnisse wurden bereits veröffentlicht und es ist zu erwarten, dass in wenigen Wochen das Programm online geht. Mit großer Wahrscheinlichkeit wird hier DALL-E 2 nachziehen, um mit der Konkurrenz mithalten zu können. Die ersten Schritte wurden bereits von anderen Unternehmen vorgeführt.

Doch genau wie die Bilderstellung durch KI werden auch hier mit großer Wahrscheinlichkeit Komplikationen auftreten. Während zum Beispiel menschliche Hände auf Bildern falsch dargestellt werden, sind in KI-generierten Videos ebenfalls Fehler zu erwarten. Im Vergleich zu KI-gestützten Bildgeneratoren sind Videogeneratoren noch mal eine kompliziertere Herausforderung, denn auch sie benötigen eine erkleckliche Menge an Daten, mit denen sie trainiert werden – eine weitaus höhere und kompliziertere Datenmenge als bei Bildern.

Dennoch kann gesagt werden, dass KI in Zukunft auch die Welt der Videos revolutionieren wird. Womöglich werden künftig KI-kreierte Szenen in ersten Serien, Filmen und anderen Produktionen zu sehen sein. Es könnte sogar sein, dass anstelle von menschlichen Schauspielern KI-animierte Charaktere eingesetzt werden. Bis dahin erproben KI-Enthusiasten, Kunstinteressierte und Hobby-Entwickler die derzeitigen Möglichkeiten der Künstlichen Intelligenz.

Was die neuen technischen Entwicklungen für die Zukunft der Künstler bedeuten

Künstliche Intelligenz krempelt die Kunstbranche um – und das gewaltig. Auf der einen Seite bietet KI vielfältige Chancen, sich kreativ zu entfalten, auf der anderen Seite sorgt sie jedoch unter Künstlern für Verärgerung.

In den sozialen Netzwerken findet man zahlreiche Beschäftigte und Selbstständige aus der Kunstbranche, die sich kritisch gegenüber KI-Programmen wie DALL-E 2 und Co. äußern. Hinter dem Aufschrei steckt die Angst vor dem Jobverlust. Kunst zu kreieren – und das ganz ohne eine Expertise – war noch nie so einfach wie heute. Nicht nur das Tool DALL-E 2, auch weitere KI-basierte Softwares wie Stable Diffusion, Midjourney oder Lensa sind frei zugänglich und geben Millionen von Nutzern die Möglichkeit, per Sprachbefehl Bilder zu erstellen.

Hyperrealistische Bilder, Cartoons, Animes, Ölgemälde – die Programme können fast jeden gewünschten Stil umsetzen. Was dabei rauskommt, sind völlig neu erschaffene Welten. Während echte Künstler für diese Werke mehrere Stunden oder Tage brauchen, ermöglichen KI-Tools die Bildgenerierung komplett kostenlos, unkompliziert und schnell. Zudem ist die Qualität überaus bemerkenswert. Mit den technischen Fortschritten werden die Ergebnisse immer realer und faszinierender.

Das Programm hat jedoch auch seine Schattenseiten. Alle Bilder, welche anhand von KI-Tools generiert werden, entstehen im rechtsfreien Raum. Aus diesem Grund entschieden sich zahlreiche Grafikdesigner, 3-D-Modellierer und Co., gegen die freie Nutzung der Programme vorzugehen. Als Zeichen des Protests erstellen sie haufenweise KI-Bilder im Disney-Stil. Ziel ist es, mit dieser Aktion Druck bei den Entwicklern zu erzeugen und an die Gesetzgeber zu appellieren, da Disney besonders unter Copyright steht. Sie erhoffen sich, zumindest die rechtsfreie Nutzung von Bildern im Stil bekannter Künstler oder Marken stoppen zu können.

Somit ist die Angst, dass Künstler bald von KI-Tools ersetzt werden, groß. Nicht nur in der Kunst- und Medienbranche besteht diese Befürchtung, auch Beschäftigte aus anderen Bereichen sorgen sich um ihre Tätigkeiten. Wenn KI heute in der Lage ist, Bilder – und schon bald auch Videos – von Grund auf neu zu erstellen, wozu wird sie später noch alles fähig sein?

DALL-E2 3-D-Modellierer

Oft wird jedoch außer Acht gelassen, dass die Angst vor technischen Fortschritten und Innovationen kein neues Phänomen ist. Die Gesellschaft tendiert dazu, jede technologische Entwicklung zunächst als eine Bedrohung wahrzunehmen. Im weiteren Verlauf zeigt sich jedoch, dass sie auch ihre Vorteile für viele Arbeitsbereiche haben. Betriebe implementieren KI-Tools, um die Arbeitseffizienz zu steigern und Zeit und Kosten zu sparen. Auch werden neue Arbeitsstellen geschaffen, da KI noch immer von Menschen abhängt. KI-Algorithmen müssen trainiert, optimiert, gewartet und immer wieder aktualisiert werden.

Gleichermaßen sieht es für Künstler aus: Sie werden weiterhin gebraucht, denn KI leistet nicht immer die gewünschte, fehlerfreie Arbeit. KI-Bildgeneratoren sind noch immer nicht in der Lage, den menschlichen Körper makellos zu generieren. Sie folgen lediglich den Anweisungen von Nutzern, können aber keine Tipps oder Anregungen geben oder eigene emotionale Kompetenzen einsetzen, um das Ergebnis zu überarbeiten und zu optimieren.

Fazit

Während kreative KI-Softwares für manche ein Fluch sind, sind sie für andere ein Segen. Für Hobby-Entwickler und Kunstenthusiasten sorgen sie für Begeisterung, denn mit Programmen wie DALL-E 2 können sie fantastische Bilder kreieren. Schon bald werden auch Text-zu-Video-Generatoren den Markt revolutionieren. Gleichzeitig bangen Künstler um ihre Jobs. Jedoch ist diese Sorge unbegründet, denn KI-Tools können nicht so einfach ihre Tätigkeiten vollständig übernehmen. Problematisch ist aber die Tatsache, dass Bilder generiert werden, die den Stil berühmter Künstler oder Marken annehmen, und das ohne rechtliche Folgen. Schlussendlich ist das Thema weitaus komplizierter, als es zuerst scheint. Fakt ist, dass weitere Entwicklungen in Bezug auf Kunst und KI zu erwarten sind.

. . .

Vorheriger Artikel