KI Kunst (AI Art) mit Disco Diffusion

Mithilfe künstlicher neuronaler Netze (KNN) kann man so einiges machen. Einer der Anwendungsfälle ist die KI (Künstliche Intelligenz) Kunst. Damit man Kunst aus der KI erzeugen kann benötigt man ein Modell, was man mit Trainingsdaten aufbaut. Die Trainingsdaten umfassen idealerweise ein großes Portfolio an unterschiedlichsten Daten aus vielen verschiedenen Quellen, sodass auch die Menge der potenziellen Ergebnisse möglichst umfangreich ist.

Exploring Duck
Japanische Kirschblüten in einer dystopischen Umgebung
Leuchtturmszene

Man kann nun diesem trainierten Modell Eingabedaten (z.B. Text) geben, sodass aus diesen Eingabedaten eine Ausgabe (z.B. ein Bild) erzeugt wird. Man kann die Parameter so aufbauen, dass interessante Ergebnisse raus kommen. Da die Menge an möglichen Eingaben und Ausgaben unerschöpflich ist, und oftmals etwas kreatives raus kommt, bezeichnet man die Ergebnisse dieses Prozesses auch als Kunst. Ich habe vor Kurzem ein wenig mit dieser Art von Kunst befasst und möchte das Werkzeug „Disco Diffusion“ vorstellen.

Disco Diffusion ist ein Notebook für Python, in dem Data Science Werkzeuge, KI-Modelle und Tools zusammen gebracht werden. Mithilfe von Parametern lässt sich die Anwendung beeinflussen. Es lassen sich verschiedene Modelle aktivieren, es lässt sich beeinflussen, wie die Ressourcen (CPU/GPU) genutzt werden soll, es lassen sich Parameter für Aus und Eingabedaten beeinflussen. Kurzum es gibt eine Schier unendliche Möglichkeit, wie man die Ergebnisse beeinflussen kann.

Exploring Duck

Bei jedem Generierungsprozess wird ein Zufallswert, ein „Seed“, mit in die Berechnung mit einbezogen. Die gleichen Eingangswerte können sehr unterschiedliche Ergebnisse haben, weil bei jeder Generierung der Zufall mit eine Rolle spielt.

Kirschblüten in einer dystopischen Umgebung

Das Github Projekt von Disco Diffusion ist hier zu finden. Man brauch sich aber nichts herunterladen. Der Entwickler hat auch ein Colab Notebook bereitgestellt, in dem man ohne große Aufwände die Parameter im Browser verändern, und in der Google Cloud die Bilder generieren kann. Die Bilder werden im Anschluss in Google Drive gespeichert. Das Colab Notebook ist hier zu finden.

Eine Ente im Minecraft-Stil

Man kann mit den Eingangsparametern viel rumspielen. Am Wichtigsten ist vermutlich der „Prompt“-Parameter. Dort definiert man den Text, welches zum Inhalt, Effekt und Stil der generierten Kunst beiträgt. Hier können viele verschiedene Aspekte eine Rolle spielen. Man kann beispielsweise als Prompt Künstlernamen angeben, die generierte Kunst wird dann auch im Stil dieses Künstlers erstellt. Man kann „oil-painting“ als Eingabewert angeben. Das resultierende Kunstwerk ist dann im Stil eines Ölgemäldes. Mögliche Schlüsselwörter und wie sie sich auf das Ergebnis auswirken können, sind auch hier zu finden.

Kirschblüten in einer dystopischen Umgebung

Eine Palette an weiteren Beispielen inklusive der Eingabewerte ist hier zu finden. Eine Schnellstartanleitung auf Englisch ist hier zu finden. In Discord teilt die Disco Diffusion Community weiteren Input, Kunstwerke und technischen Support. Hier ist ein Einladungslink zum Discord Server.

Fazit

Disco Diffusion ist ein großartiges Einsteigetool um KI-Kunst zu generieren. Sie hat eine großartige Community, viele Anleitungen, viele Beispiele um direkt mit dem Erzeugen von Kunstwerken durch zu starten.

Ausblick

Ich bin selber auch am Anfang dieser Reise. Ich werde eine kleine Videoanleitung in naher Zukunft bereit stellen. Disco Diffusion ist immernoch etwas technisch und könnte am Anfang etwas herausfordernd sein. Ich möchte diese Einstiegshürde mithilfe einer Videoanleitung beseitigen.

Auch kann man mit Disco Diffusion auch ganze Videos erstellen. Ich möchte auch hier Prototypen und Beispiele erstellen.