Ein frohes neues (KI-)Jahr!

Ein weiteres Jahr geht zu Ende. Ich schreibe diese Zeilen in den frühen Morgenstunden des ersten Tages des Jahres 2025. Das vergangene Jahr war in der Tech-Branche vor allem von einem großen Thema geprägt: Künstliche Intelligenz. Und natürlich geht dieses Thema auch an mir nicht vorbei.

Nackte Frau auf einem Satin-Bett am Pool liegend mit Feuerwerk im Hintergrund im Anime-Stil
Mit einfachen Befehlen, hier etwa „Anime“, lässt sich der Stil des Bildes schnell ändern.

Viele dieser Marketing-Auswüchse sind eher zu belächeln (So etwa die Kühlschränke mit KI Funktion die Samsung vorgestellt hat) und gerade die Sprachmodelle (Large Language Models, LLM) wie ChatGPT oder Googles Gemini sorgten oft auch für negative Schlagzeilen. Antworten auf Nutzereingaben wiesen gerne inhärent rassistische Grundzüge auf. Sie forderten den Nutzer dazu auf Steine zu essen oder erfanden Dinge frei weg (Oft auch als Halluzination bezeichnet). Oder einfach nur schlichtweg, weil die Betreiber offenkundig kein Interesse daran haben, sich an geltende Copyright-Gesetze zu halten.

Dennoch bleibt die Entwicklung natürlich nicht stehen und vor allem die generative Bild-Erstellung mit Machine-Learning Algorithmen wie Stable Diffusion, Midjourney oder ähnlichen macht große Schritte und ist auch im kreativen Bereich mittlerweile einfach nicht mehr wegzudenken. So erleichtern diese Modelle beispielsweise das Iterieren von Prototypen oder es lassen sich damit Grafiken erstellen, die als Basis für die Arbeit dienen können. Zum Teil ersetzt die KI also die klassische Stock-Photo-Bibliothek.

Nackte Frau auf einem Satin-Bett am Pool liegend mit Feuerwerk im Hintergrund.
Gerade das Erstellen menschlicher Anatomie ist noch immer ein großes Problem der KI-Modelle

Auch ich selbst habe schon diverse Projekte mit Hilfe dieser Werkzeuge im vergangenen Jahr abgeschlossen. Bisher kam dafür bei mir ein Online-Generator zum Einsatz. Doch bei diesen Diensten gerät man sehr schnell an die Grenzen, denn kostenlos lassen sich oft nur wenige Bilder erstellen, die Wartezeit für die Erstellung ist zum Teil sehr lange und vor allem gibt es deutliche Einschränkungen bei den Inhalten, die generiert werden dürfen. Diese Dienste, die über Texteingaben (sogenannten Prompts) gesteuert werden, besitzen ziemlich strikte Wortfilter, die weder das Erstellen von Bildern mit beispielsweise bekannten Persönlichkeiten erlauben noch etwa Nacktheit oder andere „Tabu“-Themen.

Daher ist es von Vorteil, wenn man diese Erstellung der Bilder auch lokal auf dem eigenen Rechner erledigen zu können. Hier gibt es keinerlei Einschränkungen und nur die Leistungsfähigkeit der eigenen Hardware bestimmt die Grenzen (und die Geschwindigkeit). Und da ich ohnehin mir zu Weihnachten einen neuen Rechner angeschafft habe, habe ich bei der Konfiguration auch darauf geachtet, dass ich damit auch jene Programme performant darauf laufen lassen kann.

Nun bot sich dieser Beitrag hier direkt als erstes Versuchskaninchen an. Ich habe einige Bilder anhand des folgenden Beispiel-Prompts erstellt:

nude young woman with long dark red hair and big breasts laying on a black satin bed on a pool terrace, night sky with fireworks in the distant background, anime style

Die Bilder wurden mit Amuse v2.3.2 und dem Stable-Diffusion-XL-Base-1.0-onnx Model auf einer AMD Radeon RX 7900XTX erstellt. Für den Anfang habe ich hierfür erst einmal nur den Ez Mode von Amuse verwendet, der keine großartigen Parameter-Einstellungen erlaubt. In weiteren Schritten werde ich mich dann mit dem erweiterten Modus und dessen zahlreichen Optionen auseinandersetzen.

Nackte Frau auf einem Satin-Bett in einem spärlich belichteten Zimmer mit Stadtszene und Feuerwerk im Hintergrund.
Vor allem Hände und Füße sind noch große Herausforderungen

Um brauchbare Ergebnisse zu erhalten, vor allem wenn der Prompt auch die Ausgabe von anatomisch korrekten Darstellungen von Menschen verlangt, sind oft viele Iterationen und auch Negativ-Prompts, also Ausschlüsse, nötig. Für die dem Artikel angehängten Bilder habe ich rund 50 bis 60 verschiedene Iterationen erstellt. Zudem ist Amuse auch noch etwas instabil und stürzt gerne mal ohne Vorwarnung komplett ab, was die erneute Eingabe des gesamten Prompts erfordert. Trotzdem bin ich mit den ersten Ergebnissen so weit zufrieden.

Obwohl die Nutzung der Künstlichen Intelligenz viele Möglichkeiten eröffnet, sind die Gefahren durchaus vorhanden. Falschinformationen lassen sich, nicht zuletzt auch durch Deep Fakes, viel leichter verbreiten, wovon beispielsweise bereits im US-Wahlkampf 2024 Gebrauch gemacht wurde. Aber auch harmlosere, aber trotzdem für den Einzelnen potenziell folgenreiche Probleme kommen dadurch auf uns zu. Gerade eben diese generativen Bildgeneratoren, die den Kreativen das Leben erleichtern sollen, könnten ihnen auch die Arbeit wegnehmen. Schließlich ist es nun auch viel leichter ohne große Vorkenntnisse oder Talent schnell und einfach digitale Kunst zu erstellen. Mit Modellen, die anhand von Werken eben jener Künstler und deren harter Arbeit angelernt wurden. Im Netz findet sich bereits eine große Schwemme solcher Bilder, die sowohl die Reichweite von Illustratoren und Grafikern mit echtem Talent einschränkt als auch das Auffinden durch den geneigten Betrachter. Die kommenden Jahre werden zeigen, wo die Reise hingeht.

Kommentar verfassen

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.